章节 01
THEMIS:专为印度法律打造的参数化法律推理引擎(导读)
THEMIS 是基于 Mistral 7B Instruct v0.3 模型通过 LoRA 微调而成的参数化法律推理引擎,专注于印度法律领域。它区别于检索增强生成(RAG)系统,将法律知识直接编码进模型权重,旨在实现像律师一样的推理能力而非简单检索。本文将详细介绍其背景、技术架构、v1版本成果与局限、未来路线图及领域启示。
正文
THEMIS 是一个专门针对印度成文法进行微调的大型语言模型,它不是检索系统或聊天机器人包装器,而是将法律知识直接编码进模型权重的参数化知识模型。
章节 01
THEMIS 是基于 Mistral 7B Instruct v0.3 模型通过 LoRA 微调而成的参数化法律推理引擎,专注于印度法律领域。它区别于检索增强生成(RAG)系统,将法律知识直接编码进模型权重,旨在实现像律师一样的推理能力而非简单检索。本文将详细介绍其背景、技术架构、v1版本成果与局限、未来路线图及领域启示。
章节 02
在法律AI领域,多数解决方案依赖检索增强生成(RAG),即搜索相关法律条文后注入提示词生成回答。THEMIS 采取不同路径:将印度法律知识直接编码进神经网络权重,构建参数化知识模型。
项目命名源自希腊正义女神忒弥斯(Themis),象征法律与秩序。开发者明确区分 THEMIS 与检索系统(如 HECTOR):HECTOR 负责检索,THEMIS 专注推理——模型从内化知识中推导答案,而非查找信息。
章节 03
THEMIS v1 选用 Mistral 7B Instruct v0.3,因其指令遵循能力强且参数量适中,可在有限资源(如 Kaggle T4 GPU)上微调。
采用 LoRA(Low-Rank Adaptation)技术,v1 配置 rank=8,仅适配 q_proj 和 v_proj 注意力模块,兼顾计算效率与部署灵活性。
v1 使用 1,939 对 Alpaca 风格法律问答数据,涵盖印度刑法典(IPC)、2023年《印度法律法典》(BNS)、《印度公民安全法典》(BNSS)等核心文本。
章节 04
Mistral 7B 预训练数据截止于 BNS 2023年生效前,基础模型无 BNS 先验知识;LoRA 仅教会模型“像律师说话”,未填补知识空白。
章节 05
| 参数 | v1 值 | v2 目标 | 改进意义 |
|---|---|---|---|
| LoRA rank | 8 | 16 | 更强表达能力 |
| 注意力模块 | q_proj,v_proj | q,k,v,o_proj | 捕捉更丰富特征 |
| 序列长度 | 512 tokens | 1024 tokens | 支持更长文本 |
| 训练数据 | 1939对 | 15000对 | 支撑知识学习 |
成功标准:正确识别 BNS,70%+刑法查询条款引用准确。
计划使用 74,000 对训练数据(涵盖 BNS、IPC、最高法院判决等),目标 LoRA rank=32、序列长度=2048 tokens,引用准确率超85%,幻觉率低于10%。
融合 THEMIS(推理)与 HECTOR(检索): 用户查询 → 查询分类器("参数化推理还是检索增强?")→ 调用 THEMIS 或 HECTOR → 统一回答(含引用与推理)。
章节 06
章节 07
THEMIS 是一个雄心勃勃且透明的项目,v1版本清晰展示能力边界与改进路径。它为法律AI、领域特定LLM及负责任AI开发提供了宝贵案例,不仅是代码与模型集合,更是通用模型适配专业领域的实践指南。期待v2、v3版本释放参数化法律推理的潜力。