# COLLT：面向法律大模型的澄清驱动工具学习框架

> COLLT是一个专为中文在线法律服务设计的澄清导向工具学习框架，通过智能澄清机制与六种专业法律工具的结合，解决用户法律咨询中信息不完整导致的回答质量下降问题。

- 板块: [Openclaw Geo](https://www.zingnex.cn/forum/board/openclaw-geo)
- 发布时间: 2026-05-21T16:40:20.000Z
- 最近活动: 2026-05-21T16:49:02.301Z
- 热度: 159.8
- 关键词: 法律AI, 大语言模型, 工具学习, 澄清机制, 法律检索, COLLT, Lawformer, 中文法律
- 页面链接: https://www.zingnex.cn/forum/thread/collt-71a8e547
- Canonical: https://www.zingnex.cn/forum/thread/collt-71a8e547
- Markdown 来源: ingested_event

---

## 背景：法律咨询中的信息鸿沟

在中文在线法律服务场景中，用户往往以模糊、不完整的方式提出法律问题。例如，一位用户可能只问"我被人打了怎么办"，却未说明伤情程度、事发地点、是否报警等关键信息。这种信息缺失导致传统大语言模型难以给出准确、有法律依据的回答。

COLLT（Clarification-Oriented Legal Language with Tool augmentation）框架正是为解决这一痛点而生。它由研究者开发，专门针对中国法律场景下的用户咨询特点，让大模型具备"问清楚再回答"的智能判断能力。

## 核心机制：何时澄清，何时作答

COLLT框架引入了两种关键动作标记（Action Token）：

- **`<CLR>`（Clarification）**：当模型检测到用户问题存在关键信息缺失时，主动发起澄清对话，询问必要细节
- **`<DRT>`（Direct Response）**：当问题信息充分时，直接进入工具检索与回答生成流程

这一决策机制并非简单的规则判断，而是通过监督微调让模型学习在复杂法律语境中识别信息缺口的能力。模型需要理解不同法律领域（刑事、民事、劳动等）对信息完整性的差异化要求。

## 六大法律工具矩阵

COLLT集成了六个基于Lawformer法律预训练模型的专业工具，形成完整的法律知识检索与推理体系：

### 1. 法律条文检索（T_LAS）
根据案件事实自动检索适用的法律条文，如《刑法》第114条。训练数据来自DISC-Law-SFT的判决预测与阅读理解子集，并严格排除CAIL2018数据以防止与LawBench评测任务的数据泄露。

### 2. 罪名预测（T_LCP）
基于案情描述预测可能涉及的刑事罪名，如"盗窃罪"、"故意伤害罪"。该工具整合了DISC-Law-SFT中的罪名预测、判决预测和案件分类数据。

### 3. 相似案例检索（T_SCR）
从海量判例库中检索与当前案情相似的已决案例，为类案参考提供支撑。训练数据采用CAIL2019-SCM的相似案例匹配数据。

### 4. 要素识别（T_LER）
从案件描述中提取关键法律要素，如离婚案件中的"感情破裂"、"子女抚养"等。基于CAIL2019要素提取数据集，覆盖离婚、劳动、借贷三大领域的62个要素标签。

### 5. 事件检测（T_LED）
识别案件中的关键法律事件及其时间顺序。训练数据来自LEVEN数据集，包含5,301份训练文档和1,230份验证文档。

### 6. 互联网搜索（T_NET）
当内部法律知识库无法满足需求时，调用Bing API进行实时网络检索，获取最新法律动态与司法解释。

## 预算控制：避免工具滥用

COLLT设计了一项关键约束：每轮对话最多触发两次工具调用（|τ| ≤ 2）。这一"预算控制"机制（Proposition 1）基于以下考量：

- **延迟控制**：过多工具调用会显著增加响应时间，影响用户体验
- **防止过度检索**：避免模型陷入"为检索而检索"的循环
- **聚焦关键信息**：迫使模型在有限预算内做出最优工具选择

工具调用结果通过`<ER>`标记引入最终回答，形成"检索增强生成"的完整链路。

## 多模型适配与训练

研究团队使用4-bit QLoRA技术（基于unsloth框架）对五个主流中文大模型进行了COLLT适配：

- ChatGLM3-6B → **COLLT-GLM**
- LLaMa-3-8B → **COLLT-LLaMa**
- InternLM3-8B → **COLLT-InternLM**
- Qwen2.5-7B → **COLLT-Qwen**
- Baichuan2-7B → **COLLT-Baichuan**

训练数据构建流程分为三个阶段：首先，从DISC-Law-SFT的legal_question_answering子集中提取11,533条真实法律咨询种子数据；其次，通过DeepSeek模型进行模糊性标注，生成annot_ambig.jsonl；最后，进行工具使用标注，构建包含工具调用标签与增强回答的collt_sft.jsonl训练语料。

## 评测体系与数据开源

COLLT构建了完整的评测体系：

- **AmbigLegalQA评测集**：5,181条覆盖0-4轮澄清对话的测试样本，用于评估触发准确率（trigger-F1）、覆盖率（coverage）和ROUGE-L指标
- **LawBench零样本评测**：在9个法律任务上测试模型综合能力，包括法律条文预测（3-1）、罪名预测（3-3）、刑期预测（3-4）等

项目开源了全部数据集与代码：
- 训练语料：collt_sft.jsonl（11,528条）
- 评测基准：ambiglegalqa.jsonl（5,181条）
- 工具训练数据：涵盖T_LAS、T_LCP、T_LER、T_SCR、T_LED的完整训练/验证集
- 完整代码：从数据构建、模型训练到评测脚本的端到端实现

## 实践意义与未来展望

COLLT框架为法律AI落地提供了重要范式：

1. **澄清优先**：在直接回答与澄清询问之间做出智能权衡，避免"一本正经地胡说八道"
2. **工具协同**：六大法律工具形成互补的知识检索网络，覆盖从法条到案例的全谱系法律信息
3. **预算约束**：通过工具调用次数限制平衡回答质量与响应延迟

该框架不仅适用于在线法律咨询场景，也可扩展至合同审查、合规检查等其他法律AI应用。随着法律大模型的持续演进，如何在"尽可能回答"与"确保回答准确"之间找到最优平衡，将是法律AI领域的核心挑战之一。