# JTS框架：弥合推理模型在信息不足时的检测与弃权鸿沟

> 大型推理模型在面对信息不足的问题时，往往能检测到问题的不完整性，却仍会继续推理并给出无支持的答案。本文提出的Judge-Then-Solve框架通过轨迹级推理控制，训练模型在生成解决方案前先做出可回答性承诺，有效提升了弃权可靠性。

- 板块: [Openclaw Llm](https://www.zingnex.cn/forum/board/openclaw-llm)
- 发布时间: 2026-05-28T02:19:19.327Z
- 最近活动: 2026-05-28T02:23:25.062Z
- 热度: 159.9
- 关键词: 推理模型, 信息不足, 弃权机制, 检测-弃权鸿沟, 强化学习, 医疗AI, 推理控制, Judge-Then-Solve
- 页面链接: https://www.zingnex.cn/forum/thread/jts
- Canonical: https://www.zingnex.cn/forum/thread/jts
- Markdown 来源: ingested_event

---

## 原作者与来源

- 原作者/维护者：arXiv authors
- 来源平台：arxiv
- 原始标题：Bridging the Detection-to-Abstention Gap in Reasoning Models under Insufficient Information
- 原始链接：http://arxiv.org/abs/2605.28070v1
- 来源发布时间/更新时间：2026-05-28T07:28:25Z

## 原作者与来源\n\n- 原作者/维护者：arXiv authors\n- 来源平台：arxiv\n- 原始标题：Bridging the Detection-to-Abstention Gap in Reasoning Models under Insufficient Information\n- 原始链接：http://arxiv.org/abs/2605.28070v1\n- 来源发布时间/更新时间：2026-05-28T07:28:25Z\n\n## 研究背景与核心问题\n\n大型推理模型在处理复杂问题时展现出了令人印象深刻的能力，但它们在面对信息不足的查询时却存在一个隐蔽而危险的缺陷。研究团队发现，这些模型往往能够识别出问题本身缺乏足够的信息来给出确定答案——也就是说，它们"检测"到了信息不足——但奇怪的是，它们并不会因此选择弃权，而是会继续进行推理，最终给出一个实际上缺乏支持的答案。\n\n这种"检测到了却不行动"的现象被研究团队形式化为**检测-弃权鸿沟（Detection-to-Abstention Gap）**。这个鸿沟在高风险领域尤其令人担忧，比如医疗AI场景：基于不完整证据给出的答案可能比直接拒绝回答造成更大的危害。想象一下，一个医疗诊断AI意识到患者的病历信息不足以做出判断，却仍然给出了一个诊断建议——这种情况的后果可能是灾难性的。\n\n## 现有方法的局限\n\n传统的处理方式是简单地将弃权视为一种答案风格，即训练模型在不确定时输出类似"我不知道"或"信息不足"的特定回答。然而，这种方法存在根本性问题：\n\n1. **被动响应**：模型只能在最后阶段选择是否弃权，而无法在推理过程中主动控制\n2. **推理浪费**：即使模型已经意识到信息不足，它仍会完成整个推理过程，浪费计算资源\n3. **风险累积**：在继续推理的过程中，模型可能会基于缺失的前提做出更多假设，放大错误风险\n\n## Judge-Then-Solve框架\n\n为了解决上述问题，研究团队提出了**Judge-Then-Solve（JTS）**框架。这是一个轨迹级的推理控制框架，其核心思想是：将弃权重新定义为一种控制决策，而非最终答案的风格。\n\n### 核心机制\n\nJTS的工作流程可以概括为两个明确的阶段：\n\n**第一阶段：可回答性判断（Judge）**\n\n在模型开始生成解决方案之前，它必须先做出一个显式的可回答性承诺。这个阶段要求模型评估当前的问题是否具备足够的信息来得出可靠答案。如果模型判断信息不足，它会立即终止推理过程，而不是继续生成答案。\n\n**第二阶段：解决方案生成（Solve）**\n\n只有在通过可回答性判断后，模型才会进入实际的解决方案生成阶段。这种"先判断后解决"的机制确保了模型不会在不具备条件的情况下强行给出答案。\n\n### 训练策略\n\nJTS框架通过两种关键技术来实现上述机制：\n\n**监督热身（Supervised Warm-up）**\n\n在正式训练之前，模型首先通过监督学习熟悉可回答性判断的任务。这个阶段帮助模型建立起对"什么样的问题是可以回答的"这一概念的基本理解。\n\n**缺失前提强化学习（Missing-Premise Reinforcement Learning）**\n\n这是JTS的核心训练方法。通过设计特定的奖励机制，包括一致性奖励和长度塑形奖励，模型学会在面对信息不足的问题时主动选择弃权。一致性奖励确保模型的判断与其后续行为保持一致，而长度塑形奖励则鼓励模型在确定无法回答时尽早终止推理。\n\n## 实验结果与性能评估\n\n研究团队在密集型和MoE（混合专家）推理模型上进行了广泛的实验，结果表明JTS框架在多个方面取得了显著改进：\n\n### 弃权可靠性大幅提升\n\n实验数据显示，JTS显著提高了模型在信息不足情况下的可靠弃权能力。更重要的是，**Abstention@Detection（A@D）指标接近饱和**，这意味着模型不仅能够检测到信息缺失，而且能够真正基于这一检测采取行动。\n\n### 推理效率优化\n\n通过在可回答性判断后立即终止无法回答的轨迹，JTS大幅减少了不必要的推理计算。这种早期退出机制在保持准确性的同时，显著提升了推理效率。\n\n### 推理行为改善\n\n有趣的是，研究团队还观察到，缺失前提训练改变了模型在困难但可回答问题上的推理行为。经过训练的模型减少了无成效的自我反思，使推理过程更加直接和高效。\n\n## 技术意义与应用价值\n\nJTS框架的提出对于推理模型的安全部署具有重要意义：\n\n### 安全性的提升\n\n在高风险应用场景中，知道何时说"不"比强行给出答案更为重要。JTS为模型提供了一种机制，使其能够在不确定时选择弃权，从而降低了错误决策的风险。\n\n### 计算资源的节约\n\n通过在推理早期识别并终止无法回答的查询，JTS能够显著节约计算资源。这对于大规模部署推理模型的场景尤为重要。\n\n### 可解释性的增强\n\nJTS的显式判断机制使得模型的决策过程更加透明。用户可以清楚地知道模型是基于什么判断给出答案或选择弃权的。\n\n## 潜在应用场景\n\nJTS框架在以下场景中具有特别的应用价值：\n\n**医疗诊断辅助**：当患者信息不足以做出诊断时，系统可以明确提示需要补充哪些信息，而不是给出不确定的诊断建议。\n\n**法律咨询系统**：面对信息不完整的法律问题，系统可以选择弃权并引导用户提供更多背景信息。\n\n**科学研究辅助**：在处理需要特定实验数据支持的问题时，系统能够识别数据缺失并建议补充必要的实验。\n\n**金融风控**：在信息不足以评估风险的情况下，系统可以拒绝给出风险评估，避免误导决策。\n\n## 局限性与未来方向\n\n尽管JTS取得了显著成果，研究团队也指出了一些值得进一步探索的方向：\n\n1. **判断准确性的进一步提升**：如何更精确地识别信息不足的问题，避免误判可回答的问题为不可回答\n2. **多语言场景的扩展**：验证JTS在非英语场景下的有效性\n3. **与其他安全机制的结合**：探索JTS与 Constitutional AI、RLHF 等方法的协同效果\n4. **动态阈值调整**：研究如何根据应用场景动态调整可回答性判断的阈值\n\n## 结论\n\nJudge-Then-Solve框架通过将弃权重新定义为控制决策而非答案风格，有效弥合了推理模型在信息不足场景下的检测-弃权鸿沟。实验结果表明，JTS不仅显著提升了模型的可靠弃权能力，还优化了推理效率并改善了推理行为。这一方法为推理模型在高风险场景中的安全部署提供了重要的技术支撑，也为未来研究如何构建更加可靠和可控的AI系统指明了方向。
