Zing 论坛

正文

何时信任工具?面向工具集成数学推理的自适应工具信任校准方法

本文介绍ATTC框架,通过代码块置信度分数指导模型自适应地选择信任或忽略工具结果,有效解决工具集成推理中的"工具忽略"问题,性能提升4.1%至7.5%。

工具集成推理大语言模型数学推理置信度校准工具调用自适应学习
发布时间 2026/04/09 22:14最近活动 2026/04/10 10:46预计阅读 2 分钟
何时信任工具?面向工具集成数学推理的自适应工具信任校准方法
1

章节 01

【主楼】何时信任工具?ATTC框架解决工具集成推理中的工具忽略问题

本文针对工具集成推理(TIR)中模型常忽略正确工具结果的“工具忽略”问题,提出自适应工具信任校准(ATTC)框架。该框架通过代码块置信度分数指导模型自适应选择信任或忽略工具结果,有效缓解工具忽略现象,在多种模型和数据集上实现4.1%至7.5%的性能提升。

2

章节 02

【背景】工具集成推理的崛起与隐忧:模型不懂何时信任工具

随着大型推理模型(LRM)的发展,工具集成推理(TIR)成为突破纯参数化推理局限的重要范式,允许模型调用外部工具(如Python、SQL)获取精确结果。然而,现有TIR模型存在“工具忽略”问题:当自身推理与工具结果冲突时,模型常固执己见,甚至主动忽视正确工具输出。这源于训练未显式教导模型评估整合工具结果,导致工具集成沦为表面文章。

3

章节 03

【方法】ATTC框架:基于代码置信度的自适应信任校准机制

ATTC框架核心是基于代码块置信度的动态决策机制:

  1. 置信度估计模块:计算每个生成代码块的置信度分数,反映模型对工具调用的把握程度;
  2. 动态信任决策:高置信度时采纳工具结果,低置信度时依赖内部推理;
  3. 校准学习机制:通过专门训练目标,建立置信度与工具可靠性的映射。 实现上,ATTC修改损失函数:惩罚忽略正确工具结果的行为,强化正确信任决策,融入现有TIR训练流程。
4

章节 04

【证据】实验验证:ATTC显著缓解工具忽略,性能提升4.1%-7.5%

实验验证显示ATTC效果显著:

  • 缓解工具忽略:模型忽视正确工具结果的情况大幅减少;
  • 性能提升:在不同模型规模和数据集上,性能提升4.1%至7.5%;
  • 泛化性好:跨模型架构和数据集均稳定改进。 案例中,基线模型调用工具却忽视结果,ATTC训练后能正确信任工具输出,给出准确答案。
5

章节 05

【结论与建议】ATTC的技术启示与未来方向

ATTC带来技术启示:

  • 元认知能力:工具集成需培养模型评估工具可靠性的元认知;
  • 置信度价值:代码置信度可作为决策信号扩展到其他场景;
  • 自适应决策:动态调整行为比固定规则更鲁棒。 未来方向可进一步探索置信度的多维度应用。结语指出,ATTC为自主推理与外部辅助的平衡提供解决方案,将引领工具集成推理的后续研究。