章节 01
导读:单样本无监督校准让推理大模型拥有"自知之明"
导读:单样本无监督校准让推理大模型拥有"自知之明"
本文提出一种无需标注数据和重复采样的推理LLM置信度校准方法,通过离线自一致性蒸馏训练轻量级置信度预测器,显著提升模型可靠性。该方法解决现有校准技术依赖标注数据或增加推理开销的局限,为高风险场景部署提供支持。
正文
本文提出了一种无需标注数据和重复采样的推理LLM置信度校准方法,通过离线自一致性蒸馏训练轻量级置信度预测器,显著提升模型可靠性。
章节 01
本文提出一种无需标注数据和重复采样的推理LLM置信度校准方法,通过离线自一致性蒸馏训练轻量级置信度预测器,显著提升模型可靠性。该方法解决现有校准技术依赖标注数据或增加推理开销的局限,为高风险场景部署提供支持。
章节 02
大语言模型推理能力提升,但存在校准偏差:过度自信错误答案或对正确答案犹豫不决,制约高风险场景应用。 置信度校准是衡量模型"自知之明"的核心指标,但现有方法存在局限:
章节 03
方法分两阶段: 离线训练阶段:用大量未标注问题对基础模型多次采样,生成多条推理路径和答案,统计一致性程度构建自一致性代理目标(相同答案多则可靠);训练轻量级预测器,以单条推理路径为输入,学习预测答案可靠性(无需人工标注)。 部署阶段:模型生成单条回答时,预测器实时输出可靠性估计,仅需一次前向传播,低延迟。
章节 04
关键技术:
章节 05
在5个任务(GSM8K、MATH、StrategyQA、HotpotQA、Natural Questions)和9个模型(7B-70B参数,Llama/Qwen/DeepSeek等)验证:
章节 06
章节 07
适用于:
章节 08
局限:
未来方向: