章节 01
导读:LEAD——大语言模型长度高效自适应动态推理方法
本文介绍LEAD(Length-Efficient Adaptive and Dynamic reasoning)方法,旨在解决大型推理模型因冗长思维链导致的计算资源浪费、延迟增加和上下文窗口压力问题。LEAD通过势函数缩放的不稳定性动态校准正确性与效率权衡,在线自适应目标长度估计实现问题级个性化控制,并设计对称效率奖励避免过度思考或压缩。实验表明,LEAD在数学推理基准上取得最高准确率和效率得分,同时显著缩短输出长度,为推理模型的高效部署提供新范式。