章节 01
AutoTTS:AI自动发现最优测试时扩展策略导读
AutoTTS通过构建可控的搜索环境,让智能体自动发现测试时计算分配策略,以仅39.9美元和160分钟的成本发现了超越人工设计的推理策略,并实现跨基准和模型规模的泛化。该框架标志着LLM推理优化从经验驱动向数据驱动的转变,为推理成本优化提供新思路。
正文
AutoTTS通过构建可控的搜索环境,让智能体自动发现测试时计算分配策略,以仅39.9美元和160分钟的成本发现了超越人工设计的推理策略,并实现跨基准和模型规模的泛化。
章节 01
AutoTTS通过构建可控的搜索环境,让智能体自动发现测试时计算分配策略,以仅39.9美元和160分钟的成本发现了超越人工设计的推理策略,并实现跨基准和模型规模的泛化。该框架标志着LLM推理优化从经验驱动向数据驱动的转变,为推理成本优化提供新思路。
章节 02
测试时扩展(Test-Time Scaling, TTS)是提升大型语言模型推理能力的重要技术,通过推理阶段分配额外计算资源换取更高准确率。但当前主流TTS策略依赖人工设计,存在局限:人类对最优策略理解不完整、不同任务/模型手动调优成本高、策略缺乏系统性难以保证最优性。
章节 03
AutoTTS框架核心是转变研究者角色,从设计策略转向设计策略发现环境(需压缩控制空间、提供廉价反馈)。具体将宽度-深度TTS问题形式化为控制器合成问题,控制器决定分支探索、路径继续等操作,评估无需重复调用LLM以降低成本。此外,引入beta参数化技术(映射高维离散空间到低维连续空间)和细粒度执行轨迹反馈(提供完整轨迹诊断信息加速迭代)。
章节 04
实验验证显示,AutoTTS发现的策略在数学推理基准上全面超越人工设计基线,相同预算下准确率更高或相同准确率下成本更低。策略具有跨任务(未见过的基准)和跨模型规模的泛化能力。整个发现过程仅花费39.9美元、耗时160分钟,成本效益显著。
章节 05
AutoTTS标志着LLM推理优化从经验驱动向数据驱动转变,建立了可扩展、可复现的策略发现流程,适用于多模态推理等更广泛场景。产业角度,为LLM推理服务成本优化提供新思路,影响AI应用边际成本和可扩展性,同时可解释策略为理解LLM推理机制提供素材。
章节 06
AutoTTS存在局限:主要针对数学推理,开放域任务有效性待验证;环境设计仍需人工投入;资源受限场景成本可能仍高。未来方向包括探索更高效搜索算法降低成本、扩展到多智能体协作、研究策略可组合性等,为LLM自我改进能力开辟新可能。