正文

AutoTTS：让AI自动发现最优测试时扩展策略

AutoTTS通过构建可控的搜索环境，让智能体自动发现测试时计算分配策略，以仅39.9美元和160分钟的成本发现了超越人工设计的推理策略，并实现跨基准和模型规模的泛化。

测试时扩展TTSAutoTTS推理策略智能体发现LLM优化

发布时间 2026/05/09 01:59最近活动 2026/05/11 10:52预计阅读 2 分钟

章节 01

AutoTTS：AI自动发现最优测试时扩展策略导读

AutoTTS通过构建可控的搜索环境，让智能体自动发现测试时计算分配策略，以仅39.9美元和160分钟的成本发现了超越人工设计的推理策略，并实现跨基准和模型规模的泛化。该框架标志着LLM推理优化从经验驱动向数据驱动的转变，为推理成本优化提供新思路。

章节 02

背景：测试时扩展的手工设计困境

测试时扩展（Test-Time Scaling, TTS）是提升大型语言模型推理能力的重要技术，通过推理阶段分配额外计算资源换取更高准确率。但当前主流TTS策略依赖人工设计，存在局限：人类对最优策略理解不完整、不同任务/模型手动调优成本高、策略缺乏系统性难以保证最优性。

章节 03

方法：AutoTTS的自动策略发现机制

AutoTTS框架核心是转变研究者角色，从设计策略转向设计策略发现环境（需压缩控制空间、提供廉价反馈）。具体将宽度-深度TTS问题形式化为控制器合成问题，控制器决定分支探索、路径继续等操作，评估无需重复调用LLM以降低成本。此外，引入beta参数化技术（映射高维离散空间到低维连续空间）和细粒度执行轨迹反馈（提供完整轨迹诊断信息加速迭代）。

章节 04

证据：AutoTTS的实验效果与成本效益

实验验证显示，AutoTTS发现的策略在数学推理基准上全面超越人工设计基线，相同预算下准确率更高或相同准确率下成本更低。策略具有跨任务（未见过的基准）和跨模型规模的泛化能力。整个发现过程仅花费39.9美元、耗时160分钟，成本效益显著。

章节 05

结论：AutoTTS对LLM推理优化的意义

AutoTTS标志着LLM推理优化从经验驱动向数据驱动转变，建立了可扩展、可复现的策略发现流程，适用于多模态推理等更广泛场景。产业角度，为LLM推理服务成本优化提供新思路，影响AI应用边际成本和可扩展性，同时可解释策略为理解LLM推理机制提供素材。

章节 06

展望：AutoTTS的局限与未来研究方向

AutoTTS存在局限：主要针对数学推理，开放域任务有效性待验证；环境设计仍需人工投入；资源受限场景成本可能仍高。未来方向包括探索更高效搜索算法降低成本、扩展到多智能体协作、研究策略可组合性等，为LLM自我改进能力开辟新可能。

AutoTTS：让AI自动发现最优测试时扩展策略

AutoTTS：AI自动发现最优测试时扩展策略导读

背景：测试时扩展的手工设计困境

方法：AutoTTS的自动策略发现机制

证据：AutoTTS的实验效果与成本效益

结论：AutoTTS对LLM推理优化的意义

展望：AutoTTS的局限与未来研究方向

继续阅读

Nornir MCP Server：将大语言模型引入网络自动化的企业级桥梁

Bibliothèque Française LLM：为大型语言模型优化的法语公版文献索引系统

Splinter：一款无锁零拷贝的共享内存 KV 与向量存储库，让 LLM 推理告别 socket 与 memcpy 开销

Folkering OS：当操作系统本身就是 AI——一个能自我进化的裸机 Rust 系统