章节 01
VIA-SD:分层验证推测解码新范式导读
VIA-SD核心信息
- 来源:arXiv(2026年6月10日发布),原文链接:http://arxiv.org/abs/2606.12243v1
- 作者团队:论文作者团队,项目主页:https://zju-xyc.github.io/VIA-SD-Project-Page/
- 核心创新:提出三层级推测解码框架,通过模型内路由将验证任务分配给轻量级子模型处理中等置信度token
- 性能效果:保持输出质量的同时推理速度提升10-20%,相比非推测解码实现2.5-3倍加速
该技术打破传统推测解码的二元决策局限,为大模型推理加速提供新范式。