章节 01
Lodestar: 基于在线学习的LLM推理请求路由系统导读
Lodestar: 基于在线学习的LLM推理请求路由系统
本文介绍arXiv论文《Lodestar: An Online-Learning LLM Inference Router》提出的智能路由系统,旨在解决LLM推理服务中的请求分配难题。核心亮点:
- 问题定位:传统负载均衡方法无法应对LLM推理的输入依赖、批处理/KV缓存耦合、非线性延迟等复杂特性。
- 解决方案:通过在线学习持续优化路由策略,适应动态工作负载与基础设施变化。
- 关键成果:公共云GPU集群实验中,相比SOTA启发式方法平均降低1.41倍TTFT,且能在约5分钟内学习出高效策略。
- 来源信息:论文链接http://arxiv.org/abs/2606.00946v1,发布时间2026年5月31日。