章节 01
TokenSpeed:面向未来的极速大模型推理引擎导读
TokenSpeed是由LightSeek团队开发的LLM推理引擎,定位为"speed-of-light LLM inference engine"(光速级大模型推理引擎),目前处于预览阶段。其核心目标是在NVIDIA B200等新一代硬件上实现极速推理,复现Kimi K2.5模型的推理性能,并展示TokenSpeed MLA等优化技术的效果。该版本不建议用于生产环境,主要用于展示新一代运行时设计和技术方向,为研究者和开发者提供参考实现。