章节 01
导读 / 主楼:Failed Star:从零构建的 Apple Silicon 本地 LLM 推理引擎教学项目
Failed Star(fs)是一个专为 Apple Silicon 设计的自包含 LLM 推理引擎,采用 Rust 和 Metal Shading Language 从零实现,目标是成为学习推理工程原理的开放教材。
正文
Failed Star(fs)是一个专为 Apple Silicon 设计的自包含 LLM 推理引擎,采用 Rust 和 Metal Shading Language 从零实现,目标是成为学习推理工程原理的开放教材。
章节 01
Failed Star(fs)是一个专为 Apple Silicon 设计的自包含 LLM 推理引擎,采用 Rust 和 Metal Shading Language 从零实现,目标是成为学习推理工程原理的开放教材。
章节 02
章节 03
Failed Star(代号 fs)是一个专为 Apple Silicon 打造的自包含 LLM 推理引擎,由 Curtis Alexander 发起并开源。这个项目的独特之处在于它并非追求性能最大化,而是将「可读性」和「教学性」置于首位——每一行代码都旨在被阅读、理解和学习。
项目名称源自天文学概念:褐矮星(brown dwarf)是质量不足以维持核聚变的「失败恒星」,比主序星更小、更暗淡。Failed Star 正是著名项目 Dwarf Star(ds4,由 antirez 开发的 DeepSeek-V4 推理引擎)的「小兄弟」。如果说 ds4 面向 96GB+ Mac 运行大型 MoE 模型,那么 Failed Star 则专注于在 64GB MacBook Pro (M5) 上运行微型模型,用功能换取可理解性。
章节 04
大语言模型的推理工程是一个复杂的领域。阅读关于注意力机制的理论是一回事,但亲手编写计算注意力的内核代码、看着 token 从自己的代码中流出则是完全不同的体验。Failed Star 正是为了后者而存在。
项目的核心目标是「通过构建来理解推理」。它提供了三个关键学习资源作为「脊柱」:
ds4 作为参考实现,展示「专业人士如何做」章节 05
Failed Star 的技术栈选择体现了其教学定位:
章节 06
ds4 的 metal/ 着色器风格一致章节 07
项目从微型密集模型起步(Llama-3.2-1B / Qwen3-0.6B 级别),采用标准的 vanilla 注意力机制(RoPE + GQA + SwiGLU + RMSNorm),便于检查和调试。这种选择让学习者能够真正理解每个组件的工作原理,而不是被复杂的工程细节淹没。
章节 08
通过「黄金向量」(golden vectors)验证正确性——与模型官方实现的 logits 输出进行比对。Python 仅作为一次性验证工具出现,绝不作为第二套推理引擎。