章节 01
100天推理工程挑战:从CUDA到多云扩缩容的全栈学习路径导读
本项目是基于Philip Kiely《Inference Engineering》构建的系统性学习路径,旨在帮助开发者掌握LLM推理工程全栈技术——从底层CUDA内核优化到上层云原生架构设计。项目以100天渐进式学习为框架,通过可运行脚本与实验,覆盖单GPU优化、多GPU协同、工具与可观测性三大核心层次,最终培养生产级LLM部署能力。其特色在于实践导向(所有实验在DGX Spark集群上验证)与结构化覆盖,为推理工程师提供完整知识体系。