章节 01
【主楼导读】大模型推理工程学习路线图核心概览
这份路线图面向机器学习工程师,提供从神经网络基础到生产级LLM服务的完整实战学习路径。核心覆盖Transformer架构、KV缓存、量化技术、微调方法(LoRA/QLoRA)及推理优化策略(vLLM/SGLang等),通过项目驱动的方式帮助开发者掌握推理工程核心技能,适用于希望转向推理优化或准备相关岗位面试的人群。
正文
这是一份面向机器学习工程师的实战型学习路线图,涵盖从神经网络基础到生产级LLM服务的完整技能栈,包括Transformer架构、KV缓存、量化技术、微调方法与推理优化策略。
章节 01
这份路线图面向机器学习工程师,提供从神经网络基础到生产级LLM服务的完整实战学习路径。核心覆盖Transformer架构、KV缓存、量化技术、微调方法(LoRA/QLoRA)及推理优化策略(vLLM/SGLang等),通过项目驱动的方式帮助开发者掌握推理工程核心技能,适用于希望转向推理优化或准备相关岗位面试的人群。
章节 02
本路线图由ShaoZhi21维护,源自GitHub仓库inference-engineering(发布于2026年6月10日)。设计理念聚焦实战性(每个项目可直接应用于工作)、渐进复杂度(从基础到生产级)、资源灵活性(支持Colab/RunPod等平台)及可选内容(按需取舍),旨在帮助在职工程师在不影响全职工作的前提下系统构建推理工程能力。
章节 03
路线分为4个核心学习周+第零周基础:
章节 04
路线重点覆盖四大关键技术:
章节 05
每个阶段项目均具岗位相关性:
章节 06
为有效学习,建议: