正文

从零手搓大模型：23个Notebook构建现代LLM全栈认知

一份不调用现成库、从零手写实现大模型核心组件的实战教程，涵盖Tokenizer、Attention、MoE、RLHF到推理加速的完整技术栈，适合希望深入理解而非仅会调用的学习者。

大语言模型PyTorchJupyter NotebookTransformerBPE TokenizerAttention机制MoERLHF推理加速知识蒸馏

发布时间 2026/05/21 14:15最近活动 2026/05/21 14:19预计阅读 2 分钟

章节 01

导读：23个Notebook从零构建现代LLM全栈认知

一份不调用现成库、从零手写实现大模型核心组件的实战教程，涵盖Tokenizer、Attention、MoE、RLHF到推理加速的完整技术栈，适合希望深入理解而非仅会调用的学习者。项目通过23个Jupyter Notebook，帮助学习者建立对现代LLM的全栈认知。

章节 02

当前大语言模型学习资源存在两类不足：一类是高屋建瓴的论文综述，懂原理但写不出代码；另一类是调用API的教程，快速跑通但黑盒感严重。walkinglabs/modern-llm-notebook项目填补空白，要求用PyTorch从零手写核心组件，强迫学习者与张量操作、梯度流动打交道，建立深度理解。

章节 03

项目分为五个递进模块：

章节 04

项目核心算法与原始论文紧密关联：

论文	Notebook	实现内容
Attention Is All You Need	04	Multi-Head Attention、Sinusoidal PE
LLaMA	06	RMSNorm、SwiGLU、RoPE
LoRA	12	低秩适应、A*B分解
RLHF/PPO	14	Reward Model、PPO clip
这种设计让学习者读完论文即可看到可运行代码，加深理解。