正文

NovaNN：从零构建的深度学习教育框架，理解而非调用

本文介绍NovaNN，一个纯Python从零实现的深度学习框架，旨在帮助学习者理解现代框架（如PyTorch）的内部机制，而非仅仅调用API。

深度学习神经网络Python教育框架自动微分AutogradPyTorch机器学习教学工具开源

发布时间 2026/05/24 07:09最近活动 2026/05/24 07:20预计阅读 3 分钟

章节 01

导读 / 主楼：NovaNN：从零构建的深度学习教育框架，理解而非调用

本文介绍NovaNN，一个纯Python从零实现的深度学习框架，旨在帮助学习者理解现代框架（如PyTorch）的内部机制，而非仅仅调用API。

章节 02

原作者与来源

原作者/维护者： JOSE-MDG
来源平台： GitHub
原始项目名称： NovaNN
原始链接： https://github.com/JOSE-MDG/NovaNN
发布时间： 2026年5月23日
许可证： MIT
Python版本： 3.14
当前版本： 4.0.4

章节 03

项目理念：构建而非调用

NovaNN诞生于一个清晰的核心理念："不要使用现有框架的魔法，而是亲手构建它。"

在深度学习领域，PyTorch和TensorFlow等工业级框架提供了强大的抽象，让开发者能够快速搭建和训练模型。然而，这种便利性也带来了副作用——许多人能够熟练调用API，却对框架内部的机制一知半解。NovaNN正是为了填补这一认知鸿沟而设计的。

该框架完全使用Python从零实现，以NumPy作为数值计算后端，不依赖任何外部深度学习引擎。通过亲手实现自动微分、计算图、神经网络层、优化器等核心组件，学习者能够真正理解现代深度学习框架的工作原理。

章节 04

1. 动态自动微分引擎（Autograd）

NovaNN的核心是其自动微分系统，支持动态计算图的构建和反向传播：

梯度追踪： 通过requires_grad标记需要计算梯度的张量
计算图构建： 每次前向传播动态构建计算图
自动反向传播： 调用.backward()自动计算所有梯度
梯度累积： 支持多步反向传播的梯度累加

这种设计与PyTorch的Autograd系统类似，让学习者能够理解梯度如何在计算图中流动。

章节 05

2. 模块化神经网络层

NovaNN提供了一系列标准的神经网络层，接口设计借鉴PyTorch的nn.Module：

Linear： 全连接层，实现矩阵乘法和偏置相加
Conv2d： 二维卷积层，支持自定义卷积核、步长、填充
Activation： ReLU、Sigmoid、Tanh等激活函数
Normalization： 批归一化等归一化层
Dropout： 随机失活正则化

每个层都实现了forward和backward方法，清晰展示前向计算和梯度反向传播的过程。

章节 06

3. 优化器与学习率调度

框架内置了多种优化算法：

SGD： 随机梯度下降，支持动量
Adam： 自适应矩估计，结合了Momentum和RMSProp的优点
学习率调度： 支持步进衰减、余弦退火等策略

章节 07

4. 损失函数与评估指标

提供了深度学习中常用的损失函数和评估指标：

损失函数： MSE、交叉熵、二元交叉熵等
评估指标： 准确率、精确率、召回率、F1分数、ROC-AUC等

章节 08

示例1：自动微分与梯度计算

import nova
import nova.nn as nn

# 创建需要梯度追踪的张量
x = nova.tensor([[0.5, -0.2]], requires_grad=True)
w = nova.tensor([[1.0], [0.5]], requires_grad=True)
b = nova.tensor([0.1], requires_grad=True)

# 手动前向传播
y = x @ w + b
loss = (y ** 2).sum()

# 自动反向传播
loss.backward()

print(f"Loss: {loss.item()}")  # Loss: 0.25
print(f"x的梯度: {x.grad}")    # 自动计算的梯度
print(f"w的梯度: {w.grad}")
print(f"b的梯度: {b.grad}")