章节 01
项目导读:SystemVerilog实现神经网络推理的定点化实践
SystemVerilog实现神经网络推理:定点数量化与硬件部署实践
本项目由Kiana Jafari开发,源码托管于GitHub(链接),发布于2026年6月8日。核心内容是将Python训练的神经网络转换为SystemVerilog硬件实现,采用Q3.12定点数量化格式,在乳腺癌分类任务上达到92.98%的测试准确率,为AI芯片设计提供可复现的参考实现。
正文
该项目展示了如何将Python训练的神经网络转换为SystemVerilog硬件实现,采用Q3.12定点数量化格式,在乳腺癌分类任务上达到92.98%的测试准确率,为AI芯片设计提供了可复现的参考实现。
章节 01
本项目由Kiana Jafari开发,源码托管于GitHub(链接),发布于2026年6月8日。核心内容是将Python训练的神经网络转换为SystemVerilog硬件实现,采用Q3.12定点数量化格式,在乳腺癌分类任务上达到92.98%的测试准确率,为AI芯片设计提供可复现的参考实现。
章节 02
深度学习普及推动专用硬件(FPGA/ASIC)部署需求,因其低功耗、高吞吐量适合边缘计算场景。但浮点运算(FP32)硬件实现资源消耗大,量化技术成为关键——将浮点权重/激活值转为定点数,平衡精度与复杂度。本项目展示了从Python训练到SystemVerilog实现的端到端流程。
章节 03
项目采用三层架构:
章节 04
项目采用Q3.12定点数:16位总宽度,3位整数部分(含符号位,范围-4至3.9997),12位小数部分(精度约0.00024)。采用训练后量化策略:先浮点训练模型,再转换权重为定点数,平衡精度与资源开销。
章节 05
章节 06