Zing 论坛

正文

Kolmogorov-Arnold Networks:基于TensorFlow的可解释神经网络新架构

KAN是一种新兴的神经网络架构,用可学习的边激活函数替代传统MLP的固定节点激活,本项目提供了基于TensorFlow的清晰实现,专注于可解释性和教育价值。

Kolmogorov-Arnold NetworksKAN神经网络架构TensorFlowB样条可解释AI机器学习函数逼近
发布时间 2026/05/27 22:44最近活动 2026/05/27 22:49预计阅读 2 分钟
Kolmogorov-Arnold Networks:基于TensorFlow的可解释神经网络新架构
1

章节 01

导读:Kolmogorov-Arnold Networks(KAN)及其TensorFlow实现

本文介绍了新兴神经网络架构KAN,它用可学习的边激活函数替代传统MLP的固定节点激活函数。本项目提供基于TensorFlow的清晰实现,专注于可解释性与教育价值,帮助理解这一架构的内在机制。

2

章节 02

背景:从MLP到KAN的范式转变

多层感知机(MLP)是深度学习的基础构件,但固定的节点激活函数限制了表达能力且难以解释。2024年提出的KAN灵感源于Kolmogorov-Arnold表示定理,该定理指出任何多元连续函数可表示为单变量连续函数的有限组合。

3

章节 03

KAN的核心创新点

边激活vs节点激活

传统MLP节点执行加权求和后应用固定非线性激活,边仅传递线性信号;KAN节点仅执行简单求和,边上包含可学习的激活函数(常用B样条参数化),每个边可学习不同模式。

B样条参数化优势

  1. 局部支撑性:控制点仅影响局部区域,便于精细调整
  2. 平滑性:高阶B样条具有良好光滑性质
  3. 可解释性:学习到的激活函数可直接可视化分析
4

章节 04

TensorFlow实现详解

本项目实现重点在教育价值,核心组件是KANLinear层:

  • 关键参数:输入输出特征维度、网格大小、样条阶数、正则化系数等
  • 核心方法:初始化B样条网格、计算线性与样条变换的组合输出等 B样条基函数通过Cox-de Boor递归公式计算,支持边界扩展处理输入超范围情况。KAN类堆叠多个KANLinear层形成完整网络。
5

章节 05

KAN的优势与局限

主要优势

  1. 相同参数量下拟合精度优于MLP
  2. 可解释性强(激活函数可可视化)
  3. 适合低维复杂函数建模
  4. 能同时学习组合结构和单变量函数

当前局限

  1. 训练速度慢于MLP
  2. 缺乏大规模训练与GPU加速优化
  3. 高维数据表现需更多验证
6

章节 06

KAN的潜在应用前景

科学计算与物理建模

符号回归、物理定律学习、偏微分方程求解

医疗与高风险应用

医疗诊断(满足监管要求)、金融风控、自动驾驶

少样本学习

结构化表示或更有效利用有限数据

7

章节 07

使用建议与实验方向

推荐学习路径:

  1. 理解KAN设计原理与MLP的区别
  2. 研究KANLinear层实现细节
  3. 尝试不同网格大小和样条阶数
  4. 可视化学习到的激活函数
  5. 与MLP进行性能和可解释性对比
8

章节 08

总结

KAN代表神经网络架构的重要探索方向,通过边激活函数提升可解释性同时保持表达能力。虽训练效率存在挑战,但未来在科学计算、医疗AI等领域潜力大。本项目的TensorFlow实现为学习研究提供良好起点,代码清晰且文档详尽。