章节 01
ST-SNN:基于层束神经网络的动作识别新方法导读
本文介绍ST-SNN架构,该架构将ST-GCN中的标准图卷积网络替换为层束神经网络,利用正交限制映射有效建模异质交互,在NTU RGB+D数据集上将基线准确率从81.5%提升至85.4%,结合高级时序模块可达到与STGCN++相当的性能。
正文
本文介绍ST-SNN架构,该架构将ST-GCN中的标准图卷积网络替换为层束神经网络,利用正交限制映射有效建模异质交互,在NTU RGB+D数据集上将基线准确率从81.5%提升至85.4%,并结合高级时序模块达到与STGCN++相当的性能。
章节 01
本文介绍ST-SNN架构,该架构将ST-GCN中的标准图卷积网络替换为层束神经网络,利用正交限制映射有效建模异质交互,在NTU RGB+D数据集上将基线准确率从81.5%提升至85.4%,结合高级时序模块可达到与STGCN++相当的性能。
章节 02
人体动作识别是计算机视觉领域的核心任务之一,广泛应用于智能监控、人机交互、运动分析等场景。基于骨骼数据的动作识别方法对光照变化、遮挡和视角变化具有鲁棒性。传统ST-GCN通过GCN建模人体关节空间关系,但存在同质性假设导致的过度平滑问题,难以捕捉相邻关节的异质交互(运动模式截然不同)。
章节 03
层束神经网络(SheafNN)基于层束理论,为每个节点分配独立特征空间,通过限制映射定义节点间交互。ST-SNN的核心创新是使用正交限制映射的层束拉普拉斯算子替代GCN邻接矩阵,避免过度平滑。架构含空间模块(SheafafNN替换GCN)和时序模块块(标准时序模块/ MS-TCN多尺度时间卷积模块)。
章节 04
在NTU RGB+D数据集ntu60_xsub_3d基准上的结果:
| 模型 | 空间模块 | 时序模块 | 准确率 |
|---|---|---|---|
| ST-GCN(基线) | GCN | 标准 | 81.5% |
| ST-SNN | SheafNN | 标准 | 85.4% |
| STGCN++ | GCN | MS-TCN | 89.4% |
| ST-SNN++ | SheafNN | MS-TCN | ~89.0% |
| 关键发现:替换空间模块提升3.9个百分点;结合MS-TCN与STGCN++性能相当;计算效率可控。 |
章节 05
正交限制映射是关键:每条边学习正交变换矩阵,保持特征空间结构完整性;ST-SNN作为PySKL插件模块实现,含拓扑模块、配置文件、MMCV注册表集成,可轻松融入现有PySKL工作流。
章节 06
章节 07
ST-SNN通过层束神经网络解决传统ST-GCN过度平滑问题,显著提升动作识别性能,展示拓扑方法在深度学习中的潜力。项目提供完整PySKL集成方案,期待层束神经网络更多创新应用。