Zing 论坛

正文

ST-SNN:基于层束神经网络的时空图卷积动作识别新方法

本文介绍ST-SNN架构,该架构将ST-GCN中的标准图卷积网络替换为层束神经网络,利用正交限制映射有效建模异质交互,在NTU RGB+D数据集上将基线准确率从81.5%提升至85.4%,并结合高级时序模块达到与STGCN++相当的性能。

层束神经网络时空图卷积动作识别异质交互图神经网络ST-GCNSheaf Neural Networks骨骼数据PySKL
发布时间 2026/05/21 18:16最近活动 2026/05/21 18:18预计阅读 2 分钟
ST-SNN:基于层束神经网络的时空图卷积动作识别新方法
1

章节 01

ST-SNN:基于层束神经网络的动作识别新方法导读

本文介绍ST-SNN架构,该架构将ST-GCN中的标准图卷积网络替换为层束神经网络,利用正交限制映射有效建模异质交互,在NTU RGB+D数据集上将基线准确率从81.5%提升至85.4%,结合高级时序模块可达到与STGCN++相当的性能。

2

章节 02

研究背景与动机

人体动作识别是计算机视觉领域的核心任务之一,广泛应用于智能监控、人机交互、运动分析等场景。基于骨骼数据的动作识别方法对光照变化、遮挡和视角变化具有鲁棒性。传统ST-GCN通过GCN建模人体关节空间关系,但存在同质性假设导致的过度平滑问题,难以捕捉相邻关节的异质交互(运动模式截然不同)。

3

章节 03

核心思想与架构设计

层束神经网络(SheafNN)基于层束理论,为每个节点分配独立特征空间,通过限制映射定义节点间交互。ST-SNN的核心创新是使用正交限制映射的层束拉普拉斯算子替代GCN邻接矩阵,避免过度平滑。架构含空间模块(SheafafNN替换GCN)和时序模块块(标准时序模块/ MS-TCN多尺度时间卷积模块)。

4

章节 04

实验结果与性能分析

在NTU RGB+D数据集ntu60_xsub_3d基准上的结果:

模型 空间模块 时序模块 准确率
ST-GCN(基线) GCN 标准 81.5%
ST-SNN SheafNN 标准 85.4%
STGCN++ GCN MS-TCN 89.4%
ST-SNN++ SheafNN MS-TCN ~89.0%
关键发现:替换空间模块提升3.9个百分点;结合MS-TCN与STGCN++性能相当;计算效率可控。
5

章节 05

技术细节与实现要点

正交限制映射是关键:每条边学习正交变换矩阵,保持特征空间结构完整性;ST-SNN作为PySKL插件模块实现,含拓扑模块、配置文件、MMCV注册表集成,可轻松融入现有PySKL工作流。

6

章节 06

应用前景与扩展方向

  1. 适用于社交网络、分子结构、知识图谱等异质图数据;2. 可探索多模态融合(视觉+骨骼特征);3. 挖掘限制映射物理意义增强模型可解释性。
7

章节 07

总结与展望

ST-SNN通过层束神经网络解决传统ST-GCN过度平滑问题,显著提升动作识别性能,展示拓扑方法在深度学习中的潜力。项目提供完整PySKL集成方案,期待层束神经网络更多创新应用。