章节 01
导读:多模态深度学习助力孟加拉手语识别突破
本文介绍结合EfficientNet、图卷积网络(GCN)和交叉注意力融合的多模态孟加拉手语识别系统,在47类手语识别任务中达86%准确率,旨在打破听障人士沟通壁垒,促进社会包容性发展。
正文
本文介绍了一个结合EfficientNet、图卷积网络和交叉注意力融合的多模态孟加拉手语识别系统,探讨其在47类手语识别任务中达到86%准确率的技术路径。
章节 01
本文介绍结合EfficientNet、图卷积网络(GCN)和交叉注意力融合的多模态孟加拉手语识别系统,在47类手语识别任务中达86%准确率,旨在打破听障人士沟通壁垒,促进社会包容性发展。
章节 02
全球约7000万听障人士以手语为母语,自动手语识别(SLR)技术可打破沟通鸿沟。
章节 03
通过复合缩放策略(深度/宽度/分辨率)提取手部形状、面部表情等视觉特征,参数量少且效果优。
以关节为节点、骨骼为边的图结构,学习关节空间关系、手势动态演变,鲁棒关键点噪声。
实现视觉与骨骼特征交互,动态分配权重,整合互补信息。
章节 04
模型量化、帧特征缓存、滑动窗口实时识别。
章节 05
提升听障人士就业竞争力、教育资源可及性、公共服务无障碍水平。
可应用于其他手语变体、手势交互、体育分析、医疗康复评估。
章节 06
章节 07
本项目结合计算机视觉、图神经网络与注意力机制,既取得技术突破(86%准确率),又具社会意义。期待更多创新打破沟通壁垒,让科技服务所有人。