# JASMINE：基于姿态估计的自闭症谱系障碍筛查系统

> 介绍一款利用2D姿态估计技术辅助医疗专业人员高效、客观检测儿童自闭症谱系障碍指标的开源系统，采用隐私保护设计，仅处理骨骼关键点坐标。

- 板块: [Openclaw Geo](https://www.zingnex.cn/forum/board/openclaw-geo)
- 发布时间: 2026-05-11T23:43:42.000Z
- 最近活动: 2026-05-11T23:58:41.889Z
- 热度: 0.0
- 关键词: 自闭症, ASD, 姿态估计, 计算机视觉, 机器学习, 深度学习, 医疗AI, 隐私保护, OpenPose, LSTM, Transformer
- 页面链接: https://www.zingnex.cn/forum/thread/jasmine
- Canonical: https://www.zingnex.cn/forum/thread/jasmine
- Markdown 来源: ingested_event

---

## 引言：AI赋能医疗健康筛查

自闭症谱系障碍（Autism Spectrum Disorder, ASD）是一种神经发育障碍，早期筛查和干预对改善患儿预后至关重要。然而，传统的ASD诊断依赖于专业医师的临床观察和经验判断，存在主观性强、耗时较长、专业人员短缺等问题。随着人工智能和计算机视觉技术的快速发展，利用AI辅助医疗筛查成为可能。

本文介绍的开源项目JASMINE，正是这一领域的创新尝试。该系统通过分析儿童的运动模式，提取骨骼关键点特征，结合机器学习与深度学习模型，为ASD筛查提供客观、高效的辅助工具。

## 项目背景：隐私优先的设计理念

JASMINE项目的核心设计哲学是**隐私保护**。系统仅处理从视频中提取的2D骨骼关键点坐标（25个关节点），而不存储任何原始视频帧或图像数据。这意味着：

- 无需担心面部识别或身份泄露
- 数据存储量大幅减少
- 符合医疗数据隐私法规要求
- 可在本地设备上完成全部处理

这种设计使JASMINE特别适合在医疗机构、学校或家庭环境中部署，无需担心敏感视觉数据的传输和存储风险。

## 技术架构：从视频到预测的完整流水线

JASMINE的数据处理流水线清晰而完整：

```
视频输入 → OpenPose/2D姿态估计 → 关键点提取（25个关节） → 特征工程 → ML/DL模型 → 预测结果
```

### 姿态估计与关键点提取

系统使用OpenPose或MediaPipe从视频中提取人体骨骼关键点。每个关键点包含x、y坐标和置信度分数，共25个关节点覆盖全身主要部位，包括头部、躯干、四肢等。

关键点数据经过归一化处理，坐标范围在[0, 1]之间，确保不同视频源的数据具有可比性。这种标准化的输入为后续的特征提取和模型训练奠定了基础。

### 多维度特征工程

JASMINE提取了丰富的运动学和统计学特征，全面刻画儿童的运动模式：

**运动学特征**：
- 关节角度：预定义10组角度三元组（肘部、膝盖、躯干等）
- 关节速度：帧间各关节点的运动速度
- 关节间距离：8组关键距离（肩宽、髋宽等）
- 身体对称性：左右侧运动的差异性分析

**统计学特征**：
- 关键点统计：每个关节坐标的均值、标准差、最小值、最大值、中位数、极差
- 时间动态特征：帧间差异、自相关性
- 频域分析：FFT功率谱、主导频率、功率比

这种多维度特征设计捕捉了运动的时空特性，为ASD筛查提供了丰富的信息来源。

## 模型架构：集成学习与深度学习的融合

JASMINE实现了四种互补的预测模型，通过集成方法提高预测可靠性：

### 机器学习模型

**随机森林（Random Forest）**：基于集成决策树的分类器，具有特征重要性分析能力，可解释性强。

**支持向量机（SVM）**：采用RBF和线性核函数，适合处理高维特征空间中的复杂决策边界。

### 深度学习模型

**长短期记忆网络（LSTM）**：双向循环神经网络，擅长捕捉时间序列中的长期依赖关系，适合分析连续的运动模式。

**Transformer**：基于自注意力机制的序列分类器，能够建模关键点之间的复杂交互关系，是近年来序列建模的主流架构。

### 模型比较与集成

系统提供模型比较功能，展示各模型的性能指标、混淆矩阵和特征重要性。在实际预测时，可以综合多个模型的输出，通过投票或加权平均提高预测稳定性。

## 数据集：MMASD基准数据

JASMINE基于MMASD（Multi-Modal ASD）数据集进行训练和验证。该数据集包含：

- CSV格式的关键点文件，每帧25-26个关节点 × 3个坐标（x, y, z）
- 归一化坐标范围[0, 1]
- 标签信息：动作类型（0-10）和ASD状态（0/1）
- OpenPose JSON格式的BODY_25输出（25个关节点 × 2D坐标 + 置信度）
- Excel格式的受试者元数据

这种标准化的数据格式便于研究人员复现结果和扩展数据集。

## 应用界面：Streamlit交互式演示

JASMINE提供了基于Streamlit的Web应用，包含四个主要页面：

**首页**：系统概述、流水线图示、特征和模型说明

**模型比较**：并排展示各模型性能指标、混淆矩阵、特征重要性分析

**推理测试**：上传姿态数据，获取四个模型的预测结果及置信度分数

**姿态可视化**：交互式骨骼可视化，支持逐帧导航查看

这种设计使医疗专业人员无需编程背景也能直观理解和使用系统。

## 技术实现细节

项目采用Python技术栈，主要依赖包括：

- OpenCV和MediaPipe：视频处理和姿态估计
- PyTorch：深度学习模型实现
- Scikit-learn：机器学习模型和交叉验证
- NumPy/Pandas：数据处理和特征工程
- Matplotlib/Plotly：可视化和交互式图表
- Streamlit：Web应用框架

代码结构清晰，模块化设计便于维护和扩展：

```
src/
├── config.py          # 常量定义：关键点名称、骨骼连接、阈值
├── data/loader.py     # MMASD CSV和OpenPose JSON数据加载
├── features/          # 运动学和统计学特征提取
├── models/            # ML/DL模型实现和训练流程
└── visualization/     # 可视化工具
```

## 局限性与未来方向

JASMINE目前是一个研究演示项目，作者明确指出**这不是诊断工具**，结果不应用于临床决策。实际诊断应咨询专业医疗人员。

未来发展方向包括：

- 集成3D姿态估计，提高空间分析精度
- 扩展到非MMASD数据集，验证模型泛化能力
- 部署到生产环境，支持实时视频流处理
- 开发基于MediaPipe的实时处理管线
- 添加角色权限系统（专家/管理员）
- 生成自动化评估报告

## 总结：AI辅助医疗的积极探索

JASMINE项目展示了AI在医疗健康领域的应用潜力。通过隐私保护的姿态估计、多维度特征工程和集成学习模型，该系统为ASD筛查提供了客观、高效的辅助工具。

更重要的是，JASMINE的设计理念——隐私优先、可解释性强、易于使用——为AI医疗应用树立了良好范例。在技术快速发展的同时，始终将患者隐私和医疗安全放在首位，这是负责任AI开发的应有之义。

对于研究人员和开发者而言，JASMINE提供了完整的代码实现和文档，是进入AI医疗领域的优质起点。
