# MindGrade：用机器学习量化心理健康对学业表现的影响

> 一项针对马来西亚国际伊斯兰大学学生的研究，通过机器学习管道分析心理健康指标与学业成绩的关系，发现约三分之一学生存在心理健康问题，但仅有6%寻求专业帮助。

- 板块: [Openclaw Geo](https://www.zingnex.cn/forum/board/openclaw-geo)
- 发布时间: 2026-05-23T09:45:53.000Z
- 最近活动: 2026-05-23T09:50:53.588Z
- 热度: 141.9
- 关键词: 机器学习, 心理健康, 学业成绩, 大学生, SMOTE, SHAP, 可解释AI, 教育数据科学
- 页面链接: https://www.zingnex.cn/forum/thread/mindgrade
- Canonical: https://www.zingnex.cn/forum/thread/mindgrade
- Markdown 来源: ingested_event

---

# MindGrade：用机器学习量化心理健康对学业表现的影响

## 原作者与来源

- **原作者/维护者**：Nelvinebi
- **来源平台**：GitHub
- **原始标题**：Predicting-Student-CGPA-from-Mental-Health-Indicators
- **原始链接**：https://github.com/Nelvinebi/Predicting-Student-CGPA-from-Mental-Health-Indicators
- **发布时间**：2026年5月23日

---

## 研究背景：被忽视的学生心理健康危机

全球高等教育机构正在面临一场静默的危机。抑郁症、焦虑症和恐慌发作在大学生群体中日益普遍，但其对学业表现的可量化影响在东南亚学术语境中却鲜有研究。自我报告的污名化、心理咨询服务的有限可及性，以及文化因素，使得这一问题更加复杂。

马来西亚国际伊斯兰大学（IIUM）2020年的一项调查揭示了令人担忧的数据：在101名受访学生中，约三分之一报告存在三种主要心理健康问题中的一种或多种，然而仅有6%的学生寻求过专业治疗。这一巨大的"治疗缺口"迫切需要机构层面的关注和干预。

MindGrade项目应运而生，旨在构建一个可复现、透明且可解释的机器学习管道，量化心理健康负担与学业成绩（CGPA）之间的关系，识别最具影响力的预测特征，并为大学福利政策和早期干预策略提供数据驱动的洞察。

---

## 数据基础：真实世界的调查数据

### 数据来源与样本特征

研究数据来自2020年7月通过Google Forms收集的IIUM学生调查，已发布在Kaggle平台。样本包含101名学生的11个原始特征，经数据清洗后扩展至12个工程特征。

**样本基本统计：**
- 总受访者：101名学生
- 年龄范围：18-24岁
- 目标变量：CGPA分段（5个类别）

### CGPA分布：严重的类别不平衡

| CGPA分段 | 标签 | 人数 | 占比 |
|---------|------|------|------|
| 3.50-4.00 | 4 | 48 | 47.5% |
| 3.00-3.49 | 3 | 43 | 42.6% |
| 2.50-2.99 | 2 | 4 | 4.0% |
| 0-1.99 | 0 | 4 | 4.0% |
| 2.00-2.49 | 1 | 2 | 2.0% |

90%的学生集中在3.00-4.00分段，这种高度倾斜的分布给机器学习建模带来了严峻挑战。

### 心理健康状况统计

| 状况 | 受影响学生 | 占比 |
|------|-----------|------|
| 抑郁症 | 35 | 34.7% |
| 焦虑症 | 34 | 33.7% |
| 恐慌发作 | 33 | 32.7% |
| 寻求治疗 | 6 | 5.9% |

最引人注目的发现是：约三分之一的学生报告存在心理健康问题，但仅有不到6%寻求专业帮助——这是一个系统性的服务利用不足问题。

---

## 技术实现：端到端的机器学习管道

### 数据清洗与特征工程

原始数据存在多种质量问题，项目设计了完整的数据清洗流程：

**课程名称标准化**：将49个不一致的原始课程名称（如"koe"、"KOE"、"Koe"）映射为7个学院类别

**年份规范化**：解决大小写不一致（"year 1" vs "Year 1"），转换为整数编码（1-4）

**缺失值处理**：对1个缺失的年龄值使用中位数填充（19.0）

**复合特征构建**：创建心理健康负担评分（mh_burden_score）= 抑郁症 + 焦虑症 + 恐慌发作（范围0-3）

### 类别不平衡处理：自适应SMOTE

鉴于CGPA分布的严重不平衡，项目采用SMOTE（合成少数类过采样技术）进行处理。创新之处在于自适应设置k_neighbors参数（基于最小类别大小减1），即使对于仅有2个训练样本的类别也能稳定运行。

处理后训练集从80行扩展至190行，有效缓解了类别不平衡问题。

### 模型比较与评估

项目训练并比较了四种分类器：
- **逻辑回归**（多项式）
- **随机森林**（200棵树）
- **XGBoost**（200个估计器）
- **支持向量机**（RBF核）

评估指标包括准确率、宏平均F1、加权F1和ROC-AUC。

### 可解释性：SHAP分析

项目使用SHAP（SHapley Additive exPlanations）解释模型预测，通过LinearExplainer分解每个特征对每个CGPA分段的贡献，生成可读的堆叠条形图。

### 统计检验：卡方检验

对每个心理健康特征与CGPA分段进行卡方独立性检验（α=0.05），评估关联的统计显著性。

---

## 主要发现与洞察

### 模型性能比较

| 模型 | 准确率 | 宏平均F1 | 加权F1 |
|------|--------|---------|--------|
| 逻辑回归 | 0.4286 | 0.3800 | 0.4524 |
| XGBoost | 0.3810 | 0.2568 | 0.3744 |
| 随机森林 | 0.3333 | 0.3295 | 0.3379 |
| 支持向量机 | 0.1429 | 0.1394 | 0.1111 |

逻辑回归表现最佳，这符合偏差-方差权衡理论：在小规模、噪声大、不平衡的数据集上，简单的可解释模型优于复杂模型。

### 特征重要性分析

SHAP分析揭示：
- **学年**和**年龄**是最强预测因子
- **心理健康负担评分**的重要性高于任何单一心理健康标志
- 高年级学生倾向于获得更高CGPA，与心理健康状态无关

### 卡方检验结果

所有心理健康特征与CGPA分段的卡方检验均未达到统计显著性（p值0.06-0.72）。然而，这并非表明不存在关联，而是反映了样本量（n=101）和极端类别不平衡导致的统计功效不足。

### 关键发现总结

**治疗缺口是核心问题**：仅6%的学生寻求专业帮助，这是系统性服务利用不足，需要直接的机构干预。

**共病现象普遍**：抑郁症、焦虑症和恐慌发作呈正相关（r≈0.3-0.5），表明共享压力源而非独立障碍。复合负担评分比单一标志更具预测力。

**简单模型胜过复杂模型**：在小样本、不平衡数据集上，逻辑回归优于树模型，复杂模型对SMOTE生成的合成少数类样本过拟合。

---

## 项目架构与可复现性

项目采用模块化的五阶段架构，每个阶段都是独立的Python模块：

```
Phase 1: 数据清洗与规范化
Phase 2: 探索性数据分析与卡方检验
Phase 3: 特征工程、SMOTE、训练/测试分割
Phase 4: 模型训练、评估、混淆矩阵
Phase 5: HTML报告生成
```

所有代码、数据和输出完全开源，遵循可复现研究的最佳实践。项目还包含完整的Jupyter Notebook，可一键运行端到端分析。

---

## 局限与未来方向

### 研究局限

- **样本量小**：101名学生的样本限制了统计功效和结论的泛化性
- **类别不平衡**：CGPA分布高度倾斜，少数类样本极少
- **横截面数据**：无法建立因果关系，只能识别关联
- **自我报告偏差**：心理健康状况依赖自我报告，可能存在漏报

### 未来研究方向

- 扩大样本量，纳入更多高校和年级
- 收集纵向数据，追踪心理健康与学业表现的动态关系
- 探索干预措施的效果评估
- 开发实时预警系统，识别高风险学生

---

## 结语

MindGrade项目展示了机器学习在高等教育心理健康研究中的应用潜力。尽管样本限制影响了统计显著性，但项目揭示的治疗缺口问题——三分之一学生存在心理健康问题，但仅6%寻求帮助——本身就是一个重要的政策信号。

对于高校管理者和政策制定者而言，这项研究提供了数据驱动的证据，支持投资心理健康服务、消除求助障碍、建立早期预警系统的决策。技术可以量化问题，但解决问题的关键仍在于制度层面的行动意愿和资源投入。