Zing 论坛

正文

从睡眠脑电波解码情绪:跨被试机器学习的三阶段深度学习框架

本文介绍了一个在Kaggle睡眠情绪预测竞赛中获得第三名的开源项目,该项目通过自监督预训练、元学习和时空融合的三阶段深度学习流程,实现了从NREM睡眠EEG信号中解码情绪记忆激活状态的目标。

EEG睡眠情绪解码机器学习深度学习自监督学习MAML元学习脑机接口神经科学
发布时间 2026/05/24 07:15最近活动 2026/05/24 07:18预计阅读 3 分钟
从睡眠脑电波解码情绪:跨被试机器学习的三阶段深度学习框架
1

章节 01

导读 / 主楼:从睡眠脑电波解码情绪:跨被试机器学习的三阶段深度学习框架

本文介绍了一个在Kaggle睡眠情绪预测竞赛中获得第三名的开源项目,该项目通过自监督预训练、元学习和时空融合的三阶段深度学习流程,实现了从NREM睡眠EEG信号中解码情绪记忆激活状态的目标。

2

章节 02

原作者与来源

  • 原作者/维护者: MrSa3dola
  • 来源平台: GitHub
  • 原始项目名称: TMR-EEG-Emotion-Decoding
  • 原始链接: https://github.com/MrSa3dola/TMR-EEG-Emotion-Decoding
  • 发布时间: 2026年5月23日
  • 竞赛成绩: Kaggle "Predicting Emotions During Sleep Using Brain Waves" 竞赛第三名(private leaderboard)

3

章节 03

项目背景与研究意义

睡眠中的情绪记忆巩固是神经科学领域的重要课题。近年来,Targeted Memory Reactivation(TMR,靶向记忆再激活)技术通过在睡眠期间呈现与先前学习相关的线索(如声音或气味),可以选择性地增强特定记忆的巩固。然而,如何实时监测睡眠中的情绪状态变化,一直是该领域的技术瓶颈。

传统EEG分析方法往往依赖人工特征提取和单被试建模,难以实现跨被试的泛化。本项目针对这一挑战,开发了一套端到端的深度学习流程,能够从16通道睡眠EEG信号中,以每秒200个采样点的时间分辨率,实时预测情绪(emotional)vs中性(neutral)状态。该项目在Kaggle的睡眠情绪预测竞赛中取得了第三名的优异成绩,展示了其方法的有效性。


4

章节 04

任务定义

模型需要对每个试次(trial)的200个时间点(1秒,200Hz采样)输出情绪概率P(emotional),评估指标采用复合AUC,奖励持续高于随机水平的预测窗口。

5

章节 05

数据构成

  • 训练集: 14名被试,标注了情绪/中性标签
  • 测试集: 3名被试,未标注
  • 信号维度: 16通道 × 200时间点 × 5频带(经预处理)

该任务的核心难点在于单试次信噪比极低——个体试次被噪声主导,情绪/中性分离仅在试次平均后的theta功率中隐约可见。这要求模型具备强大的特征提取能力和跨被试泛化能力。


6

章节 06

三阶段深度学习架构

本项目采用了一种创新的三阶段训练策略,结合了自监督学习、元学习和多流融合的思想。

7

章节 07

第一阶段:自监督预训练(Masked EEG Autoencoder)

第一阶段使用掩码自编码器(MAE)在所有数据(训练+测试,无需标签)上进行自监督预训练。模型通过重建随机掩蔽的时间点来学习EEG的时间表征。

关键设计:

  • 双向掩码: Transformer可以看到掩码位置前后的上下文
  • 40%掩码率: 激进的掩码迫使模型学习有意义的时间模式
  • 共享架构: MAE编码器与后续通道专家架构相同,可直接迁移权重

每个通道的输入序列(200时间点 × 5频带)经过线性投影(5→16维)、位置编码、40%随机掩码后,输入3层Transformer编码器(d=16,4头,FFN=128),最后通过线性层重建掩码位置。

8

章节 08

第二阶段:元学习训练通道专家(FOMAML)

第二阶段为每个EEG通道训练独立的Transformer专家,共16个。专家网络从MAE编码器权重初始化,然后通过一阶MAML(FOMAML)进行元训练,以实现对新被试的快速适应。

FOMAML机制:

  • 内循环:3步梯度更新适应特定被试
  • 外循环:在所有被试上优化元参数
  • 支持跨被试泛化的LOPO(留一被试交叉验证)

每个通道专家包含约19,489个参数,16个专家总计约311K参数。这种通道级专家设计允许模型捕捉不同脑区间的特异性模式。