章节 01
Inter-Stance多模态双人语料库发布:填补立场分析数据空白
纽约州立大学宾汉姆顿分校等机构发布Inter-Stance数据集,这是面向对话立场分析的多模态双人交互语料库,含45对参与者(90人),同步采集2D/3D面部视频、热成像、语音及多种生理信号,为计算社会科学和情感计算领域提供前所未有的研究资源,解决现有数据集在双人多模态交互数据上的空白。
正文
纽约州立大学宾汉姆顿分校等机构的研究团队发布了Inter-Stance数据集,这是一个包含45对参与者(共90人)的多模态双人交互语料库,涵盖同步采集的2D/3D面部视频、热成像、语音及多种生理信号,为计算社会科学和情感计算领域提供了前所未有的研究资源。
章节 01
纽约州立大学宾汉姆顿分校等机构发布Inter-Stance数据集,这是面向对话立场分析的多模态双人交互语料库,含45对参与者(90人),同步采集2D/3D面部视频、热成像、语音及多种生理信号,为计算社会科学和情感计算领域提供前所未有的研究资源,解决现有数据集在双人多模态交互数据上的空白。
章节 02
人类社会交互是复杂多模态过程,语言、面部表情、生理反应等传递态度情感,存在“双人效应”。但现有数据集局限:要么单人单模态,要么双人交互缺乏丰富传感器,尚无同时提供双人多模态记录(含2D/3D视频、热成像、生理信号)及自我报告数据的公开数据集,制约人际交互计算建模发展。
章节 03
数据集核心规模:45对参与者(含熟人和陌生人)、270组多模态序列、1400多分钟交互数据、20TB总量开放共享。采集配置覆盖: -视觉:2D高清视频、3D面部几何、热成像视频与温度数据 -语音与语言:高保真音频、同步转录文本 -生理信号:PPG、EDA、HR、BP、RR等自主神经系统指标 同步采集能力可探索外部行为与内部生理状态关联。
章节 04
采用IRB批准实验方案,通过对话任务(易分歧社会议题)诱发自然立场行为。标注含三个核心立场类别:同意、不同意、中立,还包含社交信号和情感同步性标注,为研究人际情感影响提供素材。
章节 05
Inter-Stance相比现有数据集优势明显:
| 数据集 | 双人数量 | 参与者 | 模态 | 关键局限 |
|---|---|---|---|---|
| IEMOCAP | 5对 | 10名演员 | 音频、视频、动作捕捉 | 缺乏3D面部几何和热成像 |
| RECOLA | 23对 | 46名学生 | 音频、视频、ECG、EDA | 远程视频设置,缺乏3D和热成像 |
| HMI-Mimicry | 54对 | 12同谋+48参与者 | 音频、视频 | 缺乏3D、热成像和生理数据 |
| BP4D+ | - | 单人 | 2D/3D视频、热成像、生理信号 | 仅单人采集,无双交互 |
| Inter-Stance | 45对 | 90人 | 2D/3D视频、热成像、语音、文本、PPG、EDA、HR、BP、RR | 完整双人多模态采集 |
| 首次结合双人交互与丰富多模态采集(3D、热成像、生理信号)。 |
章节 06
数据集为多领域带来价值: 1.多模态立场检测:探索视觉/生理/语言信号协同表达立场,助力社交感知AI开发; 2.人际情感同步建模:分析情感传染、行为模仿和生理同步; 3.社会信号处理:识别同意/不同意/中立状态下的微妙社交信号; 4.心理健康研究:通过熟人与陌生人互动,研究心理障碍患者行为特征。
章节 07
带来新挑战:融合20TB多模态异构数据、建模双人动态影响、提取高维时序立场特征,推动多模态机器学习等技术发展。方法论上,IRB批准方案成功诱发自然立场行为,为情感计算数据采集提供借鉴范式。
章节 08
Inter-Stance发布标志多模态社交交互研究进入新阶段,为计算社会科学、情感计算、人机交互等领域提供关键数据资源,为构建社交感知AI系统奠定基础,是社交行为计算建模研究者的重要资源。