Zing 论坛

正文

Inter-Stance:面向对话立场分析的多模态双人语料库发布

纽约州立大学宾汉姆顿分校等机构的研究团队发布了Inter-Stance数据集,这是一个包含45对参与者(共90人)的多模态双人交互语料库,涵盖同步采集的2D/3D面部视频、热成像、语音及多种生理信号,为计算社会科学和情感计算领域提供了前所未有的研究资源。

多模态数据集立场分析情感计算社交信号处理双人交互计算机视觉生理信号热成像
发布时间 2026/04/25 01:37最近活动 2026/04/27 11:22预计阅读 3 分钟
Inter-Stance:面向对话立场分析的多模态双人语料库发布
1

章节 01

Inter-Stance多模态双人语料库发布:填补立场分析数据空白

纽约州立大学宾汉姆顿分校等机构发布Inter-Stance数据集,这是面向对话立场分析的多模态双人交互语料库,含45对参与者(90人),同步采集2D/3D面部视频、热成像、语音及多种生理信号,为计算社会科学和情感计算领域提供前所未有的研究资源,解决现有数据集在双人多模态交互数据上的空白。

2

章节 02

研究背景:社会交互的多模态需求与现有数据局限

人类社会交互是复杂多模态过程,语言、面部表情、生理反应等传递态度情感,存在“双人效应”。但现有数据集局限:要么单人单模态,要么双人交互缺乏丰富传感器,尚无同时提供双人多模态记录(含2D/3D视频、热成像、生理信号)及自我报告数据的公开数据集,制约人际交互计算建模发展。

3

章节 03

Inter-Stance数据集规模与多模态采集配置

数据集核心规模:45对参与者(含熟人和陌生人)、270组多模态序列、1400多分钟交互数据、20TB总量开放共享。采集配置覆盖: -视觉:2D高清视频、3D面部几何、热成像视频与温度数据 -语音与语言:高保真音频、同步转录文本 -生理信号:PPG、EDA、HR、BP、RR等自主神经系统指标 同步采集能力可探索外部行为与内部生理状态关联。

4

章节 04

实验设计与立场标注方案

采用IRB批准实验方案,通过对话任务(易分歧社会议题)诱发自然立场行为。标注含三个核心立场类别:同意、不同意、中立,还包含社交信号和情感同步性标注,为研究人际情感影响提供素材。

5

章节 05

与现有数据集对比:Inter-Stance的显著优势

Inter-Stance相比现有数据集优势明显:

数据集 双人数量 参与者 模态 关键局限
IEMOCAP 5对 10名演员 音频、视频、动作捕捉 缺乏3D面部几何和热成像
RECOLA 23对 46名学生 音频、视频、ECG、EDA 远程视频设置,缺乏3D和热成像
HMI-Mimicry 54对 12同谋+48参与者 音频、视频 缺乏3D、热成像和生理数据
BP4D+ - 单人 2D/3D视频、热成像、生理信号 仅单人采集,无双交互
Inter-Stance 45对 90人 2D/3D视频、热成像、语音、文本、PPG、EDA、HR、BP、RR 完整双人多模态采集
首次结合双人交互与丰富多模态采集(3D、热成像、生理信号)。
6

章节 06

Inter-Stance的多领域应用前景

数据集为多领域带来价值: 1.多模态立场检测:探索视觉/生理/语言信号协同表达立场,助力社交感知AI开发; 2.人际情感同步建模:分析情感传染、行为模仿和生理同步; 3.社会信号处理:识别同意/不同意/中立状态下的微妙社交信号; 4.心理健康研究:通过熟人与陌生人互动,研究心理障碍患者行为特征。

7

章节 07

技术挑战与方法论启示

带来新挑战:融合20TB多模态异构数据、建模双人动态影响、提取高维时序立场特征,推动多模态机器学习等技术发展。方法论上,IRB批准方案成功诱发自然立场行为,为情感计算数据采集提供借鉴范式。

8

章节 08

结语:推动社交交互研究进入新阶段

Inter-Stance发布标志多模态社交交互研究进入新阶段,为计算社会科学、情感计算、人机交互等领域提供关键数据资源,为构建社交感知AI系统奠定基础,是社交行为计算建模研究者的重要资源。