章节 01
【导读】用LLM重建沟通网络:解决关系事件历史数据中的接收者推断难题
该项目探索利用大语言模型(LLM)的语境理解能力,解决关系事件历史(REH)数据中消息接收者缺失的核心问题——即“谁在回应谁”的信息缺失。通过自动推断接收者,将传统无法分析的动态交互转化为可分析的沟通网络结构,并以荷兰议会辩论数据为案例验证方法有效性。项目对比传统方法,设计双层评估体系,为计算社会科学与社会网络分析提供创新工具与方法论参考。
正文
该项目探索如何利用大语言模型推断多方对话中的消息接收者,将传统缺失的"谁在回应谁"信息转化为可分析的沟通网络结构,并以荷兰议会辩论数据为案例进行验证。
章节 01
该项目探索利用大语言模型(LLM)的语境理解能力,解决关系事件历史(REH)数据中消息接收者缺失的核心问题——即“谁在回应谁”的信息缺失。通过自动推断接收者,将传统无法分析的动态交互转化为可分析的沟通网络结构,并以荷兰议会辩论数据为案例验证方法有效性。项目对比传统方法,设计双层评估体系,为计算社会科学与社会网络分析提供创新工具与方法论参考。
章节 02
在社会网络分析与计算社会科学领域,关系事件历史(REH)数据记录“谁在什么时间对谁做了什么”的动态交互序列(如议会辩论、在线论坛等场景)。但长期难题是:仅知发言者,却缺失“发言者回应谁”的接收者信息,导致无法构建准确沟通图、计算中心性指标或追踪观点传播路径。传统方法依赖人工标注(成本高)或基于规则的启发式推断(复杂场景效果有限)。
章节 03
核心创新在于利用LLM的语境理解能力自动推断接收者,假设LLM预训练习得的对话结构与语义知识可识别隐含回应关系。技术实现框架包含:
章节 04
实验以荷兰议会(Tweede Kamer)公开辩论记录为主要对象,该数据具有:
章节 05
研究意义:
章节 06
项目代码已在GitHub开源,提供:
章节 07
局限性:
章节 08
该项目是LLM在计算社会科学中的创新应用,通过解决REH数据接收者缺失问题,为网络分析提供关键工具。精细的双层评估与基线对比验证了方法有效性,为社会网络分析、政治文本分析或对话挖掘研究者提供值得关注的工具与方法论参考。