章节 01
HYBRIDS项目:用LLM解析联合国决议论证结构的创新方法
核心观点:HYBRIDS项目旗下HybridArguer团队开发了四阶段LLM推理流程,可自动从英法双语联合国决议文本中提取论证结构,解决传统方法难以捕捉深层次修辞和论证模式的问题,为政治话语分析提供新的技术路径。该方法在2026年ArgMining研讨会共享任务中得到验证。
正文
苏黎世大学团队开发了一套四阶段LLM推理流程,自动从英法双语的联合国决议文本中提取论证结构,为政治话语分析提供了新的技术路径。
章节 01
核心观点:HYBRIDS项目旗下HybridArguer团队开发了四阶段LLM推理流程,可自动从英法双语联合国决议文本中提取论证结构,解决传统方法难以捕捉深层次修辞和论证模式的问题,为政治话语分析提供新的技术路径。该方法在2026年ArgMining研讨会共享任务中得到验证。
章节 02
在政治学与计算语言学交叉领域,理解国际外交文本(如联合国决议)的论证结构是核心挑战。传统文本分析方法难以捕捉其深层次修辞和论证模式。HYBRIDS项目由欧洲地平线计划资助(Grant Agreement No.101073351),HybridArguer团队(意大利FBK研究所Siddharth Bhargava博士等)聚焦“识别政治话语中论证性观点的立场”课题,并在2026年ArgMining研讨会共享任务验证成果。
章节 03
数据集:训练集含2695份英法双语UN决议(UN-RES数据集,Gao et al.,2025);测试集含45份联合国教科文组织国际教育会议(1934-2008)决议。数据以JSON格式存储,含文档标识符、建议编号、元数据(结构、段落索引)、正文段落(标注类型、标签、翻译等)。
任务定义:共享任务需完成三个子任务:1.段落分类为“序言性”或“操作性”;2.为段落分配多个语义标签;3.预测段落间论证关系及类型。
章节 04
HybridArguer团队提出四阶段模块化架构:
章节 05
技术实现:采用Docker容器化部署,实验环境为48GB NVIDIA Ampere A40 GPU、CUDA12.4、Python3.11的Linux服务器,确保可复现性。
评估方法:因缺乏人工标注ground truth,采用启发式基于特征的评估方法,为共享任务系统比较提供可行途径。
代码结构:含数据下载脚本、四个核心处理模块(文档级LLM生成、标签候选选择、段落候选选择、段落级LLM生成)及主执行脚本,模块化设计便于复现。
章节 06
研究意义:学术上,展示LLM推理能力与传统计算论证学结合的新路径;应用上,支持政策分析师、外交官高效理解国际决议论证模式。体现欧洲地平线计划对跨学科(计算机、语言学、政治学)研究的重视(观点仅代表作者,不反映欧盟立场)。
未来展望:扩展到议会辩论、法院判决、国际条约等文本;利用多语言LLM支持更多语种的政治话语分析。