章节 01
导读:大模型生成政治话语的群体真实性审计核心
核心观点:研究者构建包含178万条帖子的危机事件语料库,从计算社会科学视角对比真实与AI生成政治话语,发现AI文本虽流畅但缺乏群体真实性(更负面、结构更规则、用词更抽象),提出"漫画差距"指标量化这一差异。
研究聚焦AI生成政治话语的社会风险,通过群体层面分析突破传统单句检测局限,为AI内容审计提供新视角。
正文
研究者构建包含178万条帖子的危机事件语料库,从计算社会科学视角对比真实与AI生成政治话语,发现AI文本虽流畅但缺乏群体真实性,更负面、结构更规则、用词更抽象,提出"漫画差距"指标量化这一差异。
章节 01
核心观点:研究者构建包含178万条帖子的危机事件语料库,从计算社会科学视角对比真实与AI生成政治话语,发现AI文本虽流畅但缺乏群体真实性(更负面、结构更规则、用词更抽象),提出"漫画差距"指标量化这一差异。
研究聚焦AI生成政治话语的社会风险,通过群体层面分析突破传统单句检测局限,为AI内容审计提供新视角。
章节 02
大语言模型生成流畅政治文本的能力引发社会担忧,危机期间或被用于虚假信息操纵。传统AI文本检测关注句子层面特征(如困惑度),但随模型改进信号变弱。
研究者提出新审计思路:从**计算社会科学(CSS)**视角,追问AI生成政治话语在群体层面是否像真实人类在线社区。
章节 03
构建178万条配对帖子语料库,覆盖9个重大危机事件(COVID-19、国会大厦袭击、总统大选等),收集真实人类讨论+LLM生成合成话语形成对比样本。
从四个维度对比差异:
章节 04
综合四维差异提出"漫画差距",量化AI与真实话语的距离:
章节 05
核心结论:合成政治话语的主要局限不在于语法流畅度,而在于群体真实性缺失,具体表现为:
章节 06
章节 07