正文

用大语言模型分析社交媒体上的生成式AI伦理风险话语：一项系统性研究

本研究利用GPT-4.1等LLM对近5万条推文进行零样本分类，结合BERTopic主题建模，揭示了公众对生成式AI伦理风险的主要关切领域。

生成式AI伦理风险大语言模型零样本分类BERTopic主题建模社交媒体分析AI治理

发布时间 2026/05/25 21:45最近活动 2026/05/25 21:53预计阅读 2 分钟

章节 01

【导读】用大语言模型分析社交媒体生成式AI伦理风险话语的系统性研究

本研究利用GPT-4.1等大语言模型（LLM）对近5万条推文进行零样本分类，结合BERTopic主题建模，揭示公众对生成式AI伦理风险的五大关切领域。研究提出创新方法论，为大规模社交媒体话语分析提供可行路径，对政策制定、企业风险管理等具有实践意义。

章节 02

生成式AI（如ChatGPT）普及引发广泛讨论，其中不乏对潜在风险的担忧。理解公众关切对政策制定者、开发者等至关重要，但传统人工编码或小规模问卷难以处理海量社交媒体数据。本研究创新地结合LLM零样本分类与主题建模技术，分析近5万条ChatGPT相关推文，识别伦理风险类型。

章节 03

构建48398条2023年1-3月ChatGPT相关推文语料库，用GPT-4.1、GPT-3.5-turbo等4种LLM进行零样本分类，基于5类高层伦理风险（技术安全、隐私数据滥用、公平歧视、恶意滥用、社会民主风险）判断是否为风险话语。经验证，GPT-4.1表现最佳。

对GPT-4.1分类的风险话语推文，用BERTopic识别33个细粒度子主题，由两位编码员映射回五大风险类别。

章节 04

研究揭示公众对生成式AI伦理风险的多维度关切，涵盖技术到社会层面的五大类别。同时区分了“风险话语”与“非风险话语”（如使用体验、技术赞美等），提升分析准确性。（注：论文仍在审稿中，结果基于公开数据集和代码推断）

章节 05

章节 06

章节 07

随着生成式AI发展，理解公众伦理风险认知至关重要。本研究结合LLM与主题建模的创新方法，为大规模社交媒体话语分析提供路径，揭示五大风险领域，同时为AI治理、技术伦理等领域提供数据资源与方法论参考。