Zing 论坛

正文

用大语言模型分析社交媒体上的生成式AI伦理风险话语:一项系统性研究

本研究利用GPT-4.1等LLM对近5万条推文进行零样本分类,结合BERTopic主题建模,揭示了公众对生成式AI伦理风险的主要关切领域。

生成式AI伦理风险大语言模型零样本分类BERTopic主题建模社交媒体分析AI治理
发布时间 2026/05/25 21:45最近活动 2026/05/25 21:53预计阅读 2 分钟
用大语言模型分析社交媒体上的生成式AI伦理风险话语:一项系统性研究
1

章节 01

【导读】用大语言模型分析社交媒体生成式AI伦理风险话语的系统性研究

本研究利用GPT-4.1等大语言模型(LLM)对近5万条推文进行零样本分类,结合BERTopic主题建模,揭示公众对生成式AI伦理风险的五大关切领域。研究提出创新方法论,为大规模社交媒体话语分析提供可行路径,对政策制定、企业风险管理等具有实践意义。

2

章节 02

研究背景:为何关注生成式AI伦理风险话语

生成式AI(如ChatGPT)普及引发广泛讨论,其中不乏对潜在风险的担忧。理解公众关切对政策制定者、开发者等至关重要,但传统人工编码或小规模问卷难以处理海量社交媒体数据。本研究创新地结合LLM零样本分类与主题建模技术,分析近5万条ChatGPT相关推文,识别伦理风险类型。

3

章节 03

研究方法:两阶段分析框架详解

第一阶段:LLM零样本分类

构建48398条2023年1-3月ChatGPT相关推文语料库,用GPT-4.1、GPT-3.5-turbo等4种LLM进行零样本分类,基于5类高层伦理风险(技术安全、隐私数据滥用、公平歧视、恶意滥用、社会民主风险)判断是否为风险话语。经验证,GPT-4.1表现最佳。

第二阶段:BERTopic主题建模

对GPT-4.1分类的风险话语推文,用BERTopic识别33个细粒度子主题,由两位编码员映射回五大风险类别。

4

章节 04

研究发现:公众关注的AI伦理风险维度

研究揭示公众对生成式AI伦理风险的多维度关切,涵盖技术到社会层面的五大类别。同时区分了“风险话语”与“非风险话语”(如使用体验、技术赞美等),提升分析准确性。(注:论文仍在审稿中,结果基于公开数据集和代码推断)

5

章节 05

方法学贡献:LLM辅助社会科学研究的突破

  1. 零样本分类可行性:LLM无需特定训练数据即可有效分类,降低大规模文本分析门槛;
  2. 多模型对比验证:对比4种LLM与传统监督学习方法,提供LLM在社科任务表现的实证证据;
  3. 可复现流程:公开代码、提示词、标注数据等,便于其他研究者复现;
  4. 伦理合规:仅公开推文ID和标注结果,符合平台条款与学术伦理。
6

章节 06

实践意义:对多领域的应用前景

  • 政策制定:帮助监管机构了解公众焦点,制定针对性政策;
  • 企业风险管理:助力AI公司识别用户担忧,优化产品设计与沟通;
  • 学术研究:为计算社会科学提供可复用的LLM辅助分析框架;
  • 舆情监测:可扩展为实时系统,追踪公众风险关注点演变。
7

章节 07

总结:研究的核心价值与启示

随着生成式AI发展,理解公众伦理风险认知至关重要。本研究结合LLM与主题建模的创新方法,为大规模社交媒体话语分析提供路径,揭示五大风险领域,同时为AI治理、技术伦理等领域提供数据资源与方法论参考。