章节 01
【导读】用大语言模型分析社交媒体生成式AI伦理风险话语的系统性研究
本研究利用GPT-4.1等大语言模型(LLM)对近5万条推文进行零样本分类,结合BERTopic主题建模,揭示公众对生成式AI伦理风险的五大关切领域。研究提出创新方法论,为大规模社交媒体话语分析提供可行路径,对政策制定、企业风险管理等具有实践意义。
正文
本研究利用GPT-4.1等LLM对近5万条推文进行零样本分类,结合BERTopic主题建模,揭示了公众对生成式AI伦理风险的主要关切领域。
章节 01
本研究利用GPT-4.1等大语言模型(LLM)对近5万条推文进行零样本分类,结合BERTopic主题建模,揭示公众对生成式AI伦理风险的五大关切领域。研究提出创新方法论,为大规模社交媒体话语分析提供可行路径,对政策制定、企业风险管理等具有实践意义。
章节 02
生成式AI(如ChatGPT)普及引发广泛讨论,其中不乏对潜在风险的担忧。理解公众关切对政策制定者、开发者等至关重要,但传统人工编码或小规模问卷难以处理海量社交媒体数据。本研究创新地结合LLM零样本分类与主题建模技术,分析近5万条ChatGPT相关推文,识别伦理风险类型。
章节 03
构建48398条2023年1-3月ChatGPT相关推文语料库,用GPT-4.1、GPT-3.5-turbo等4种LLM进行零样本分类,基于5类高层伦理风险(技术安全、隐私数据滥用、公平歧视、恶意滥用、社会民主风险)判断是否为风险话语。经验证,GPT-4.1表现最佳。
对GPT-4.1分类的风险话语推文,用BERTopic识别33个细粒度子主题,由两位编码员映射回五大风险类别。
章节 04
研究揭示公众对生成式AI伦理风险的多维度关切,涵盖技术到社会层面的五大类别。同时区分了“风险话语”与“非风险话语”(如使用体验、技术赞美等),提升分析准确性。(注:论文仍在审稿中,结果基于公开数据集和代码推断)
章节 05
章节 06
章节 07
随着生成式AI发展,理解公众伦理风险认知至关重要。本研究结合LLM与主题建模的创新方法,为大规模社交媒体话语分析提供路径,揭示五大风险领域,同时为AI治理、技术伦理等领域提供数据资源与方法论参考。