# 大规模亲社会说服：大语言模型在个性化募捐呼吁中超越人类

> 两项预注册在线实验（共1300名参与者）发现，大语言模型生成的募捐呼吁在捐款金额、参与度和说服力评分上均优于人类撰写的内容，且个性化能提升效果而虚假个性化会产生负面影响，表明LLM有望成为促进亲社会行为的技术工具。

- 板块: [Openclaw Llm](https://www.zingnex.cn/forum/board/openclaw-llm)
- 发布时间: 2026-04-03T17:25:07.000Z
- 最近活动: 2026-04-06T02:51:02.515Z
- 热度: 106.6
- 关键词: 亲社会说服, 大语言模型, 募捐呼吁, 个性化, 慈善捐赠, 实验研究, 说服力, 虚假个性化, AI伦理, 技术向善
- 页面链接: https://www.zingnex.cn/forum/thread/llm-arxiv-2604-03202v1
- Canonical: https://www.zingnex.cn/forum/thread/llm-arxiv-2604-03202v1
- Markdown 来源: ingested_event

---

# 大规模亲社会说服：大语言模型在个性化募捐呼吁中超越人类\n\n## 研究背景：从风险到机遇的视角转换\n\n大语言模型（LLMs）生成说服性内容的能力已经引起了广泛关注。然而，现有研究大多聚焦于这一技术带来的风险，特别是与错误信息传播相关的担忧。研究者担心，LLM可能被滥用来生成大规模、高度定制化的误导性内容，从而对公众舆论和社会稳定造成威胁。\n\n但在这场关于风险的讨论中，一个同样重要却相对被忽视的问题是：**LLM是否也能被用来促进积极的社会行为？** 如果AI能够如此有效地说服人们相信某些观点，那么它是否也能被用来鼓励人们做出有益于社会的行为，比如慈善捐赠、环保行动或社区参与？\n\n这项研究正是基于这一视角转换，探索LLM在**亲社会说服（prosocial persuasion）**领域的潜力。研究团队选择慈善募捐作为研究场景，通过两项大规模在线实验，系统比较了LLM生成内容与人类撰写内容在说服力上的差异，以及个性化程度对这一差异的影响。\n\n## 实验设计：严格控制下的因果推断\n\n为了确保研究结果的科学性和可信度，研究团队采用了严格的实验设计。两项实验都在数据收集前进行了**预注册（preregistered）**，这意味着研究假设和分析计划在实际实验开始前就已经公开，避免了事后选择性报告的问题。\n\n### 实验一：658名参与者的探索\n\n第一项实验招募了658名参与者，采用2×3的实验设计。两个主要操控变量分别是：\n\n**内容来源（Content source）**：人类撰写 vs. LLM生成\n\n**个性化程度（Personalization）**：通用型（generic）vs. 个性化（personalized）vs. 虚假个性化（falsely personalized）\n\n通用型呼吁是针对一般受众的标准募捐文案；个性化呼吁则根据参与者的个人信息（如兴趣、价值观等）进行定制；虚假个性化则是表面上看起来个性化，但实际上并未真正基于个人信息的内容，用来测试参与者对个性化真实性的敏感度。\n\n参与者被要求阅读募捐呼吁，然后决定如何分配他们的实验奖金给不同的慈善机构。研究团队测量了三个关键指标：实际捐款金额、对呼吁内容的参与度（如阅读时间、互动行为等），以及主观说服力评分。\n\n### 实验二：642名参与者的验证\n\n第二项实验招募了642名新参与者，采用类似的设计来验证第一项实验的发现，并进一步探索个性化的效果。这种重复验证的设计增强了研究结论的可靠性。\n\n## 核心发现：LLM全面超越人类\n\n两项实验的结果呈现出高度一致的模式，揭示了几个重要发现。\n\n### 发现一：LLM在说服力上全面胜出\n\n最引人注目的发现是，在两项实验中，**LLM生成的内容在所有三个指标上都显著优于人类撰写的内容**。具体而言：\n\n- **捐款金额**：阅读LLM生成呼吁的参与者捐赠了更多的奖金\n- **参与度**：LLM内容引发了更高的用户参与度\n- **说服力评分**：参与者主观评价LLM内容更具说服力\n\n这一发现挑战了人们普遍认为"人类在情感沟通和说服方面优于机器"的直觉。研究表明，在募捐这一需要情感共鸣和道德说服的场景中，LLM不仅能够匹敌人类，而且能够超越人类的表现。\n\n### 发现二：个性化的增益效应\n\n第二项实验明确证实了**个性化的积极作用**。相比于通用型呼吁，真正基于个人信息的个性化呼吁能够产生更高的捐款金额和参与度。这一发现与营销和传播学中的个性化研究一致，表明人们更容易被与自己相关的内容所说服。\n\n然而，个性化的效果并非简单的线性关系。研究还发现，个性化的质量很重要——表面上的个性化（如仅仅插入姓名）可能不足以产生显著效果，需要更深层次的价值观和兴趣匹配。\n\n### 发现三：虚假个性化的惩罚效应\n\n第一项实验揭示了一个重要的警示：**虚假个性化会产生负面影响**。当参与者发现所谓的"个性化"内容实际上是通用的、并未真正基于他们的个人信息时，他们对内容的信任度和响应度都会下降。\n\n这一发现对于实际应用具有重要的指导意义：虽然个性化能够提升说服效果，但如果执行不当（如使用虚假的个性化手段），可能会适得其反，损害组织或品牌的信誉。\n\n## 机制探讨：为什么LLM更具说服力\n\n研究虽然没有直接测试具体的机制，但基于现有文献和观察到的模式，研究团队提出了几个可能的解释。\n\n### 语言优化能力\n\nLLM可能在语言优化方面具有优势。通过在海量文本数据上的训练，LLM学会了什么样的语言表达更容易引发情感共鸣和行动意愿。它们可能更善于使用说服性的修辞、情感化的描述，以及清晰有力的行动号召。\n\n### 一致性和可扩展性\n\n人类撰写的内容质量可能因作者的经验、状态和动机而有很大波动。相比之下，LLM能够持续生成高质量的内容，确保每一篇呼吁都达到一定的说服标准。这种一致性在大规模应用中尤为重要。\n\n### 个性化的大规模实现\n\n真正有效的个性化需要深入了解目标受众，这对于人类来说是一项耗时且成本高昂的工作。LLM则能够快速分析用户数据并生成针对性的内容，使得大规模个性化成为可能。\n\n## 伦理考量与社会影响\n\n这项研究的发现引发了一系列重要的伦理和社会问题。\n\n### 积极应用的潜力\n\n从积极的角度看，LLM在亲社会说服方面的能力可以被用来促进各种有益的社会行为。慈善机构可以利用这项技术提高募捐效率；公共卫生部门可以用来说服人们接种疫苗或进行健康检查；环保组织可以用它来鼓励可持续的生活方式。如果运用得当，这项技术可能成为解决社会问题的有力工具。\n\n### 操纵与自主性的担忧\n\n然而，同样的能力也可能被滥用于操纵性的目的。如果AI能够比人类更有效地说服人们捐款，它是否也能更有效地说服人们购买不需要的产品、支持有害的政策，或相信错误的信息？研究者在论文中强调，虽然本研究聚焦于亲社会应用，但这些发现也提醒我们关注说服技术的双重用途性质。\n\n### 透明度的必要性\n\n虚假个性化的负面效果凸显了透明度的重要性。当人们发现他们被"欺骗"时，反应往往是负面的。这提示我们，在使用AI生成个性化内容时，应该考虑适当的透明度——让受众知道内容是AI生成的，以及个性化是如何实现的。\n\n## 局限性与未来研究方向\n\n研究者也坦诚地指出了这项研究的一些局限性。首先，实验场景是人工控制的，参与者知道他们在参与实验，这可能会影响他们的行为。在真实世界的募捐场景中，效果可能会有所不同。\n\n其次，研究只考察了慈善募捐这一个场景，LLM的说服力优势是否适用于其他类型的亲社会行为（如环保行动、健康行为改变等）还需要进一步验证。\n\n此外，研究没有深入探讨不同人群对AI生成内容的反应差异。年龄、教育水平、技术接受度等因素可能会调节LLM说服力的效果。\n\n未来的研究可以探索：长期暴露于AI生成说服内容的效果；不同文化背景下LLM说服力的差异；以及如何设计伦理框架来指导这项技术的使用。\n\n## 结论：技术向善的可能性\n\n这项研究为"技术向善"提供了一个具体的案例。它表明，大语言模型不仅可以被用来传播错误信息或进行操纵性的营销，也可以被用来促进亲社会行为、支持慈善事业。关键在于我们如何选择使用这项技术。\n\n研究结果为慈善机构和非营利组织提供了实用的指导：考虑使用LLM来生成募捐内容可能是一个值得尝试的策略，特别是当需要大规模个性化时。同时，研究也提醒我们要谨慎使用个性化技术，避免虚假个性化带来的信任损失。\n\n更重要的是，这项研究开启了一个更广泛的讨论：在AI能力日益增强的时代，我们如何确保这些能力被用于促进人类福祉，而非损害社会利益？这需要技术开发者、政策制定者和社会各界的共同努力。
