Zing 论坛

正文

TTBYS:面向说服对话的双知识增强心智理论推理框架

本文介绍 TTBYS(三思而后言)框架,通过显性和隐性先验知识增强大语言模型的心智理论推理能力,在信念-愿望-意图框架下实现更稳定的说服对话生成。

心智理论说服对话BDI框架知识增强Qwen3大语言模型推理框架
发布时间 2026/05/21 23:15最近活动 2026/05/22 10:53预计阅读 3 分钟
TTBYS:面向说服对话的双知识增强心智理论推理框架
1

章节 01

【导读】TTBYS:双知识增强的心智理论推理框架助力说服对话

本文介绍TTBYS(三思而后言)框架,通过显性和隐性先验知识增强大语言模型的心智理论推理能力,在信念-愿望-意图(BDI)框架下实现更稳定的说服对话生成。该框架在ToM-BPD数据集上表现优异,使用Qwen3-8B模型即在愿望预测、信念推理、说服策略选择等关键指标上超越GPT-5,为构建社交智能AI系统提供新思路。

2

章节 02

研究背景与问题定义

说服对话是人类高级认知活动,需准确推理他人信念、愿望、意图(心智理论ToM)。当前大语言模型面临挑战:简单提示策略和有限ToM知识导致难以捕捉心理状态依赖关系,产生碎片化表征和不稳定推理结果。

3

章节 03

核心贡献与数据集构建

ToM-PD任务框架

研究提出基于心智理论的说服对话任务(ToM-PD),建立在BDI框架上,显式建模多轮对话中心理状态的序列依赖关系,提供结构化任务定义。

ToM-BPD数据集

构建大规模标注数据集ToM-BPD,特点包括:

  1. 细粒度心理状态标注(信念、愿望、意图);
  2. 对应说服策略标注,建立心理状态到策略的映射;
  3. 多轮对话结构,捕捉心理状态动态变化。
4

章节 04

TTBYS方法与双知识增强机制

TTBYS框架:三思而后言

核心是生成回应前的三次思考:

  1. 愿望推理:利用先验知识推断对话对象最迫切愿望/需求;
  2. 信念推理:基于愿望,推理对象对议题的信念状态(相信、怀疑、开放);
  3. 策略选择:综合前两步结果,选择有效说服策略,借鉴历史经验避免重复失败。

双知识增强

  1. 显式先验知识:心理学理论、说服学成果、人工标注案例库,结构化注入模型;
  2. 隐性经验知识:检索相似历史对话案例,补充显式理论不足,增强灵活性。
5

章节 05

实验结果与案例分析

实验对比

在ToM-BPD数据集上,Qwen3-8B+TTBYS超越GPT-5:

  • 愿望预测准确率提升1.20%;
  • 信念推理准确率提升22.80%;
  • 说服策略选择准确率提升16.97%。

消融实验

移除显式知识或隐性经验均导致性能显著下降,证明两者互补性。

案例研究

  • 推理过程可视化:逐步推理输出中间步骤,决策透明可解释;
  • 跨轮一致性:多轮对话中对心理状态理解更稳定,对话更连贯。
6

章节 06

技术启示与应用前景

  1. 心智理论工程化:将抽象ToM概念转化为可计算组件,为社交推理应用提供方法论参考;
  2. 知识增强范式:显式理论+隐性经验的双知识增强思路,可推广到医疗诊断、法律咨询、教育辅导等领域;
  3. 小模型潜力:中等规模模型(如Qwen3-8B)通过架构设计和知识注入,可在特定任务超越超大模型。
7

章节 07

局限与未来方向

  1. 数据集:ToM-BPD虽规模大,但领域覆盖和语言多样性需扩展;
  2. 效率:三次逐步推理增加计算开销,需优化推理速度以实际部署;
  3. 伦理:说服技术具双刃剑特性,需审慎应用,避免操纵或欺骗。
8

章节 08

总结

TTBYS框架整合心智理论、BDI建模和双知识增强,为说服对话提供新解决思路。其"三思而后言"设计提升性能,增强推理可解释性和一致性。该工作为社交智能AI系统发展迈出重要一步,同时提醒需关注伦理边界与社会影响。