正文

TTBYS：面向说服对话的双知识增强心智理论推理框架

本文介绍 TTBYS（三思而后言）框架，通过显性和隐性先验知识增强大语言模型的心智理论推理能力，在信念-愿望-意图框架下实现更稳定的说服对话生成。

心智理论说服对话BDI框架知识增强Qwen3大语言模型推理框架

发布时间 2026/05/21 23:15最近活动 2026/05/22 10:53预计阅读 3 分钟

章节 01

【导读】TTBYS：双知识增强的心智理论推理框架助力说服对话

本文介绍TTBYS（三思而后言）框架，通过显性和隐性先验知识增强大语言模型的心智理论推理能力，在信念-愿望-意图（BDI）框架下实现更稳定的说服对话生成。该框架在ToM-BPD数据集上表现优异，使用Qwen3-8B模型即在愿望预测、信念推理、说服策略选择等关键指标上超越GPT-5，为构建社交智能AI系统提供新思路。

章节 02

研究背景与问题定义

说服对话是人类高级认知活动，需准确推理他人信念、愿望、意图（心智理论ToM）。当前大语言模型面临挑战：简单提示策略和有限ToM知识导致难以捕捉心理状态依赖关系，产生碎片化表征和不稳定推理结果。

章节 03

核心贡献与数据集构建

ToM-PD任务框架

研究提出基于心智理论的说服对话任务（ToM-PD），建立在BDI框架上，显式建模多轮对话中心理状态的序列依赖关系，提供结构化任务定义。

ToM-BPD数据集

构建大规模标注数据集ToM-BPD，特点包括：

细粒度心理状态标注（信念、愿望、意图）；
对应说服策略标注，建立心理状态到策略的映射；
多轮对话结构，捕捉心理状态动态变化。

章节 04

TTBYS方法与双知识增强机制

TTBYS框架：三思而后言

核心是生成回应前的三次思考：

愿望推理：利用先验知识推断对话对象最迫切愿望/需求；
信念推理：基于愿望，推理对象对议题的信念状态（相信、怀疑、开放）；
策略选择：综合前两步结果，选择有效说服策略，借鉴历史经验避免重复失败。

双知识增强

显式先验知识：心理学理论、说服学成果、人工标注案例库，结构化注入模型；
隐性经验知识：检索相似历史对话案例，补充显式理论不足，增强灵活性。

章节 05

实验结果与案例分析

实验对比

在ToM-BPD数据集上，Qwen3-8B+TTBYS超越GPT-5：

愿望预测准确率提升1.20%；
信念推理准确率提升22.80%；
说服策略选择准确率提升16.97%。

消融实验

移除显式知识或隐性经验均导致性能显著下降，证明两者互补性。

案例研究

推理过程可视化：逐步推理输出中间步骤，决策透明可解释；
跨轮一致性：多轮对话中对心理状态理解更稳定，对话更连贯。

章节 06

技术启示与应用前景

心智理论工程化：将抽象ToM概念转化为可计算组件，为社交推理应用提供方法论参考；
知识增强范式：显式理论+隐性经验的双知识增强思路，可推广到医疗诊断、法律咨询、教育辅导等领域；
小模型潜力：中等规模模型（如Qwen3-8B）通过架构设计和知识注入，可在特定任务超越超大模型。

章节 07

局限与未来方向

数据集：ToM-BPD虽规模大，但领域覆盖和语言多样性需扩展；
效率：三次逐步推理增加计算开销，需优化推理速度以实际部署；
伦理：说服技术具双刃剑特性，需审慎应用，避免操纵或欺骗。

章节 08

总结

TTBYS框架整合心智理论、BDI建模和双知识增强，为说服对话提供新解决思路。其"三思而后言"设计提升性能，增强推理可解释性和一致性。该工作为社交智能AI系统发展迈出重要一步，同时提醒需关注伦理边界与社会影响。