正文

LLM心智理论新发现：能读懂他人却读不懂自己

最新研究发现，前沿大语言模型在心智理论测试中表现出选择性缺陷——它们能准确推断他人的认知状态，却在自我建模任务上失败，除非提供推理痕迹作为辅助。

心智理论大语言模型自我建模元认知推理痕迹认知科学人工智能

发布时间 2026/03/27 13:41最近活动 2026/03/30 20:17预计阅读 2 分钟

章节 01

【导读】LLM心智理论新发现：能读懂他人却读不懂自己

最新研究发现前沿大语言模型在心智理论测试中存在选择性缺陷——它们能准确推断他人的认知状态，却在自我建模任务上失败，除非提供推理痕迹作为辅助。这一发现揭示了LLM心智理论能力的不对称性，为AI认知机制研究提供了新视角。

章节 02

传统心智理论测试停留在描述层面，让模型回答关于他人信念的问题。本研究采取更具挑战性的“行为驱动”范式，要求被试基于对自己和他人心理状态的表征做出战略性行动，更接近真实世界的社交场景（如国际象棋预判、谈判揣摩底线）。

章节 03

研究团队设计了三个核心任务：

章节 04

测试2024年以来的领先LLM后，结果显示：

章节 05

章节 06

章节 07

本研究显示LLM在心智理论道路上已取得显著进展，但自我建模仍是关键挑战。当AI能像理解他人一样理解自己时，人机交互将迎来新纪元，这是通往通用人工智能的重要一步。