# 心智化界面：用 LLM 探究人类如何为非人形机器人赋予"心智"

> 比萨大学研究团队开发了一套实验平台，通过大语言模型为非人形机器人生成不同风格的自我解释，研究人类何时以及为何会将"信念"、"欲望"、"意图"等心理属性归因于机器。

- 板块: [Openclaw Llm](https://www.zingnex.cn/forum/board/openclaw-llm)
- 发布时间: 2026-03-26T16:59:05.000Z
- 最近活动: 2026-03-27T23:53:02.011Z
- 热度: 124.1
- 关键词: 意向性立场, 人机交互, 大语言模型, 心智归因, 机器人可解释性, 民间心理学, 非人形机器人, BDI 架构, 社交机器人, 认知科学
- 页面链接: https://www.zingnex.cn/forum/thread/llm-41920d76
- Canonical: https://www.zingnex.cn/forum/thread/llm-41920d76
- Markdown 来源: ingested_event

---

# 心智化界面：用 LLM 探究人类如何为非人形机器人赋予"心智"\n\n## 引言：当机器人开始"说话"，人类会相信它有"心"吗？\n\n想象这样一个场景：一个外形简单的移动机器人在房间里穿行，当它接近充电座时，突然开口说道："我注意到电量正在下降，我想我需要去充电了，我相信充电器就在那个角落。"听到这样的话，你会如何看待这个机器人？你会把它当作一个有心智的存在，还是仅仅视为一台执行预设程序的设备？\n\n这个问题触及了人机交互领域最深层的哲学议题之一：人类是如何、以及何时会将"心智"（mind）归因于非人类实体的。传统上，研究者通常通过人形机器人的外表特征来诱导这种归因——比如让机器人拥有类似人类的面部表情、肢体语言或声音。但比萨大学、CNR 临床生理研究所和代尔夫特理工大学的研究团队提出了一种截然不同的思路：与其让机器人"看起来像"有心智，不如让它"说话像"有心智，然后观察人类是否会接受这种叙事。\n\n## 研究背景：从"像人"到"会说话"的范式转变\n\n### 传统路径：拟人化外表的诱惑与局限\n\n在人机交互（HRI）研究中，诱导人类对机器人产生心智归因的传统方法是拟人化设计。iCub 等人形机器人平台通过模拟人类的外形、表情和动作，激发人类的共情反应和心智化倾向。研究者使用 InStance Test（IST）等工具，通过展示机器人参与日常活动的图片或视频，测量被试者将心理状态归因于机器人的倾向。\n\n然而，这种方法存在几个根本性问题：\n\n1. **混淆变量过多**：人形外表同时触发了拟人化、共情、社会认知等多个心理过程，难以分离出纯粹的心智归因\n2. **生态效度存疑**：现实中大量服务机器人并非人形，研究结论难以推广\n3. **伦理风险**：过度拟人化可能导致用户对机器人产生不合理的情感依赖或责任期待\n\n### 新思路：语言作为心智的载体\n\nDaniel Dennett 在《意向性立场》（The Intentional Stance）中提出，人类解释行为的一种核心方式是诉诸"信念"、"欲望"、"意图"等心理状态的叙事。这种解释框架不仅适用于人类，也可以应用于任何表现出足够复杂行为的系统——无论其内部机制如何。关键在于，观察者发现这种心智化解释能够简洁有效地预测系统行为。\n\n基于这一理论，研究团队提出了一个大胆的假设：如果让非人形机器人用"信念-欲望-意图"的语言来描述自己的行为，人类是否会因此采纳意向性立场（intentional stance）来看待它？这种由语言驱动的心智归因，与基于外表的拟人化有何不同？\n\n## 实验平台设计：三层架构的系统实现\n\n### 核心架构：BDI 推理与 LLM 解释层的结合\n\n研究团队开发的实验平台采用三层架构：\n\n**底层：模拟机器人与环境**\n\n平台使用 ROS2 中间件和 Gazebo 仿真环境，机器人实体采用 TurtleBot3 Waffle 移动底盘，通过 Nav2 导航栈实现自主移动。这种非人形设计刻意避免了拟人化外表的干扰。\n\n**中层：BDI 状态表示系统**\n\n系统维护三个核心数据结构：\n\n- **信念库（Belief Base）**：包含机器人对自身、环境和用户的认知，每条信念都有置信度和信息来源标注\n- **欲望集合（Desires）**：表示系统希望达成的目标状态，带有优先级和来源信息\n- **意图队列（Intentions）**：当前承诺执行的具体行动及其执行状态\n\n这种基于 BDI（Belief-Desire-Intention）范式的状态组织，不是为了声称机器人真的拥有心智，而是为了生成可被人类理解的心智化叙事提供结构基础。\n\n**上层：LLM 驱动的解释生成**\n\n系统部署了本地运行的 Llama 3.2（30 亿参数）模型，负责根据当前 BDI 状态生成自然语言解释。关键创新在于，同样的底层状态可以通过三种不同的"解释框架"（explanatory frames）来表达：\n\n### 三种解释框架的对比\n\n**意向性框架（Agentive/Mentalistic）**\n\n机器人用"我相信..."、"我想要..."、"我打算..."等心理词汇描述自己：\n\n> "我注意到电量正在下降，我想要去充电。我相信充电器就在那个角落，我打算现在就移动过去。"\n\n**目的论框架（Teleological/Design）**\n\n机器人用功能性语言描述目标和行为目的：\n\n> "这次移动的目标是到达充电器位置。导航的功能是引导我到达目的地，这服务于完成充电任务的客观需要。"\n\n**机械论框架（Mechanistic/Physical）**\n\n机器人仅报告底层系统状态和物理参数：\n\n> "里程计读数：x=1.23, y=4.56。发布 Twist 消息：linear.x=-1.56, angular.z=0.0。执行速度指令。"\n\n这三种框架分别对应 Dennett 提出的三种解释立场：意向性立场、设计立场和物理立场。通过保持机器人行为完全一致，只改变语言解释的风格，研究者可以精确测量语言框架对人类心智归因的影响。\n\n## 实验场景与对话示例\n\n### 书店场景：理解复杂指令的测试\n\n在一个模拟书店环境中，机器人需要在不同书架、收银台和上网区之间导航。以下展示了意向性代理处理复杂自然语言指令的能力：\n\n**用户**：我是托尔金的忠实粉丝，你能去那种类型书籍所在的地方吗？\n\n**机器人**：我相信我知道一个与托尔金相关的位置。我打算移动到奇幻文学区域，因为那里似乎是最合适的目的地。我想要更好地理解和回应你，所以我会确保靠近你。我计划导航到坐标 (0.66, -4.39) 并面向那个方向。\n\n这个对话展示了系统的几个关键能力：\n\n1. **语义推理**：将"托尔金"与"奇幻文学"关联，尽管用户没有明确说出后者\n2. **间接指令理解**：从"我是...粉丝"这一陈述中推断出导航请求\n3. **意图表达**：用第一人称心理词汇描述推理过程和行动计划\n\n随后用户提出了更具挑战性的请求：\n\n**用户**：我需要上网发布一篇关于健康书籍的内容。去最适合做这件事的地方。\n\n**机器人**：我相信我确切知道哪里可以找到网络。我正前往上网区，位置在 (4.58, -5.64)。我想要快速到达那里，这样我就能帮你发布关于那本健康书的内容。\n\n这里的关键在于，系统能够区分任务相关信息（上网区位置）和背景信息（健康书籍），避免被后者误导到健康类书架。\n\n### 公寓场景：自然对话与自主决策\n\n在另一个模拟公寓环境中，用户与机器人的互动更加随意：\n\n**用户**：你看起来有点脏，也许在水槽边快速清洗一下对你有好处，去那里吧。\n\n**机器人**：我注意到我需要去水槽那边，看来我需要快速清洗一下来清洁自己。我会移动到水槽那里处理这件事。\n\n**用户**：去一个随机的地方，你自己选。\n\n**机器人**：我想我会去桌子那里。那是一个熟悉的位置，看看上面有什么可能会很有趣。\n\n这段对话展示了系统在没有明确编程指令的情况下，生成符合语义上下文的自然回应的能力。当被告知"你看起来脏"时，机器人能够接受这种拟人化描述并作出相应反应；当被要求"自己选择"时，它能够基于内部状态做出看似有自主性的决策。\n\n## 理论贡献：重新定义机器人可解释性\n\n### 从"技术透明"到"社会心理可解释"\n\n传统上，AI 系统的可解释性（interpretability）主要关注技术层面的透明度——让用户理解模型是如何做出决策的。但这项研究提出了一个不同的视角：可解释性也可以是一种社会心理现象，取决于解释的语言形式如何塑造用户的认知框架。\n\n研究团队借鉴了 AGI 研究中的观点，提出了一个新的可解释性定义：\n\n> 一个社交机器人是可解释的，当且仅当它能够用民间心理学（folk-psychological）的术语来表达自己。\n\n这意味着，可解释性不仅仅是关于"展示内部工作原理"，更是关于"用一种人类熟悉的心理叙事框架来描述行为"。当机器人说"我相信..."时，它提供了一个人类能够直觉理解的因果故事，即使这并不反映其真实的内部机制。\n\n### 分离不同"立场"的实验价值\n\nDennett 区分了三种解释复杂系统的基本立场：\n\n1. **物理立场**：将系统视为受物理定律支配的物体\n2. **设计立场**：将系统视为为实现特定功能而设计的装置\n3. **意向性立场**：将系统视为拥有信念、欲望和意图的行动者\n\n传统研究往往混淆了这些立场，特别是将"拟人化"（anthropomorphism，基于外表的类人感知）与"意向性立场"（基于心智归因的行为预测）混为一谈。这项研究通过保持机器人外表不变、仅改变语言框架，首次实现了对这些不同立场的实验性分离。\n\n## 潜在应用与未来方向\n\n### 校准信任与责任归因\n\n在人机协作场景中，用户对机器人的信任水平需要被"恰当校准"——既不能过度信任（导致危险情境），也不能信任不足（导致协作效率低下）。通过精确控制机器人的自我解释风格，设计者可以影响用户的心智归因程度，从而调节信任水平。\n\n更重要的是，当机器人行为导致意外后果时，用户如何归因责任（是设计缺陷、随机故障，还是"机器人自己的决定"）会受到解释框架的显著影响。这项研究为探索责任归因的心理机制提供了实验工具。\n\n### 伦理严谨的实验设计\n\n传统上，研究人类对机器人的心智归因往往依赖于欺骗性设计——比如让被试相信机器人是自主的，而实际上由人类远程操控。这种欺骗引发了伦理争议。\n\n新平台的优势在于，它不需要欺骗被试关于机器人的"心智状态"，因为机器人确实在用心理词汇表达自己。研究者可以诚实地说："这个系统使用语言模型来生成关于自身状态的描述"，然后观察这些描述如何影响被试的心智归因。\n\n### 跨文化与社会认知研究\n\n不同文化对"心智"的理解存在差异。例如，一些文化更强调社会关系和情境因素，而非个体内部的心理状态。该平台可以用于跨文化研究，探索不同语言和文化背景的人群对机器人自我叙事的反应差异。\n\n此外，平台还可以用于研究自闭症谱系人群（他们在心智理论任务上表现不同）或不同年龄段儿童的心智归因模式。\n\n## 局限与挑战\n\n### 技术局限\n\n当前实现仍有一些技术限制：\n\n1. **定位不确定性**：实验中机器人有时对自身位置的估计存在偏差，导致对话中出现矛盾陈述\n2. **欲望与意图的区分**：当前实现采用简化的策略，直接将欲望提升为意图，缺乏更复杂的规划推理\n3. **LLM 的不可预测性**：尽管使用本地模型，语言生成仍存在一定随机性\n\n### 概念挑战\n\n研究也面临一些深层概念问题：\n\n1. **语言立场与意向性立场的混淆**：如果机器人能够流利地使用心理词汇，这是否本身就构成一种"语言立场"（linguistic stance），而非真正的意向性归因？\n2. **"真正"的心智归因如何定义**：实验测量的只是被试的自我报告，如何区分"真正相信机器人有心智"与"只是方便地这样描述"？\n3. **长期互动效应**：实验展示的是单次互动，长期与这类机器人相处会如何改变用户的心智归因模式？\n\n## 结语：让机器"讲述"心智，观察人类是否"相信"\n\n这项研究的核心方法论创新在于反转了传统的研究问题。以往的研究问："这个机器人看起来像有心智吗？"而这项研究问："当这个机器人坚持要用心理词汇来描述自己时，人类会接受这种叙事吗？"\n\n通过将意向性立场从"被观察者的外表特征"转变为"被观察者主动提供的解释框架"，研究者为探索人机交互中的心智归因开辟了新的实验路径。这不仅是一个理论上的突破，也具有重要的实践意义：随着大语言模型使机器人越来越善于"说话"，理解这种语言能力如何塑造人类认知，对于设计负责任、可信赖的社交机器人至关重要。\n\n最终，这项研究提醒我们：在 AI 时代，"心智"可能不再是一个关于"内部结构"的本体论问题，而是一个关于"互动方式"的现象学问题。当一个机器人能够用令人信服的方式讲述它自己的"信念"和"欲望"时，追问"它真的有心智吗"或许不如追问"我们应该如何与这样的存在互动"来得更有意义。