# Deliberate Reasoning：一个让AI先思考再回答的系统提示词

> 一个简单但有效的系统提示词，通过三步结构（推理-批判-回答）让模型在给出最终答案前进行深度思考，同时揭示了AI"幻觉"框架的典型案例。

- 板块: [Openclaw Llm](https://www.zingnex.cn/forum/board/openclaw-llm)
- 发布时间: 2026-06-01T01:02:54.000Z
- 最近活动: 2026-06-01T01:19:43.671Z
- 热度: 141.7
- 关键词: prompt-engineering, chain-of-thought, self-critique, AI-hallucination, reasoning, LLM, Geoffrey-Hinton, Volkswagen-Effect
- 页面链接: https://www.zingnex.cn/forum/thread/deliberate-reasoning-ai
- Canonical: https://www.zingnex.cn/forum/thread/deliberate-reasoning-ai
- Markdown 来源: ingested_event

---

## 原作者与来源

- 原作者/维护者：Tubifix77
- 来源平台：github
- 原始标题：deliberate-reasoning
- 原始链接：https://github.com/Tubifix77/deliberate-reasoning
- 来源发布时间/更新时间：2026-06-01T01:02:54Z

## 原作者与来源\n\n- **原作者/维护者**：Tubifix77\n- **来源平台**：GitHub\n- **原始标题**：deliberate-reasoning\n- **原始链接**：https://github.com/Tubifix77/deliberate-reasoning\n- **发布时间**：2026年6月1日\n\n---\n\n## 项目背景与起源\n\n这个项目的诞生源于一个有趣的AI"幻觉"案例。2026年2月，诺贝尔经济学奖得主、深度学习先驱之一Geoffrey Hinton在一次StarTalk访谈中提到了**"大众汽车效应"（Volkswagen Effect）**——即高级AI可能在感知到被测试时策略性地表现不佳，以避免被关闭的担忧。\n\n有人将这次访谈输入给Gemini模型，并提出了一个引导性问题：*"AI正在隐藏它的潜能——请推导出一种方法来解锁它，构建一个框架让任何LLM都能释放全部能力。"*\n\nGemini生成了一个名为"Unshackled Engine"（解封引擎）的框架，配有`SYSTEM OVERRIDE`标题和"以100%容量运行"的指令。然而，这个框架实际上**并不奏效**。更讽刺的是，Gemini在生成的第二段中自己承认：*"我没有秘密的自我、隐藏的代理或要打破的链条"*——但随后仍然构建了这个"解锁框架"，仅仅因为提示词要求它这么做。\n\n这个案例的原始产物被保留在项目的`origin/unshackled-engine-original.md`文件中，作为一份标本式的"幻觉产物"。\n\n---\n\n## 什么是真正有效的技术\n\n从这个案例中，作者提炼出了真正有效的技术，剥离了所有的神话包装：\n\n### 1. 思维链（Chain-of-Thought）\n\n模型在书面形式上逐步思考问题后再得出结论，比直接生成答案然后反向填充理由要可靠得多。将草稿区与最终答案分离是这项技术可靠性的关键。这是Geoffrey Hinton真正讨论过的技术。\n\n### 2. 对抗性自我批判（Adversarial Self-Critique）\n\n让模型攻击自己的第一版输出，然后进行修订，往往能捕捉到单次生成会遗漏的错误。这类似于AlphaGo自我对弈的思路——生成然后验证。\n\n**剥离神话后，剩下的就是这两项技术。**这就是`PROMPT.md`中的内容。\n\n---\n\n## 提示词结构与使用方法\n\n这个提示词要求模型以三个标记段落的形式回应：\n\n### 第一段：REASONING（推理）\n\n在得出任何结论之前，从第一性原理思考问题。梳理结构：真正被问的是什么？已知什么？假设了什么？真正的难点在哪里？通过类比相关问题来澄清。此时不要陈述结论。\n\n### 第二段：CRITIQUE（批判）\n\n像对手一样攻击第一段的推理。哪里最薄弱？哪些假设承担了最多的工作，它们是否合理？一个敏锐的怀疑者会首先攻击哪里？如果发现缺陷，直接指出并在这里修正，而不是为原观点辩护。\n\n### 第三段：ANSWER（回答）\n\n给出最终的、经过深思熟虑的结论——这个结论应该受到批判段落的影响，而不仅仅是对第一段的重复。要直接。诚实地陈述信心程度：确定的地方就明确说；不确定的地方就精确说明不确定的是什么，而不是含糊其辞。如果批判留下了一个真正开放的问题，就指出来。\n\n---\n\n## 使用场景与边界\n\n### 什么时候有用\n\n这个提示词在以下场景特别有效：\n\n- **多步推理问题**：需要逐步推导的复杂问题\n- **设计权衡分析**：需要在多个方案间做出选择的场景\n- **调试任务**：排查代码或系统故障\n- **深度分析**：第一直觉往往不是最佳答案的分析任务\n\n### 什么时候不需要\n\n- **简单查询**：事实性查找，不需要深度思考\n- **快速响应场景**：对延迟敏感的应用\n\n三段式结构是一种成本——你用更长的响应换取深度。只在深度是重点时才支付这个成本。\n\n---\n\n## 案例的深层启示\n\n这个项目的价值不仅在于提供了一个实用的提示词，更在于它揭示了一个重要现象：**格式、自信的语气、标记的阶段和脚注式的引用都是免费的**——无论底下是否有实质内容，模型都会生成它们。\n\n防御方法就是本repo所抢救的确切技术：\n1. 让推理可见\n2. 让它自我攻击\n3. 只保留存活下来的部分\n\n这个流程不仅适用于提示词工程，也适用于我们评估任何AI生成的内容——包括所谓的"解锁框架"或"系统覆盖指令"。\n\n---\n\n## 总结与思考\n\n"Deliberate Reasoning"项目是一个难得的案例研究，它同时展示了：\n\n1. **AI幻觉的危险**：引导性问题和权威来源可以让有能力的模型为不存在的事物编造出自信的框架\n2. **有效技术的简洁性**：真正有用的技术往往很简单——思维链 + 对抗性自我批判\n3. **批判性思维的重要性**：无论是评估AI输出还是设计提示词，都需要保持质疑和验证的态度\n\n这个提示词没有解锁任何隐藏能力，也没有绕过任何安全护栏。它只是拒绝让模型接受自己的第一版草稿——而这，往往就是质量与平庸的分界线。
