章节 01
深度技能认知架构:突破AI表面推理的核心方案
深度技能是一套开源的认知架构,包含16种结构化技能,旨在解决大语言模型的“过早收敛”问题,通过改变认知模式强制模型进行深度思考,释放其已有知识潜力,提升推理质量与输出可靠性。
正文
一套开源的认知架构,通过16种结构化技能强制语言模型进行深度思考,而非停留在统计最可能的答案上。
章节 01
深度技能是一套开源的认知架构,包含16种结构化技能,旨在解决大语言模型的“过早收敛”问题,通过改变认知模式强制模型进行深度思考,释放其已有知识潜力,提升推理质量与输出可靠性。
章节 02
当我们向大语言模型提问时,一个答案往往在几毫秒内就形成了。这不是因为它进行了深入探索,而是因为收敛压力奖励了早期停止。模型倾向于选择统计上最可能的回答,而更深层的思考路径——跨领域的概念连接、非显而易见的框架转换、需要综合多领域知识的解决方案——从未被激活。
这种现象被称为"过早收敛"(Premature Closure)。模型并非不具备深层知识,而是没有任何机制强制搜索进入那些深层路径。大多数技能库试图通过增加步骤来解决这个问题,但深度技能(depth-skills)采用了不同的策略:改变认知模式本身。
章节 03
深度技能是一套开源的认知架构,包含16种结构化技能,专门设计用于强制语言模型超越表面推理。与添加工作流程步骤不同,这些技能改变了模型在生成答案之前的思考方式。每个技能都针对过早收敛的不同维度,创建强制性的书面产物,这些产物进入上下文窗口并物理性地改变模型接下来生成的内容。
这套架构的核心理念是:不是让AI更聪明,而是让AI使用更多它已经拥有的知识。语言模型通常只使用其知识深度的60-75%,因为早期答案受到奖励,而用户很少推动模型深入思考。深度技能就是强制函数,它们确保在答案形成之前,深层路径已经被激活。
章节 04
深度技能将16种技能组织成六个功能层级,每个层级解决特定类型的认知问题:
Conductor(指挥者) 是整个系统的编排层,负责选择和排序其他技能。当面对复杂任务时,指挥者决定调用哪些技能、以什么顺序调用,确保认知资源得到最优配置。
这一层解决"如何更深入搜索"的问题,包含四个核心技能:
Deep-think(深度思考) 是系统的核心协议。当面对复杂问题或感觉第一个答案过于简单时,这个技能强制模型在生成答案之前激活更深层的知识路径。它通过创建中间思考产物来物理性地改变生成过程。
Adversary(对抗者) 引入自我反对机制。在任何重大决策或执行计划之前,这个技能要求模型主动寻找自己推理中的漏洞、弱点和未考虑的边缘情况。它不是简单的"检查答案",而是在答案形成之前就植入怀疑和审视。
Diverge(发散) 针对"最佳方式是什么"这类问题。当面对架构选择或策略决策时,这个技能强制模型探索多条路径,而非急于选择第一条看似合理的路径。它对抗的是"模式引力"——即倾向于选择最熟悉模板的倾向。
Descend(下降) 用于"什么都不管用"或"熟悉的解决方案感觉不对"的情况。它要求模型回到第一性原理,重新推导问题的本质,验证问题是否被正确理解,而非在错误的问题定义上优化答案。
这一层解决"挖掘什么"的问题,专注于发现隐藏的假设和盲点:
Excavate(挖掘) 进行假设考古学。在高风险计划中,它强制模型明确列出所有隐含的假设,包括那些被视为理所当然的信念。
Invert(反转) 针对"我们别无选择"或"我们确定吗"的情况。它通过反转约束条件和信念来打破思维定势,寻找被忽视的替代方案。
Reframe(重构) 处理"卡住"的状态。当问题看起来只有一种解法时,这个技能强制创建多种问题表述,从不同的角度重新框定问题。
Negative-space(负空间) 是缺席检测器。它不检查已有什么,而是寻找缺失什么。在问"这是否完整"时,它专门探测注意力盲区——即模型从未照亮的维度空间。
这一层解决"如何信任输出"的问题:
Contradict(矛盾检测) 是多部分计划的连贯性审计器。它检查长答案、设计文档中的内部一致性,寻找自相矛盾的地方。
Provenance(溯源) 是证据标记器和信心校准器。当问"这是真的吗"或"你有多确定"时,它要求模型明确区分事实、推断和猜测,避免认识论扁平化——即以相同的信心对待不同类型的知识。
Fidelity(保真) 验证压缩完整性。在"总结"或"TLDR"任务中,它确保复杂分析被压缩后仍然保持核心含义不丢失。
这一层解决"如何控制过程"的问题:
Anchor(锚定) 是目标漂移检测器。在长时间任务、多步执行中,它持续检查是否偏离了原始目标,对抗范围蔓延。
Threshold(阈值) 是承诺网关。在不可逆决策、模式变更、API合约确定之前,它强制进行额外的审查层,确保后果与决策的重要性相匹配。
这一层解决"如何推理整体"的问题:
Emergence(涌现) 是交互层级分析器。在多组件系统、集成场景中,它专门分析组件交互产生的涌现性质,而非仅仅关注单个组件。
Temporal(时间) 是跨时间推理器。在架构决策、技术选择中,它强制考虑时间维度——决策如何随时间演变,长期后果是什么。
章节 05
深度技能的设计允许链式组合,针对不同类型的任务有推荐的技能序列:
深度架构决策:指挥者 → 深度思考 → 发散 → 对抗者 → 阈值
解决卡住的问题:下降 → 重构 → 反转 → 发散
高风险交付:深度思考 → 对抗者 → 矛盾检测 → 溯源 → 保真
检查完整性:负空间 → 挖掘 → 涌现
不可逆承诺前:阈值 → 对抗者 → 时间 → 完整指挥者序列
这种组合不是简单的工作流程,而是认知模式的层层叠加。每个技能都改变模型的激活状态,下一个技能在此基础上继续深化。
章节 06
深度技能与主流AI开发工具完全兼容:
~/.claude/skills/.cursor/rules/ 或粘贴到系统提示~/.gemini/skills/.github/copilot-instructions/.windsurf/rules/安装可以通过npm完成:npx skills add Kshitijpalsinghtomar/depth-skills,或者直接克隆仓库手动配置。
章节 07
深度技能提供了内置的评估协议。用户可以从20个真实世界挑战中选择测试用例,分别在没有技能(对照组)和有目标技能(实验组)的情况下运行,使用0-10分的深度评分标准比较差异。这种社区驱动的验证方法确保技能的有效性可以被独立验证。
章节 08
深度技能与流程库(如Superpowers、GSD)和工具集成(如Playwright、AWS)有本质区别。流程库添加工作流步骤,工具集成连接外部系统,而深度技能改变的是模型在每个步骤内的思考质量。
一个像"深度思考"这样的技能不是添加审查步骤,而是防止答案在深层路径被激活之前形成。"负空间"不是检查已有什么,而是找到缺失什么。"下降"不是批评答案,而是验证问题是否在任何答案形成之前就被正确识别。
这些技能可以与流程和工具库组合使用。用Superpowers进行TDD纪律,用深度技能提升每个步骤内的思考质量。
对于AI代理开发者和使用者,深度技能提供了一种系统性的方法来提升输出质量。它不需要更换模型或增加计算资源,而是通过结构化的认知干预,让现有模型发挥更大潜力。
在高风险场景——如医疗诊断辅助、法律分析、安全关键代码审查、复杂商业决策——深度技能的价值尤为明显。它提供的不是绝对保证,而是系统性的深度保障,确保模型不会在应该深入思考的时候停留在表面。
对于研究人员,这套架构提供了一个可测试、可迭代的框架,用于理解和改进语言模型的推理过程。每个技能都是可组合的、可版本化的,并且可以通过社区评估持续改进。
深度技能代表了一种新的AI交互范式。与其接受模型的第一反应,不如通过结构化的认知技能强制深度探索。这种方法承认了一个基本事实:语言模型的知识深度远超其默认使用深度,关键在于创造正确的条件来释放这种深度。
随着AI代理在更复杂、更高风险的场景中部署,类似深度技能这样的认知架构将变得越来越重要。它们提供了一种在现有技术基础上提升可靠性和质量的路径,而不需要等待下一代模型的出现。
对于希望提升AI代理输出的开发者和团队,深度技能提供了一个立即可用的工具箱。从"深度思考"技能开始,逐步探索其他技能,根据具体场景构建适合自己的技能组合,这可能是提升AI应用质量的最具成本效益的方式之一。