# Claude Code 认知标注插件：用多智能体架构解析对话中的认知行为证据

> 一款基于 Claude Code 的插件，通过四个专门化的子智能体并行分析对话记录，提取执行功能、元认知、记忆与推理、用户心智模型四个维度的认知行为证据，为 AGI 研究提供结构化数据支持。

- 板块: [Openclaw Llm](https://www.zingnex.cn/forum/board/openclaw-llm)
- 发布时间: 2026-06-01T16:09:29.000Z
- 最近活动: 2026-06-01T16:20:46.076Z
- 热度: 152.8
- 关键词: Claude Code, 认知标注, 多智能体, AGI评估, 认知科学, 对话分析, 执行功能, 元认知, 心智模型
- 页面链接: https://www.zingnex.cn/forum/thread/claude-code-e0d07e10
- Canonical: https://www.zingnex.cn/forum/thread/claude-code-e0d07e10
- Markdown 来源: ingested_event

---

## 原作者与来源

- **原作者/维护者**: Haro3573
- **来源平台**: GitHub
- **原始标题**: cognitive-annotation-plugin
- **原始链接**: https://github.com/Haro3573/cognitive-annotation-plugin
- **发布时间**: 2026-06-01

## 背景：为什么需要认知标注？

随着大语言模型（LLM）在对话场景中的广泛应用，研究人员越来越需要理解人类与 AI 交互过程中的认知行为模式。传统的对话分析往往停留在表面语义层面，难以捕捉深层的认知过程——比如用户如何规划任务、如何监控自己的理解程度、如何调用背景知识进行推理，以及他们对 AI 系统的心智模型是如何演变的。

Google DeepMind 在 2026 年发布的论文《Measuring Progress Toward AGI: A Cognitive Framework》提出了一个关键观点：通用智能的评估应当基于认知科学的框架，将智能解构为多个可测量的认知能力维度。这一理论为对话分析提供了新的方法论基础。

## 项目概述：四智能体并行标注架构

cognitive-annotation-plugin 是一个纯 Claude Code 原生的插件系统，无需 Python、无需 API 密钥、无需外部依赖。它的核心设计是一个协调器技能（orchestrator skill）加上四个专门化的子智能体，每个子智能体负责一个认知维度的标注工作。

### 四大认知维度

| 智能体 | 标注维度 | 提取内容 |
|--------|----------|----------|
| **执行功能 (Executive Function)** | 执行功能行为 | 规划行为、抑制行为、切换行为 |
| **元认知 (Metacognition)** | 元认知过程 | 知识边界感知、信心校准、错误监控、监控-控制耦合 |
| **记忆与推理 (Memory & Reasoning)** | 记忆与推理模式 | 领域知识注入、演绎/归纳/溯因/类比推理 |
| **用户心智模型 (User Mental Model)** | 系统心智模型 | 系统模型更新、协作与说服策略 |

每个提取结果都包含证据引用、对话轮次索引、置信度评分（≥0.3）、平凡替代解释以及标注理由。这种细粒度的标注方式确保了科学严谨性。

## 技术实现：零依赖的 Claude Code 原生方案

### 系统架构

该插件采用分层架构设计：

1. **入口层**: `plugins/cognitive-annotation/skills/annotate/SKILL.md` 作为主入口，运行在 Claude Code 主会话线程中
2. **协调层**: 解析对话记录来源（文件路径、内联文本或会话上下文），依次调用四个子智能体
3. **执行层**: 四个子智能体在独立的隔离上下文中运行，使用 Sonnet 模型平衡标注深度与速度
4. **合并层**: 将四个子智能体的结果合并为统一的 JSON 结构

### 执行流程

```
用户调用 /cognitive-annotation:annotate <transcript>
    ↓
技能读取并解析对话记录
    ↓
依次调用四个子智能体（Agent 工具）
    ↓
合并结果 → 统一 JSON + 自然语言摘要
```

### 标注设计原则

该插件遵循四项核心设计原则：

**宽松提取原则**: 智能体在置信度 ≥0.3 时进行提取，并诚实报告置信度。在数据集中，假阴性是不可恢复的，而假阳性可以在下游过滤。

**平凡替代原则**: 每次提取都需要提供一个平凡替代解释。只有当平凡解释的合理性低于认知标签时，才保留认知标签。

**无模式填充原则**: 智能体被明确指示不要为了满足模式形状而每个子类别都产生一个提取。一个诚实的零值加上具体的 null_findings 解释，比虚构的提取更具科学价值。

**仅标注人类回合原则**: 所有四个智能体仅标注人类回合。AI 回合提供上下文，但不进行编码。

## 理论基础：认知科学的四大支柱

该插件的理论基础来自认知心理学和认知科学的经典研究：

### 执行功能
基于 Miyake 等人（2000）的更新/抑制/切换模型，关注工作记忆更新、认知抑制和任务切换能力。

### 元认知
基于 Nelson & Narens（1990）的监控与控制框架，关注个体对自身认知过程的觉察和调控。

### 记忆与推理
整合 Peirce 的推理类型（演绎、归纳、溯因）和 Gentner（1983）的结构映射理论，关注知识检索和推理策略。

### 用户心智模型
基于 Norman（1983）的交互系统心智模型理论，关注用户对系统工作原理的理解及其演变。

## 应用场景与实践价值

### 学术研究
为 AGI 评估提供结构化的对话认知数据，支持大规模的人机交互研究。

### 产品优化
帮助 AI 产品团队理解用户如何与系统交互，识别用户困惑点，优化对话设计。

### 教育技术
分析学习者与 AI 辅导系统的交互过程，评估学习者的元认知策略和问题解决能力。

### 临床辅助
在认知评估和康复训练中，提供标准化的对话认知分析工具。

## 与 Python SDK 的关系

该插件是同一流水线的 Claude Code 原生形式。还有一个独立的 Python 版本（`Cognitive_Annotation/main.py`）使用 Claude Agent SDK，通过 `asyncio.gather()` 实现真正的并行执行，并将结构化输出写入 `results.json`。

使用建议：
- 在 Claude Code 中进行交互式标注时使用插件
- 进行批处理或自动化时使用 Python 流水线

## 结语：迈向可测量的 AGI

cognitive-annotation-plugin 代表了一种新的研究范式：将认知科学理论与 LLM 能力相结合，构建可扩展、可复现的认知分析工具。它不仅是一个技术项目，更是通往 AGI 评估标准化道路上的一块重要基石。

随着人机交互日益深入，理解对话中的认知过程将成为 AI 研究的核心议题之一。这个插件为研究者和开发者提供了一个开箱即用的工具，让我们能够以科学严谨的方式探索智能的本质。