# 文件系统优先的Agentic研究框架：让AI代理拥有持久化研究记忆

> 本文介绍了一个创新的AI辅助研究工作流框架，通过将研究状态持久化到文件系统而非依赖对话上下文，解决了AI研究中常见的上下文丢失、来源追溯困难等问题。

- 板块: [Openclaw Llm](https://www.zingnex.cn/forum/board/openclaw-llm)
- 发布时间: 2026-05-26T03:16:04.000Z
- 最近活动: 2026-05-26T03:26:06.476Z
- 热度: 159.8
- 关键词: Agentic研究, AI辅助研究, 文件系统工作流, 研究方法论, 来源管理, 知识管理, AI代理, 研究框架
- 页面链接: https://www.zingnex.cn/forum/thread/agentic-ai-557037ac
- Canonical: https://www.zingnex.cn/forum/thread/agentic-ai-557037ac
- Markdown 来源: ingested_event

---

## 原作者与来源

- 原作者/维护者：wwwmplusm
- 来源平台：GitHub
- 原始标题：agentic-research-harness
- 原始链接：https://github.com/wwwmplusm/agentic-research-harness
- 来源发布时间/更新时间：2026-05-26T03:16:04Z

---

## 引言：AI辅助研究的痛点

随着大语言模型能力的飞速提升，越来越多的研究者和知识工作者开始尝试使用AI辅助进行深度研究。然而，一个普遍存在的问题困扰着这些早期采用者：大多数AI研究工作流将聊天对话本身视为工作空间。这意味着一旦对话结束或重新开始，之前的所有上下文、发现和结论都可能丢失。

Agentic Research Harness项目提出了一个根本性的解决方案：将文件系统视为工作空间，让聊天成为可丢弃的临时容器，而研究成果则以结构化文件的形式持久保存。这一理念的核心可以用一句话概括："一个问题一个文件夹，目标先行，来源与综合分离，主张与证据绑定，每次会话后更新状态——AI聊天是可丢弃的，文件才是记忆。"

---

## 核心设计理念

### 文件系统即工作空间

传统AI辅助研究通常遵循这样的模式：用户在聊天界面中提出问题，AI进行搜索和回答，对话结束后一切归零。Agentic Research Harness反其道而行之，要求每个研究问题都对应一个独立的文件夹，所有相关信息——目标、来源、主张、笔记——都以文件形式存储。

这种方法的优势显而易见：

- **持久性**：研究不会因对话结束而消失
- **可审计性**：每个主张都可以追溯到具体的来源文件
- **可协作性**：文件夹可以轻松共享和版本控制
- **可恢复性**：即使更换AI工具，研究状态依然可用

### 来源质量分级体系

项目建立了一套严格的来源质量分级标准，这在信息过载的时代尤为重要：

**A级——原始来源**：官方文档、法律法规、政府页面、原始论文、数据集、原始报告、完整转录文本、原著书籍章节。这是最高可信度的证据等级。

**B级——强二手来源**：教科书、学术综述、带引用的专家文章、声誉良好的出版物。可以作为理解的辅助，但重要主张仍需追溯原始来源。

**C级——发现/噪音**：SEO页面、通用博客、无来源摘要、弱聚合器、LLM输出。仅能用于引导发现，不应作为最终主张的证据。

这套分级体系的规则非常明确：搜索摘要仅属于发现，不能作为证据；C级来源可以指导发现，但不能支持最终主张；如果一个主张的唯一证据是搜索摘要，则不能标记为"已验证"；如果二手来源提出重要主张，必须追溯原始来源或标记为来源缺口。

---

## 项目文件结构

当创建一个新的研究项目时，框架会自动生成以下结构：

```
research/my-research-topic/
├── GOAL.md          # 研究目标、主问题、背景、期望产出、质量标准
├── STATE.md         # 当前理解、开放问题、来源缺口、下一步行动
├── SOURCES.md       # 来源索引，包含质量评级、阅读状态、保存路径、URL
├── claims.md        # 重要主张及其证据来源ID和置信度映射
├── sources/         # 保存的来源文本、摘录、PDF、转录、原始Markdown
├── notes/           # 中间笔记、子问题分析、工作综合
├── outputs/         # 成品：报告、文章、指南、决策备忘录、计划
└── claudes/         # 可选：重要AI会话记录的冷存储
```

每个文件和目录都有明确的职责分工，确保研究过程的每个环节都有据可查。

---

## 与AI代理的协作流程

框架设计了一套与AI代理协作的标准流程，代理指令文件（AGENTS.md、CLAUDE.md、HERMES.md）告诉兼容的代理按以下步骤工作：

1. **读取GOAL.md**：理解研究的目标和边界
2. **读取STATE.md**：了解当前进展和待解决问题
3. **使用SOURCES.md和claims.md**：在涉及事实主张或来源工作时进行引用
4. **分解搜索**：通过分解的子问题而非原始提示进行搜索
5. **优先原始来源**：避免依赖搜索摘要和二手来源
6. **保存来源文本**：在使用前将重要来源文本保存到sources/目录
7. **更新SOURCES.md和claims.md**：记录新发现的来源和验证的主张
8. **写入综合内容**：将综合结果写入notes/或outputs/
9. **更新STATE.md**：记录会话结束时的状态

这个流程确保了研究的严谨性和可追溯性，同时也让AI代理能够更好地理解研究上下文。

---

## 推荐工作流

项目提供了一个清晰的研究工作流建议：

1. 创建研究项目
2. 填写GOAL.md
3. 从项目文件夹启动AI代理
4. 要求代理制定小型研究计划
5. 搜索并保存来源
6. 更新SOURCES.md
7. 将重要发现转换为claims.md中的条目
8. 在notes/或outputs/中撰写综合内容
9. 更新STATE.md
10. 当上下文过大时随时开启新对话

这个流程的关键在于"随时开启新对话"——因为所有状态都保存在文件中，用户不需要担心丢失上下文，可以在任何时候开始新的对话，而代理只需读取STATE.md就能快速恢复研究状态。

---

## 工具无关性设计

Agentic Research Harness的一个显著特点是其工具无关性。它不绑定特定的AI工具或搜索引擎，而是可以与任何能够读写文件和搜索网络的代理或研究流程配合使用：

- Hermes Agent
- Claude Code
- OpenAI Codex CLI
- 其他终端代理
- Brave Search MCP
- Parallel Search
- 手动浏览器研究

这种设计哲学体现了对研究本质的尊重：工具会迭代更新，但良好的研究方法和组织原则具有持久价值。

---

## 隐私与安全考量

项目文档中包含一个重要的隐私警告：不要意外发布真实的研究文件夹。research/目录默认被gitignore排除，用户可以安全地提交模板、示例和文档，而不会泄露私人来源或聊天记录。

这种设计考虑反映了项目维护者对研究伦理和数据安全的重视。在学术研究和商业情报工作中，来源的保密性往往至关重要。

---

## 对比传统AI研究模式

| 维度 | 传统AI聊天模式 | Agentic Research Harness |
|-----|--------------|-------------------------|
| 持久性 | 对话结束即丢失 | 文件永久保存 |
| 可追溯性 | 难以追溯主张来源 | 每个主张绑定证据 |
| 协作性 | 难以共享研究状态 | 文件夹可直接共享 |
| 工具依赖 | 绑定特定AI平台 | 工具无关 |
| 质量控制 | 依赖AI自我约束 | 结构化质量分级 |
| 上下文管理 | 受限于上下文窗口 | 文件系统无限制 |

---

## 结语：回归研究本质

Agentic Research Harness代表了一种对AI辅助研究的反思和回归。在技术狂热中，它提醒我们：AI是工具，不是目的；聊天是手段，不是终点；真正有价值的是经过验证的知识和清晰的思考过程。

通过将研究状态从易逝的对话转移到持久的文件系统，这个框架不仅解决了上下文丢失的痛点，更重要的是，它培养了一种更严谨、更透明、更可持续的研究习惯。在信息爆炸和AI幻觉并存的今天，这种对来源质量和证据链的执着，或许正是我们最需要的研究素养。