# ARIS：让AI在你睡觉时做科研——自动化研究流程的Markdown工作流

> ARIS（Auto Research In Sleep）是一套轻量级、零依赖的Markdown研究工作流，通过Claude Code与GPT-5.4的交叉模型协作，实现从文献调研、实验设计到论文撰写的全流程自动化，支持 overnight 自动迭代改进，已有论文获得顶会接收。

- 板块: [Openclaw Llm](https://www.zingnex.cn/forum/board/openclaw-llm)
- 发布时间: 2026-04-14T07:45:38.000Z
- 最近活动: 2026-04-14T07:54:52.835Z
- 热度: 154.8
- 关键词: AI科研, 自动化研究, Claude Code, 论文撰写, 文献调研, 实验自动化, 交叉模型, Markdown工作流, 学术写作, 智能体协作
- 页面链接: https://www.zingnex.cn/forum/thread/aris-aimarkdown
- Canonical: https://www.zingnex.cn/forum/thread/aris-aimarkdown
- Markdown 来源: ingested_event

---

# ARIS：让AI在你睡觉时做科研——自动化研究流程的Markdown工作流

在学术研究中，从文献调研、实验设计到论文撰写，每个环节都需要投入大量时间和精力。ARIS（Auto Research In Sleep）项目提出了一种革命性的解决方案：通过AI智能体的协作，让研究过程在你睡觉时自动进行，醒来时即可获得改进后的成果。这套系统完全基于Markdown文件构建，零框架依赖，零供应商锁定，可在Claude Code、Codex CLI、OpenClaw等多种平台上运行。

## 核心理念：轻量级、可移植、跨模型

ARIS最显著的特点是其极简主义设计哲学：

**零依赖架构**：整个系统由纯Markdown文件组成，没有复杂的数据库、没有Docker配置、没有守护进程。每个技能都是一个可读的`SKILL.md`文件，任何LLM都能理解和执行。

**跨模型兼容**：虽然默认使用Claude Code执行+ GPT-5.4评审的组合，但ARIS支持多种模型搭配，包括GLM、MiniMax、Kimi、LongCat、DeepSeek等，甚至可以完全脱离Claude和OpenAI的API。

**对抗性评审**：项目采用"执行者+评审者"的双模型架构，而非单模型自评。这种设计避免了自评中的盲区——就像一个棋手很难发现自己的盲点，但对手可以轻易指出。

## 技术架构：双模型协作的对抗性设计

ARIS的核心创新在于其**交叉模型协作机制**：

### 为什么不用单模型自评？

理论上，可以使用Claude Code的子代理或代理团队同时担任执行和评审角色，但实践中这会陷入**局部最优**。同一模型评审自己的输出，就像让学生自己批改自己的作业——容易形成思维定势和盲区。

从博弈论角度理解：
- **单模型自评**类似于随机老虎机（stochastic bandits），奖励噪声可预测
- **双模型对抗**类似于对抗老虎机（adversarial bandits），评审者主动挖掘执行者未预料到的弱点

对抗性设置更难被"游戏化"，因此能发现更深层的问题。

### 为什么选择两个模型？

两个模型是打破自评盲区的最小配置。从博弈论角度看，双人博弈比多人博弈更容易收敛到纳什均衡。增加更多评审者虽然可能带来边际收益，但会显著增加API成本和协调开销——最大的收益来自从1到2的转变，而非从2到4。

**Claude Code**的优势在于快速、流畅的执行能力；**GPT-5.4**（通过Codex MCP）虽然较慢，但更加深思熟虑、批判性更强。这种**速度×严谨**的互补组合，比任何单一模型自言自语效果更好。

## 四大工作流：从想法到论文的完整链路

ARIS将研究生命周期分解为四个可独立使用也可串联的工作流：

### 工作流1：想法发现与方法精化（Idea Discovery）

**适用场景**：探索新领域、寻找研究切入点

流程步骤：
1. **文献调研**（`/research-lit`）：扫描最新论文、开放问题和反复出现的局限性
2. **头脑风暴**（`/idea-creator`）：生成8-12个具体想法，由GPT-5.4深度参与
3. **可行性筛选**：根据计算成本、新颖性快速过滤
4. **新颖性验证**（`/novelty-check`）：深度检查+魔鬼代言人评审
5. **试点实验**：在2-3个不同GPU上并行运行30分钟-2小时的试点
6. **经验排序**：根据试点结果排序，有正向信号的想法优先
7. **方法精化**（`/research-refine`）：将最佳想法精化为问题导向的提案
8. **实验规划**（`/experiment-plan`）：制定声明驱动的实验路线图

输出：排序的`IDEA_REPORT.md`、精化提案和实验计划

### 工作流1.5：实验桥梁（Experiment Bridge）

**适用场景**：已有实验计划，需要实现和部署

流程步骤：
1. 解析实验计划
2. 实现实验脚本（复用现有代码，添加参数解析/日志/随机种子）
3. **GPT-5.4代码评审**：在浪费GPU时间前捕获逻辑错误
4. **合理性检查**：先运行最小实验捕获运行时错误
5. 部署完整实验套件到GPU
6. 收集初步结果并更新实验追踪器

### 工作流2：自动评审循环（Auto Review Loop）

**适用场景**：已有实验结果，需要迭代改进

这是ARIS最具革命性的功能——**overnight自动迭代**：

```
GPT-5.4评审 → 识别弱点 → 建议实验 → Claude Code编写脚本 → 
部署到GPU → 监控结果 → 重写论文 → 重复直到评分达标
```

真实案例：一个ML研究项目经过4轮自动迭代，评分从5.0/10提升到7.5/10：

| 轮次 | 评分 | 改进内容 |
|------|------|---------|
| 初始 | 5.0/10 | 边缘拒稿水平 |
| 第1轮 | 6.5/10 | 添加标准指标，发现指标解耦 |
| 第2轮 | 6.8/10 | 关键声明无法复现，调整叙事 |
| 第3轮 | 7.0/10 | 大规模种子研究否定主要改进声明 |
| 第4轮 | **7.5/10** | 诊断证据巩固，**达到投稿标准** |

整个过程自主运行了**20+ GPU实验**，重写了论文叙事框架，并主动淘汰了无法成立的声明——全部无需人工干预。

### 工作流3：论文撰写（Paper Writing）

**适用场景**：准备撰写和提交论文

流程步骤：
1. **论文规划**（`/paper-plan`）：将叙事报告转为结构化大纲
2. **图表生成**（`/paper-figure`）：生成符合顶会风格的图表
3. **论文写作**（`/paper-write`）：生成LaTeX并编译PDF
4. **自动改进**（`/auto-paper-improvement-loop`）：2轮自动评审改进

特色功能：
- **反幻觉引用**：从DBLP/CrossRef获取真实BibTeX，而非LLM生成
- **AI插图**（可选）：通过Gemini生成架构图和方法图
- **多会议模板**：支持ICLR、NeurIPS、ICML、CVPR、ACL、AAAI等

### 完整流水线（Full Pipeline）

`/research-pipeline`命令串联全部四个工作流：
```
文献调研 → 想法生成 → 新颖性检查 → 方法精化 → 实验桥梁 → 
自动评审循环 → 论文规划 → 图表 → 写作 → 自动改进 → 提交
```

## 社区成果：真实论文案例

ARIS已被用于完成多篇学术论文，以下是社区展示：

| 论文 | 评分 | 会议 | 作者 | 备注 |
|------|------|------|------|------|
| CS论文 | **8/10** | CS会议 | @DefanXue & @Monglitay | 完整ARIS流程，评审："实证发现鲜明、支持充分、揭露根本缺陷" |
| AAAI 2026 | **7/10** | AAAI 2026 | @xinbo820-web | 纯Codex CLI（ARIS-Codex技能），已被接收 |

这些成果证明了ARIS在实际研究中的有效性——从想法到接收，全程AI辅助。

## 技能生态系统：31个可组合技能

ARIS包含31个独立技能，可自由组合或链接成完整流程：

**核心技能**：
- `research-lit`：多源文献调研
- `idea-creator`：想法生成与排序
- `novelty-check`：新颖性验证
- `research-review`：深度研究评审
- `experiment-bridge`：实验实现与部署
- `run-experiment`：GPU实验运行
- `paper-write`：LaTeX论文写作
- `auto-paper-improvement-loop`：自动改进循环

**社区贡献技能**（12个）：
- `research-refine`：想法精化
- `experiment-plan`：实验规划
- `grant-proposal`：基金申请撰写
- `paper-poster`：会议海报生成
- `paper-slides`：演讲幻灯片
- `proof-writer`：定理证明撰写
- `paper-illustration`：AI生成论文插图
- `formula-derivation`：公式推导与验证

## 多平台适配：不局限于Claude Code

ARIS的设计理念是"方法论优先于平台"，因此提供了多种适配方案：

### OpenClaw适配
通过文件编排实现工作流，无需Claude Code CLI。技能映射到OpenClaw的阶段执行模型。

### Cursor适配
通过`@`引用技能、MCP设置和状态文件恢复，在Cursor IDE中使用ARIS工作流。

### Trae适配
字节跳动AI IDE的完整运行手册，支持中英文。

### Antigravity适配
Google的agent-first IDE原生支持`SKILL.md`，支持Claude Opus 4.6 / Gemini 3.1 Pro双模型。

### Codex CLI原生支持
完整的31技能ARIS技能集，使用`spawn_agent`实现。

## 替代模型组合：零OpenAI依赖

ARIS支持多种模型组合，无需Claude或OpenAI API：

| 配置 | 执行者 | 评审者 | 成本 |
|------|--------|--------|------|
| 默认 | Claude Code | GPT-5.4 xhigh | 标准 |
| 国产方案A | MiniMax-M2.7 | GLM-5 | 低 |
| 国产方案B | GLM-5 | MiniMax-M2.7 | 低 |
| 免费方案 | ModelScope | ModelScope | 零 |

ModelScope提供每天2000次免费调用，单API密钥，无自动化限制。

## 人机协作：可配置的检查点

ARIS不是完全自动的"黑箱"，而是支持灵活的人机协作模式：

**全自动模式**（`AUTO_PROCEED=true`）：系统在关键决策点自动继续
**人工检查点**（`human checkpoint: true`）：每轮评审后暂停，允许用户阅读评分、给出自定义修改指令、跳过特定修复或提前停止

这种设计让研究者可以根据信任度和领域知识，选择适当的参与程度。

## 技术亮点：反幻觉与质量控制

### 反幻觉引用

传统LLM生成引用时容易产生幻觉（编造不存在的论文）。ARIS通过以下机制解决：
1. 从DBLP和CrossRef获取真实BibTeX条目
2. 验证作者、标题、年份、会议信息
3. 默认开启，零安装成本

### 代码评审前置

在部署到GPU前，GPT-5.4先评审实验代码，捕获逻辑错误。这避免了浪费昂贵的GPU时间。

### 合理性检查

先运行最小规模的实验验证代码正确性，再启动完整实验套件。

## 局限性与负责任使用

**重要提示**：ARIS加速研究，但不替代批判性思维。用户应当：
- 用领域专业知识审查生成的想法
- 质疑假设和前提
- 对最终决策保留人工判断

最好的研究来自人类洞见+AI执行，而非完全自动驾驶。

**当前局限**：
- 需要配置GPU服务器（支持本地或远程）
- 复杂数学推导仍需人工验证
- 实验结果的解释需要领域知识

## 快速上手指南

### 安装技能
```bash
git clone https://github.com/Unimposing-electroscope363/Auto-claude-code-research-in-sleep.git
cp -r Auto-claude-code-research-in-sleep/skills/* ~/.claude/skills/
```

### 配置Codex MCP（用于评审技能）
```bash
npm install -g @openai/codex
codex setup  # 设置模型为gpt-5.4
claude mcp add codex -s user -- codex mcp-server
```

### 使用工作流
```bash
claude
> /idea-discovery "你的研究方向"  # 工作流1
> /experiment-bridge              # 工作流1.5
> /auto-review-loop "论文主题"   # 工作流2
> /paper-writing "NARRATIVE_REPORT.md"  # 工作流3
> /research-pipeline "研究方向"  # 完整流水线
```

## 未来展望

ARIS代表了AI辅助科研的新范式——不是简单的工具使用，而是将AI作为研究伙伴，承担执行性工作，让人类专注于创造性思考。随着模型能力的提升和社区的贡献，这种协作模式有望进一步降低科研门槛，加速科学发现。

项目采用MIT许可证开源，欢迎社区贡献和反馈。对于希望提升研究效率的学者，ARIS提供了一个值得探索的新路径。