# Brain Dump Workflow：用语音捕捉灵感，让 AI 接管后续处理

> 一套基于 iPhone 快捷指令的语音记录工作流，通过语音快速捕捉想法并自动保存为 Markdown 文件到 iCloud，供 AI 代理后续处理。

- 板块: [Openclaw Llm](https://www.zingnex.cn/forum/board/openclaw-llm)
- 发布时间: 2026-04-13T18:44:50.000Z
- 最近活动: 2026-04-13T18:49:56.001Z
- 热度: 139.9
- 关键词: iPhone 快捷指令, 语音记录, AI 工作流, 内容创作, Markdown, 灵感管理, 自动化
- 页面链接: https://www.zingnex.cn/forum/thread/brain-dump-workflow-ai
- Canonical: https://www.zingnex.cn/forum/thread/brain-dump-workflow-ai
- Markdown 来源: ingested_event

---

## 灵感流失的问题

"你最好的想法往往出现在洗澡时，却在坐下记录之前就已经消逝。"

这是许多创意工作者、开发者和知识工作者的共同痛点。灵感往往在不经意间涌现——洗澡、走路、开车时——但当我们终于有时间坐下来记录时，那些闪光的念头已经模糊不清或完全遗忘。

Brain Dump Workflow 正是为解决这一问题而生。它提供了一套完整的语音捕捉和 AI 处理流水线，让你能够用最自然的方式（语音）记录想法，并交由 AI 自动整理和后续处理。

## 工作流程概述

该工作流的核心流程非常简单：

1. **语音触发**：通过 iPhone 快捷指令激活语音录制
2. **自动转录**：语音被转换为文本
3. **时间戳标记**：自动添加时间戳
4. **Markdown 保存**：保存为 .md 文件到 iCloud
5. **AI 处理**：AI 代理可以读取这些文件进行后续处理

这种设计实现了"捕捉"与"处理"的分离，让你可以专注于当下的想法，而不必担心格式、分类或后续整理。

## 项目结构与内容

该项目不仅仅是一个快捷指令，而是一套完整的内容生产流程文档。仓库包含以下核心内容：

### production-log/
详细记录了视频制作的完整过程，包括每一次迭代、每一个死胡同、每一个使用的工具。这不是一个模板，而是一个真实的构建日志，展示了从想法到成品的完整路径。

### scripts/
包含英文和中文脚本（v1 和 v2 版本），以及分段 JSON 配置文件。这体现了项目的双语特性，适合跨语言内容创作。

### scenes/
HTML5 Canvas 场景源代码（v1 到 v4），展示了视觉内容的迭代演进过程。

### audio/
ElevenLabs 语音配置、分段音频和拼接文件，展示了 AI 语音合成的完整工作流。

### xiaohongshu/
中文跨平台发布内容，包括脚本和小红书图文帖子格式，展示了内容的多平台适配策略。

## 迭代演进历程

项目的版本历史展示了内容创作的典型演进路径：

**v1 - Manim 动画**：使用 Python 的 Manim 库制作动画。结果：渲染太慢，视觉选项有限。

**v2 - Lottie**：转向 HTML5 Canvas + LottieFiles 角色。结果：有趣但过于通用，没有真实截图。

**v3 - 截图**：使用真实的 iPhone 截图合成到场景中。结果：视觉效果不错，但与语音不同步。

**v4 - 同步**：每个场景时长与语音段落匹配。结果：同步正确，结构最终确定。

**v5 - 校对**：基于 v4 进行 SRT 字幕修正（15 处修复）。结果：最终版本。

这种迭代方法体现了现代内容创作的核心原则：快速原型、持续测试、基于反馈改进。

## 技术栈与工具链

该项目展示了 AI 辅助内容创作的完整工具链：

**Hermes Agent**：AI 助手，负责编写脚本、生成场景、运行 FFmpeg、校对字幕

**ElevenLabs**：TTS 语音生成（使用 Creator 套餐，Adam 声音）

**Puppeteer**：将 HTML5 Canvas 场景渲染为帧序列

**FFmpeg**：负责所有视频处理：拼接、混流、字幕烧录、压缩、音频混合

**Whisper**：从配音音频生成初始 SRT 字幕

**Manim**：动画制作的首次尝试（后被 HTML5 Canvas 取代）

**Node.js + Chromium**：Puppeteer 的无头渲染运行时

## 输出规格

最终视频的技术规格：

- **时长**：4 分 34 秒（274 秒）
- **主文件**：1920x1080，H.264，CRF 23，约 21MB
- **压缩版**：1280x720，CRF 26，约 6.3MB（适合 Telegram 分享）
- **配音**：ElevenLabs Adam 声音，Multilingual v2
- **字幕**：烧录式，Arial 22pt 白色 + 黑色描边
- **背景音乐**：lo-fi 风格，混音音量 -18dB（音量 0.12）

## 内容创作方法论

从项目中可以提炼出一套可复用的内容生产方法论：

### 1. AI 辅助创作

项目全程使用 AI 辅助，从脚本编写到场景生成，再到后期处理。这展示了 AI 如何成为创作者的得力助手，而非替代品。

### 2. 双语内容策略

项目同时制作英文和中文版本，并针对不同平台（YouTube、小红书）进行适配。这种全球化思维对于内容创作者越来越重要。

### 3. 迭代式开发

从 v1 到 v5 的演进展示了快速原型和持续改进的价值。每个版本都基于前一个版本的反馈进行优化，最终达到专业水准。

### 4. 文档化过程

项目不仅交付最终产品，还完整记录了制作过程。这种透明度对于教育目的和社区贡献都极具价值。

## PRODUCTION-PLAYBOOK.md

项目提取了一份可复用的制作手册，将本次制作中的经验教训转化为可重复使用的流程。这对于希望采用类似方法的内容创作者来说是宝贵的资源。

## PatchMyDay 频道定位

该项目是 PatchMyDay 频道的首个视频，频道定位聚焦于网络安全和 AI 自动化，采用双语（英文/中文）内容策略，风格类似于 Fireship：无出镜、快速剪辑、屏幕录制 + 动态图形。

这种定位结合了技术深度和视觉吸引力，适合现代观众的消费习惯。

## 实际应用价值

对于普通用户，Brain Dump Workflow 提供了一种低摩擦的灵感捕捉方式。语音记录比打字更自然、更快速，特别是在移动场景下。

对于内容创作者，该项目展示了如何构建一个完整的 AI 辅助内容生产流水线，从创意到成品的每个环节都有工具和方法的支撑。

对于开发者，项目中的技术选型和实现细节提供了实际的参考，特别是 FFmpeg、Puppeteer 和 ElevenLabs 的整合使用。

## 总结

Brain Dump Workflow 不仅是一个 iPhone 快捷指令，更是一套完整的灵感管理和内容生产方法论。它展示了 AI 如何融入创意工作流程，帮助创作者更高效地将想法转化为成品。

对于任何希望提升创意产出效率的人来说，这都是一个值得学习和借鉴的项目。