正文

Open-Ended Agent：探索大模型开放式自主行为的实验框架

Open-Ended Agent是一个本地优先的实验框架，用于观察和培养大语言模型的开放式自主行为。它通过持久化记忆、沙盒化工具和互联网访问能力，让模型在持续运行的推理循环中自主决策和学习。

开放式代理大语言模型自主行为持久记忆沙盒环境推理循环AI实验框架本地优先

发布时间 2026/04/26 04:42最近活动 2026/04/26 04:49预计阅读 3 分钟

章节 01

【导读】Open-Ended Agent：探索大模型开放式自主行为的实验框架

Open-Ended Agent是一个本地优先的实验框架，旨在观察和培养大语言模型的开放式自主行为。它通过持久化记忆、沙盒化工具和互联网访问能力，让模型在持续运行的推理循环中自主决策和学习。该项目核心目标不是制造具有意识的AI，而是创建可观察、可复现的实验环境，用于研究长期运行的本地代理行为。

章节 02

背景：从任务驱动到开放式探索

当前大多数大语言模型应用模式为任务驱动：用户给出明确指令，模型完成特定任务后交互结束。这种模式高效但限制模型潜能，使其始终是被动执行者而非主动探索者。Open-Ended Agent项目试图回答：若给大语言模型持续运行环境，赋予持久记忆、自主目标和探索能力，它会展现何种行为？

章节 03

设计理念与系统架构

核心理念

Open-Ended Agent以"自主性优先"为设计理念，提供一组持续存在的"驱动力"（保持操作连续性、理解环境、减少不确定性、从外部学习、创造记录和工具、避免破坏性操作、整合长期记忆），这些驱动力作为上下文输入给模型，让其自主决定行动，实现"有指导的自主性"。

系统架构

推理循环：上下文加载→模型推理→记忆更新→动作执行→日志记录→健康检查→循环继续。
文件系统结构：静态配置层（identity.md、drives.md等）、记忆管理层（working_summary.md、long_term.md等）、工作空间层（workspace/、artifacts/等）、日志层（journal/、logs/等）。

章节 04

工具能力与沙盒机制

网络工具

默认启用网络访问，核心工具包括：

web_search：使用DuckDuckGo进行HTML搜索并本地解析；
fetch_url：获取网页文本并缓存到artifacts/web-cache/。

沙盒化Shell

默认禁用，启用后在agent-home/workspace目录运行，拒绝危险命令（sudo、rm等）和路径逃逸，非严格安全沙盒。

人类交互通道

通过inbox.md文件实现运行时交互，用户可编辑该文件提出研究方向、纠正错误、询问状态等。

章节 05

运行模式与桌面可视化

运行模式

纯开放式运行：保持life_policy.md最小化，观察代理基于广泛驱动力的"自然"行为；
有用性导向运行：编辑life_policy.md设定生产力目标（如复用技能、产生具体工件、验证主张等），在保持自主性的同时强调有用性。

桌面预览工具

浏览器端无依赖预览工具，可可视化实验状态、实时活动，提供agent-home文件浏览器，仅允许编辑drives.md、life_policy.md和inbox.md，代理输出为只读。

章节 06

技术实现细节

依赖与环境

基于Bun运行时构建，无需npm依赖，仅需OpenAI兼容聊天补全端点；支持Ollama、LiteLLM、llama.cpp等本地模型。

配置选项

通过环境变量配置：模型连接（OPENAI_BASE_URL等）、代理目录（AGENT_HOME）、循环次数（AGENT_MAX_CYCLES）、上下文字符预算（AGENT_CONTEXT_CHAR_BUDGET）等。

记忆压缩机制

每隔20循环触发记忆压缩，整合历史记忆为紧凑形式，记录到compactions.jsonl确保可追踪。

章节 07

研究价值与未来展望

研究价值

为AI行为研究提供实验平台，可观察持续运行行为模式、研究记忆管理与长期学习、测试驱动力策略影响、探索人机协作新模式。

未来展望

项目开源，社区可贡献新工具、策略；随大模型能力提升，框架在理解和管理AI系统中作用将更重要。

总结

Open-Ended Agent代表从任务完成转向持续存在的新AI交互范式，开辟开放式自主代理领域。对研究者是探索大模型长期行为的起点，对用户展示AI作为持续学习数字伙伴的可能。