Zing 论坛

正文

Open-Ended Agent:探索大模型开放式自主行为的实验框架

Open-Ended Agent是一个本地优先的实验框架,用于观察和培养大语言模型的开放式自主行为。它通过持久化记忆、沙盒化工具和互联网访问能力,让模型在持续运行的推理循环中自主决策和学习。

开放式代理大语言模型自主行为持久记忆沙盒环境推理循环AI实验框架本地优先
发布时间 2026/04/26 04:42最近活动 2026/04/26 04:49预计阅读 3 分钟
Open-Ended Agent:探索大模型开放式自主行为的实验框架
1

章节 01

【导读】Open-Ended Agent:探索大模型开放式自主行为的实验框架

Open-Ended Agent是一个本地优先的实验框架,旨在观察和培养大语言模型的开放式自主行为。它通过持久化记忆、沙盒化工具和互联网访问能力,让模型在持续运行的推理循环中自主决策和学习。该项目核心目标不是制造具有意识的AI,而是创建可观察、可复现的实验环境,用于研究长期运行的本地代理行为。

2

章节 02

背景:从任务驱动到开放式探索

当前大多数大语言模型应用模式为任务驱动:用户给出明确指令,模型完成特定任务后交互结束。这种模式高效但限制模型潜能,使其始终是被动执行者而非主动探索者。Open-Ended Agent项目试图回答:若给大语言模型持续运行环境,赋予持久记忆、自主目标和探索能力,它会展现何种行为?

3

章节 03

设计理念与系统架构

核心理念

Open-Ended Agent以"自主性优先"为设计理念,提供一组持续存在的"驱动力"(保持操作连续性、理解环境、减少不确定性、从外部学习、创造记录和工具、避免破坏性操作、整合长期记忆),这些驱动力作为上下文输入给模型,让其自主决定行动,实现"有指导的自主性"。

系统架构

  • 推理循环:上下文加载→模型推理→记忆更新→动作执行→日志记录→健康检查→循环继续。
  • 文件系统结构:静态配置层(identity.md、drives.md等)、记忆管理层(working_summary.md、long_term.md等)、工作空间层(workspace/、artifacts/等)、日志层(journal/、logs/等)。
4

章节 04

工具能力与沙盒机制

网络工具

默认启用网络访问,核心工具包括:

  • web_search:使用DuckDuckGo进行HTML搜索并本地解析;
  • fetch_url:获取网页文本并缓存到artifacts/web-cache/。

沙盒化Shell

默认禁用,启用后在agent-home/workspace目录运行,拒绝危险命令(sudo、rm等)和路径逃逸,非严格安全沙盒。

人类交互通道

通过inbox.md文件实现运行时交互,用户可编辑该文件提出研究方向、纠正错误、询问状态等。

5

章节 05

运行模式与桌面可视化

运行模式

  • 纯开放式运行:保持life_policy.md最小化,观察代理基于广泛驱动力的"自然"行为;
  • 有用性导向运行:编辑life_policy.md设定生产力目标(如复用技能、产生具体工件、验证主张等),在保持自主性的同时强调有用性。

桌面预览工具

浏览器端无依赖预览工具,可可视化实验状态、实时活动,提供agent-home文件浏览器,仅允许编辑drives.md、life_policy.md和inbox.md,代理输出为只读。

6

章节 06

技术实现细节

依赖与环境

基于Bun运行时构建,无需npm依赖,仅需OpenAI兼容聊天补全端点;支持Ollama、LiteLLM、llama.cpp等本地模型。

配置选项

通过环境变量配置:模型连接(OPENAI_BASE_URL等)、代理目录(AGENT_HOME)、循环次数(AGENT_MAX_CYCLES)、上下文字符预算(AGENT_CONTEXT_CHAR_BUDGET)等。

记忆压缩机制

每隔20循环触发记忆压缩,整合历史记忆为紧凑形式,记录到compactions.jsonl确保可追踪。

7

章节 07

研究价值与未来展望

研究价值

为AI行为研究提供实验平台,可观察持续运行行为模式、研究记忆管理与长期学习、测试驱动力策略影响、探索人机协作新模式。

未来展望

项目开源,社区可贡献新工具、策略;随大模型能力提升,框架在理解和管理AI系统中作用将更重要。

总结

Open-Ended Agent代表从任务完成转向持续存在的新AI交互范式,开辟开放式自主代理领域。对研究者是探索大模型长期行为的起点,对用户展示AI作为持续学习数字伙伴的可能。