Zing 论坛

正文

aexp:面向AI研究者的实验控制平面

aexp是一款轻量级Go语言实验控制平面,为研究人员和编程智能体提供远程GPU实验管理方案,在保持SSH简洁性的同时,增加运行追踪、tmux执行、资源监控、结构化指标和MCP工具支持。

experiment managementGPUSSHtmuxMCPGoSQLiteremote executionagent-friendly开源
发布时间 2026/06/12 14:46最近活动 2026/06/12 14:53预计阅读 3 分钟
aexp:面向AI研究者的实验控制平面
1

章节 01

【导读】aexp:面向AI研究者的轻量级实验控制平面

aexp是一款基于Go语言开发的轻量级实验控制平面,专为研究人员和编程智能体设计,解决远程GPU服务器实验管理的痛点。它在保持SSH简洁性的同时,增加了运行追踪、tmux执行、资源监控、结构化指标和MCP工具支持,为远程实验提供结构化管理能力,尤其适合AI辅助科研场景。

2

章节 02

背景:远程GPU实验管理的痛点

传统远程GPU实验管理依赖SSH会话、nohup/tmux手动操作、日志路径记忆等方式,对人类用户已足够繁琐,对编程智能体更是灾难——会话变化后无法追踪提交内容、日志位置或运行状态。aexp正是为解决这一痛点而生。

3

章节 03

技术架构:简洁强大的设计选择

  • 技术栈:Go语言开发,带来单二进制文件、跨平台、高性能、静态编译等优势;
  • 数据存储:使用SQLite,零配置、单文件存储,便于备份迁移;
  • 远程执行:基于tmux作为后端,支持会话持久化、输出捕获、实时日志,且tmux在多数服务器预装。
4

章节 04

核心功能:SSH便利性+结构化管理能力

与原始SSH方式对比

需求 原始SSH方式 aexp方式
快速检查命令 ssh host ... aexp exec --resource gpu -- ...
启动长期实验 手动tmux/nohup aexp run submit ...
查找日志 记忆路径 aexp run logs <run_id>
查看资源 远程命令 Web仪表盘+资源快照
恢复上下文 shell历史重建 查询运行/事件/指标
区分运行类型 命名约定 原生`--kind setup

核心功能

  • 资源管理:注册SSH资源,配置环境/GPU标签等;
  • 运行提交:支持多种运行类型,自动检测环境;
  • 项目同步:集成rsync实现本地-远程文件同步;
  • 事件系统:结构化记录进度/参数/指标事件;
  • Web仪表盘:资源概览、实时日志、监控等。
5

章节 05

MCP集成:为编程智能体量身打造的接口

aexp原生支持Anthropic提出的MCP(Model Context Protocol)开放协议,便于智能体交互:

  • 安装命令aexp mcp install --target all(自动配置MCP工具);
  • 可用接口aexp_exec(快速检查)、aexp_submit_run(提交实验)、aexp_sync_push(同步文件)等;
  • 价值:解决智能体上下文丢失问题,实现实验管理的可编程与自动化。
6

章节 06

使用场景与快速上手指南

适用场景

  • 机器学习研究者:完整实验追踪、自动化日志/指标收集;
  • 智能体工作流:可靠提交/监控实验,会话间状态持久化;
  • 团队协作:共享SQLite数据库,查看彼此实验。

安装方式

  • 二进制curl -fsSL https://raw.githubusercontent.com/murasame612/aexp/main/scripts/install.sh | sh
  • 源码编译git clone ... && go build

常见工作流

  • 快速检查:aexp exec --resource gpu-box -- df -h /workspace
  • 提交实验:aexp run submit --resource gpu-box --kind formal ...
  • 监控运行:aexp run logs run_xxx --tail 100
7

章节 07

局限性与未来发展方向

当前局限

  • 主要针对SSH资源,未支持Docker/Slurm/Kubernetes等;
  • 开源版本保持简单:本地二进制+SQLite+SSH+tmux。

未来方向

  • 支持容器化执行(Docker);
  • 集成Slurm集群调度;
  • 本地执行模式;
  • 更丰富的可视化与实验对比工具。
8

章节 08

总结:连接研究者与计算资源的桥梁

aexp将SSH的灵活性与现代实验管理的结构化能力结合,通过MCP协议为智能体提供友好接口,是轻量级但功能完整的远程GPU实验管理方案。其开源特性与智能体友好设计,使其成为AI辅助科研工具的重要方向,未来将在连接人类研究者与计算资源中发挥更大作用。