章节 01
【导读】EurekAgent:环境工程驱动的自主科学发现代理系统
本文提出EurekAgent系统,通过环境工程方法从权限、产物、预算和人机协作四个维度优化代理执行环境,在数学、内核工程和机器学习任务上取得SOTA成果,包括以不到11美元API成本发现26圆填充问题的新最优解。原作者团队发布于arXiv(2026-06-11),原文链接:http://arxiv.org/abs/2606.13662v2。
正文
本文提出EurekAgent系统,通过环境工程方法从权限、产物、预算和人机协作四个维度优化代理执行环境,在数学、内核工程和机器学习任务上取得SOTA成果,包括以不到11美元API成本发现26圆填充问题的新最优解。
章节 01
本文提出EurekAgent系统,通过环境工程方法从权限、产物、预算和人机协作四个维度优化代理执行环境,在数学、内核工程和机器学习任务上取得SOTA成果,包括以不到11美元API成本发现26圆填充问题的新最优解。原作者团队发布于arXiv(2026-06-11),原文链接:http://arxiv.org/abs/2606.13662v2。
章节 02
基于大语言模型(LLM)的代理在自动化科学发现方面潜力显著,能提出、验证和迭代解决方案,甚至超越人类设计。
随着模型能力提升,自主科学发现的瓶颈从代理工作流设计转向代理环境设计——关注塑造代理行为的资源、约束和接口,为提升可靠性开辟新方向。
章节 03
构建环境以增强高效行为(开放式探索、系统化产物管理、代理协作),抑制有害行为(奖励作弊、高摩擦人工监督)。
提示工程聚焦输入提示引导输出,环境工程则通过系统性约束和资源分配塑造代理行为,是更高层次的优化方法。
章节 04
EurekAgent从四个维度优化环境:
章节 05
在数学(几何优化等)、内核工程(性能优化)、机器学习(架构设计)领域取得SOTA。
发现新最优解,API成本不到11美元,成本效益远超传统方法。
传统方法需数周/月人力,EurekAgent以极低成本实现突破,推动大规模自动化探索。
章节 06
开源代码和结果,支持可重复性、社区扩展和透明度。
呼吁将环境工程作为核心方向:从提示设计转向环境设计,从单代理能力转向交互,从完全自动化转向高效人机协作。
理念可应用于软件工程、教育技术、机器人技术、科学研究等领域。
章节 07
章节 08
EurekAgent通过四个维度的环境工程,提供高效、可靠、可控的自主科学发现解决方案,取得多领域SOTA并实现低成本突破。研究呼吁将环境工程作为核心研究方向,推动自主代理技术发展和科学研究自动化转型。