Zing 论坛

正文

自进化科学智能体:大模型驱动的物理推理控制器自动发现

研究提出由大语言模型驱动的自进化科学智能体工作流,通过迭代代码生成自动构建控制器。在双关节仿生鱼游泳控制任务中,智能体从零开始发现并优化出可解释、可泛化的控制策略。

科学智能体大语言模型代码生成物理推理控制器设计流固耦合可解释AI
发布时间 2026/06/07 09:59最近活动 2026/06/09 11:53预计阅读 2 分钟
自进化科学智能体:大模型驱动的物理推理控制器自动发现
1

章节 01

【导读】自进化科学智能体:大模型驱动的物理推理控制器自动发现

原作者/维护者:论文研究团队 来源平台:arXiv 原文标题:Self-Evolving Scientific Agent Discovers Generalizable Physically-Reasoned Fluid Control 原文链接:http://arxiv.org/abs/2606.08405v1 发布时间:2026年6月7日

核心观点:研究提出大语言模型驱动的自进化科学智能体工作流,通过迭代代码生成自动构建控制器,在双关节仿生鱼游泳控制任务中,从零开始发现并优化出可解释、可泛化的控制策略。

2

章节 02

科学发现的自动化困境

数据密集型深度强化学习能优化复杂控制策略,但物理系统的科学发现需要可解释的推理链条——连接物理证据到结构化控制架构。传统方法调整神经网络权重学习策略,虽有效但控制器多为黑箱,难以理解验证。

科学发现不仅要找到可行方案,更需理解“为什么能工作”,纯粹数据驱动方法在此场景面临挑战。

3

章节 03

自进化科学智能体工作流

研究提出大语言模型驱动、迭代代码生成实现的自进化科学智能体工作流,核心创新是直接操作源代码层面的控制策略,而非调整权重。

工作流程三阶段:

  1. 部署与观察:将候选策略部署到物理仿真,主动诊断动态行为(类似科学家有意识观察系统响应);
  2. 多模态证据分析:从运动轨迹、受力、能量变化等多模态数据提取物理洞察,转化为物理概念层面理解;
  3. 代码级策略优化:基于观察生成改进的控制器代码,使策略完全可读、可验证。
4

章节 04

验证任务:双关节仿生鱼的游泳控制

验证场景选择欠驱动双关节仿生鱼(dogfish swimmer),仅通过关节角加速度控制到达目标位置(非线性流固耦合问题)。

初始条件:从有单侧转向偏置的缺陷种子策略开始,需自主发现统一控制器以到达各方向目标。

泛化能力:

  • 无需重新训练或目标特定分支,泛化到未见过的静态目标;
  • 处理动态弯曲追击轨迹,适应复杂运动; 泛化源于物理推理基础,非记忆或插值。
5

章节 05

可解释的控制架构

通过审计进化日志,智能体自主发现的控制架构组件:

  • 行波推进:利用身体波动产生推进力;
  • 体坐标目标引导:在鱼体坐标系计算目标方向;
  • 偏航率反馈:根据转向速率调整动作;
  • 带符号平均尾部曲率:利用尾部形态信息;
  • 自适应节奏缓解:动态调整运动节奏。

这些组件以清晰数学形式存在于代码中,完全可审计、可验证。

6

章节 06

研究意义与启示

研究展示自主科学智能体将物理证据转化为鲁棒、数学可读控制策略的能力,保持可追溯的科学发现过程。

意义:

  • 科学自动化:从“黑箱优化”到“白箱推理”的范式转变,未来智能体可辅助/主导科学发现,保持结果可解释性与可验证性;
  • 机器人学与控制理论:提供新路径——利用大模型推理能力生成具物理直觉的控制策略,而非纯数据拟合。