Zing 论坛

正文

大语言模型与遗传编程结合:自动发现可解释卡尔曼滤波器变体

苏黎世联邦理工学院研究团队提出了一种结合大语言模型与笛卡尔遗传编程的新方法,能够从原始数据中自动发现并优化卡尔曼滤波算法,在对抗性环境下表现优于传统卡尔曼滤波器。

大语言模型遗传编程卡尔曼滤波器符号回归算法发现可解释AI进化计算状态估计DeepSeekFunSearch
发布时间 2026/05/18 10:43最近活动 2026/05/18 10:49预计阅读 2 分钟
大语言模型与遗传编程结合:自动发现可解释卡尔曼滤波器变体
1

章节 01

【导读】大语言模型与遗传编程结合:自动发现可解释卡尔曼滤波器变体

苏黎世联邦理工学院研究团队提出结合大语言模型(LLM)与笛卡尔遗传编程的新方法,能从原始数据中自动发现并优化卡尔曼滤波算法。该方法在对抗性环境下表现优于传统卡尔曼滤波器,且生成的符号化表达式具有可解释性,为经典算法的自动改进提供了新范式。

2

章节 02

研究背景与动机

卡尔曼滤波器自1960年以来是状态估计领域基石,但依赖精确系统建模,面对模型不匹配、非线性系统、非高斯噪声等挑战时表现受限。近年来,FunSearch等研究显示LLM与进化算法结合可自动发现复杂数学结构和算法,启发团队探索将该范式应用于卡尔曼滤波器,核心问题是:能否让AI自动重新发现并改进卡尔曼滤波器?

3

章节 03

核心方法论

采用两种互补进化搜索策略:

  1. 笛卡尔遗传编程(CGP):基于图的遗传编程变体,用固定大小基因型网格表达状态更新方程,生成紧凑可解释符号表达式。
  2. LLM辅助的FunSearch风格突变:集成DeepSeek-R1-Distill-Qwen-14B模型,根据种群最佳程序生成语义有意义的代码变体,结合LLM代码理解与进化探索能力。 实验设置:4×NVIDIA H100 GPU、64核CPU节点,每个实验约3天,模型最大生成长度3024 token,4个独立进化岛并行。
4

章节 04

实验设计与评估框架

设计两组核心实验:

  1. 理想条件评估:线性动态系统+高斯噪声场景,验证能否从输入输出轨迹重新发现经典卡尔曼更新规则,用均方误差(MSE)对比理论最优解。
  2. 对抗性与非理想条件评估:测试鲁棒性,包括观测延迟、非线性系统、非高斯噪声(重尾/偏态)等传统卡尔曼滤波器难处理的场景。
5

章节 05

关键发现与成果

  1. 近乎最优的算法恢复:纯CGP或LLM辅助搜索均能从数据中重新发现类似卡尔曼的更新规则,理想条件下性能接近理论最优。
  2. 超越经典卡尔曼滤波器:非理想条件下,进化发现的符号程序系统性优于传统卡尔曼滤波器,能自动适应模型失配。
  3. 可解释性优势:输出为符号化、人类可读的数学表达式,工程师可理解验证逻辑,优于黑箱神经网络。
6

章节 06

实际应用价值与意义

  • 控制理论贡献:数据驱动方法可自动探索算法空间,发现人类专家可能忽略的改进方案,突破传统依赖数学功底和领域知识的设计模式。
  • 工程实践启示:适用于系统动态未知/时变、噪声复杂难参数化、需平衡性能与效率、要求可解释性的场景。
  • 方法论启发:LLM(如14B参数的DeepSeek模型)可作为"智能突变算子"参与进化计算,为神经符号AI开辟新方向。
7

章节 07

局限性与未来方向

局限性:计算成本高(每实验约3天GPU时间)、问题特定性(针对卡尔曼滤波定制)、缺乏收敛理论保证。 未来方向:探索更高效LLM调用策略、应用于其他经典算法(如PID控制器、粒子滤波器)、结合神经网络与符号程序、开发LLM辅助进化的收敛理论框架。