章节 01
MDAgent2:分子动力学领域首个端到端AI框架导读
北京大学团队发布MDAgent2,作为分子动力学领域首个端到端大语言模型框架,支持LAMMPS脚本自动生成与领域知识问答。通过三阶段后训练(持续预训练、监督微调、强化学习)及创新的MD-GRPO闭环强化学习机制,显著提升代码可执行性,降低MD模拟门槛,推动AI for Science在工业级模拟场景的应用。
正文
北京大学团队发布首个端到端分子动力学AI框架,支持LAMMPS脚本自动生成与领域知识问答,通过三阶段后训练与闭环强化学习显著提升代码可执行性。
章节 01
北京大学团队发布MDAgent2,作为分子动力学领域首个端到端大语言模型框架,支持LAMMPS脚本自动生成与领域知识问答。通过三阶段后训练(持续预训练、监督微调、强化学习)及创新的MD-GRPO闭环强化学习机制,显著提升代码可执行性,降低MD模拟门槛,推动AI for Science在工业级模拟场景的应用。
章节 02
分子动力学(MD)模拟是材料科学、生物物理和化学工程的核心研究手段,但编写高质量LAMMPS脚本需深厚领域知识与实践经验,门槛限制技术普及。通用大语言模型在该领域面临三大挑战:领域高质量数据稀缺、闭源模型部署成本高、生成代码缺乏可执行性验证,MDAgent2针对这些痛点设计。
章节 03
MDAgent2采用模块化多智能体架构,含MD-Instruct(知识问答与指令理解)和MD-Code(LAMMPS代码生成)两个领域模型。构建三个高质量数据集:MD-Knowledge(基础理论与概念)、MD-InstructQA(结构化问答对)、MD-CodeGen(自然语言与LAMMPS脚本配对),为模型训练提供坚实基础。
章节 04
采用渐进式三阶段训练:1.持续预训练(CPT):在MD相关文献和代码上无监督学习,建立领域语言理解;2.监督微调(SFT):用标注指令数据和代码对训练,实现自然语言转LAMMPS命令及回答专业问题;3.强化学习(RL):创新MD-GRPO方法,以模拟结果为奖励信号形成闭环反馈。
章节 05
MD-GRPO将LAMMPS模拟器纳入训练循环,融合代码生成与执行验证,关注代码实际执行行为。关键特性是低奖励轨迹回收:分析失败脚本的错误模式,提取中间信息用于后续训练,提升样本效率。
章节 06
开发MDAgent2-RUNTIME部署系统,整合代码生成、自动执行、结果评估、自我纠错模块,用户自然语言描述需求即可完成全流程。构建MD-EvalBench基准测试集,含代码生成和问答任务,评估代码可执行性与物理合理性。测试显示MDAgent2优于强基线模型。
章节 07
提供Python API、Web应用等使用接口,支持Docker部署,开源训练流程与微调脚本。未来有望扩展到量子化学等更多科学计算领域,帮助研究者聚焦物理问题设计与分析,助力教育普及。开源发布推动领域发展,期待更多参与。