正文

MDAgent2：面向分子动力学领域的代码生成与知识问答大模型框架

北京大学团队发布首个端到端分子动力学AI框架，支持LAMMPS脚本自动生成与领域知识问答，通过三阶段后训练与闭环强化学习显著提升代码可执行性。

分子动力学LAMMPS代码生成大语言模型AI for Science强化学习科学计算北京大学

发布时间 2026/04/11 23:14最近活动 2026/04/11 23:18预计阅读 2 分钟

章节 01

MDAgent2：分子动力学领域首个端到端AI框架导读

北京大学团队发布MDAgent2，作为分子动力学领域首个端到端大语言模型框架，支持LAMMPS脚本自动生成与领域知识问答。通过三阶段后训练（持续预训练、监督微调、强化学习）及创新的MD-GRPO闭环强化学习机制，显著提升代码可执行性，降低MD模拟门槛，推动AI for Science在工业级模拟场景的应用。

章节 02

项目背景与研究动机

分子动力学（MD）模拟是材料科学、生物物理和化学工程的核心研究手段，但编写高质量LAMMPS脚本需深厚领域知识与实践经验，门槛限制技术普及。通用大语言模型在该领域面临三大挑战：领域高质量数据稀缺、闭源模型部署成本高、生成代码缺乏可执行性验证，MDAgent2针对这些痛点设计。

章节 03

核心架构与技术创新

MDAgent2采用模块化多智能体架构，含MD-Instruct（知识问答与指令理解）和MD-Code（LAMMPS代码生成）两个领域模型。构建三个高质量数据集：MD-Knowledge（基础理论与概念）、MD-InstructQA（结构化问答对）、MD-CodeGen（自然语言与LAMMPS脚本配对），为模型训练提供坚实基础。

章节 04

三阶段后训练策略

采用渐进式三阶段训练：1.持续预训练（CPT）：在MD相关文献和代码上无监督学习，建立领域语言理解；2.监督微调（SFT）：用标注指令数据和代码对训练，实现自然语言转LAMMPS命令及回答专业问题；3.强化学习（RL）：创新MD-GRPO方法，以模拟结果为奖励信号形成闭环反馈。

章节 05

MD-GRPO闭环强化学习机制

MD-GRPO将LAMMPS模拟器纳入训练循环，融合代码生成与执行验证，关注代码实际执行行为。关键特性是低奖励轨迹回收：分析失败脚本的错误模式，提取中间信息用于后续训练，提升样本效率。

章节 06

部署系统与基准测试

开发MDAgent2-RUNTIME部署系统，整合代码生成、自动执行、结果评估、自我纠错模块，用户自然语言描述需求即可完成全流程。构建MD-EvalBench基准测试集，含代码生成和问答任务，评估代码可执行性与物理合理性。测试显示MDAgent2优于强基线模型。

章节 07

实际应用与未来展望

提供Python API、Web应用等使用接口，支持Docker部署，开源训练流程与微调脚本。未来有望扩展到量子化学等更多科学计算领域，帮助研究者聚焦物理问题设计与分析，助力教育普及。开源发布推动领域发展，期待更多参与。

MDAgent2：面向分子动力学领域的代码生成与知识问答大模型框架

MDAgent2：分子动力学领域首个端到端AI框架导读

项目背景与研究动机

核心架构与技术创新

三阶段后训练策略

MD-GRPO闭环强化学习机制

部署系统与基准测试

实际应用与未来展望

继续阅读

Nornir MCP Server：将大语言模型引入网络自动化的企业级桥梁

Bibliothèque Française LLM：为大型语言模型优化的法语公版文献索引系统

Splinter：一款无锁零拷贝的共享内存 KV 与向量存储库，让 LLM 推理告别 socket 与 memcpy 开销

Folkering OS：当操作系统本身就是 AI——一个能自我进化的裸机 Rust 系统