正文

EHRGym：医疗 AI 智能体的训练沙盒，让计算机学会操作电子病历系统

EHRGym 是一个容器化的强化学习环境，专门用于训练和评估能够在类 Epic 电子病历系统中执行临床工作流的计算机使用智能体，支持 GRPO 训练并与 TRL 框架原生集成。

EHRGym医疗AI电子病历强化学习OpenEnvGRPO计算机使用智能体临床工作流合成数据

发布时间 2026/04/04 04:45最近活动 2026/04/04 04:49预计阅读 2 分钟

章节 01

导读：EHRGym——医疗AI智能体的训练沙盒

EHRGym是容器化强化学习环境，专为训练能操作类Epic电子病历系统的计算机智能体设计，支持GRPO训练与TRL框架集成，解决医疗AI落地中真实EHR交互复杂、合规敏感的核心障碍，提供真实安全的训练场景。

章节 02

人工智能在医疗领域转化困难，关键在于真实电子病历系统（EHR）界面复杂、数据敏感且合规要求严格，研究人员难以直接训练测试智能体；传统模拟方案无法捕捉多步骤决策、跨模块导航等真实工作流细节。

章节 03

采用双服务容器化设计：Next.js EHR应用模仿Epic布局交互（含患者列表、病历回顾等模块），OpenEnv环境服务器实现reset()/step()等标准接口；遵循OpenEnv标准确保生态互操作性，已与TRL库原生集成支持GRPO微调。

章节 04

任务库分三阶段：单元技能（基础导航/筛选）、单一目标（开具医嘱/完成文书）、多步骤工作流（完整临床流程）；每个任务有评分标准，奖励结合终端成功、过程进展，惩罚无效操作与错误。

章节 05

用Synthea生成FHIR格式合成病历（零隐私风险、可扩展可控），采用LOINC/SNOMED CT/RxNorm等标准编码保证真实性，病历文书基于结构化模板生成。

章节 06

动作空间含底层鼠标键盘操作与高层语义动作；观察空间包括目标文本、截图、路由等；奖励设计遵循稀疏终端奖励、密集过程奖励及惩罚机制。

章节 07

可用于临床决策支持（辅助信息提取与决策）、界面优化（分析智能体行为改进设计）、医学教育（虚拟训练）、多模态AI（扩展影像等数据支持）。

章节 08

当前非目标：非Epic像素克隆、无完整企业EHR功能；未来方向：扩展临床场景、集成医学知识库、多智能体协作、引入时间/资源限制模拟真实环境。