章节 01
PrMed:面向真实医疗场景的抗扰动医学大模型(导读)
PrMed是一款针对真实医疗场景中患者非标准化表达设计的医学基础模型,核心目标是解决现有医学大模型在临床部署时因语言扰动导致的表现落差问题。通过两阶段训练(LoRA监督微调+GRPO强化学习)在120万多源医学样本上训练,实现对口语化、情绪化、方言化等语言扰动的强鲁棒性,在从规范语言到重度扰动表达转换时准确率仅下降2.71个百分点,远优于主流模型。
正文
PrMed是一款专门针对真实医疗场景中患者表达的非标准化特征而设计的医学基础模型,通过两阶段训练在1.2百万多源医学样本上实现了对口语化、情绪化、方言化等语言扰动的强鲁棒性。
章节 01
PrMed是一款针对真实医疗场景中患者非标准化表达设计的医学基础模型,核心目标是解决现有医学大模型在临床部署时因语言扰动导致的表现落差问题。通过两阶段训练(LoRA监督微调+GRPO强化学习)在120万多源医学样本上训练,实现对口语化、情绪化、方言化等语言扰动的强鲁棒性,在从规范语言到重度扰动表达转换时准确率仅下降2.71个百分点,远优于主流模型。
章节 02
大型语言模型在医学基准测试表现优异,但临床部署时表现大打折扣,核心原因是训练数据与真实场景错位——现有模型基于规范语料训练,而真实患者表达充满语言扰动。中国医学科学院团队分析569,913条中文在线问诊记录发现:95.1%的患者 utterances含至少一种扰动,83.6%含两种及以上,包括口语化、方言、情绪化、语法不完整、主观误诊等,揭示当前医学AI实际部署的根本性挑战。
章节 03
PrMed(Perturbation-Resilient Medicine)专注于在充满"噪音"的真实医患对话中保持稳定推理能力,设计哲学为"在混乱中寻找秩序"——不是消除不规范性,而是理解适应。这种思路转变使PrMed面对语言转换时准确率仅降2.71个百分点,优于其他主流模型。
章节 04
PrMed基于Qwen3-32B架构,采用两阶段训练:
章节 05
研究团队建立4大类12小类的扰动分类体系,为医学NLP提供标准化分析框架:
章节 06
PrMed采用多智能体协作构建高质量数据,包含三个流水线:
章节 07
PrMed适配临床部署需求:
章节 08
PrMed的局限:目前主要针对语言层面扰动,多模态数据(影像、检验报告)整合能力待加强;极端罕见疾病表现需更多临床验证。 团队已公开模型权重、数据构建流水线、扰动分类体系,助力社区验证改进与领域标准化。未来将结合多模态技术与更多临床数据,扩展抗扰动理念到更广泛医疗AI应用,实现从实验室到病床边的跨越。