正文

大语言模型驱动的时间因果推断：用LLM进化式插补解决医疗数据缺失难题

本文介绍了一种结合DAG约束归一化流与LLM驱动进化式插补的两阶段框架，用于从不完整的纵向电子健康记录中估计治疗效果。该方法在30%-80%缺失率下仍能保持因果效应估计的准确性，并在真实世界糖尿病治疗数据中验证了有效性。

因果推断大语言模型医疗数据缺失值插补电子健康记录目标试验模拟归一化流DAG约束

发布时间 2026/05/07 00:53最近活动 2026/05/07 11:21预计阅读 2 分钟

章节 01

【主楼】大语言模型驱动的时间因果推断：解决医疗数据缺失难题的新框架

本文提出一种结合DAG约束归一化流（CausalFlow-T）与LLM驱动进化式插补的两阶段框架，用于从不完整的纵向电子健康记录中估计治疗效果。该方法在30%-80%缺失率下仍能保持因果效应估计的准确性，并在真实世界糖尿病治疗数据中验证了有效性。

章节 02

研究背景与挑战

在医学研究中，随机对照试验（RCT）是因果推断金标准，但存在伦理或可行性障碍。目标试验模拟（TTE）利用观察性数据回答因果问题，但现有方法常割裂因果估计、缺失值处理和时序结构建模，导致在电子健康记录（EHR）中鲁棒性不足。EHR数据缺失严峻：时变混杂因素和缺失非随机（MNAR）的生物标志物缺失率高达50%-80%，传统插补方法难以捕捉复杂生成机制，简单处理易引入偏差，高缺失率下保持因果估计准确性是医疗AI关键挑战。

章节 03

核心方法第一阶段：CausalFlow-T（DAG约束时间归一化流）

研究团队提出CausalFlow-T，一种结合有向无环图（DAG）约束的归一化流模型。该模型用长短期记忆网络（LSTM）编码患者历史轨迹，实现精确可逆的反事实推断，避免传统变分推断方法的近似误差，通过显式因果结构分离混杂因素。消融实验在合成数据集和半合成基准验证：DAG约束和精确推断解决不同失效模式，无法相互替代。

章节 04

核心方法第二阶段：LLM驱动进化式插补器

因CausalFlow-T需完整输入数据，团队引入LLM驱动的进化式插补方法。与传统直接预测缺失值不同，该方法让LLM提出可执行的插补算子而非单个数值。优势包括：符合医疗数据生成逻辑（如基于年龄和病史推断HbA1c趋势）、进化式搜索迭代优化策略、灵活适配不同LLM后端（研究测试三种配置含两个开源模型）。

章节 05

实验验证与性能表现

合成基准测试：30%-80% MNAR缺失率下，LLM驱动插补器在生物标志物和因果指标综合排名最优，点估计准确性和时间外推能力领先，保持平均处理效应（ATE）恢复能力，传统统计基线性能显著下降。

真实世界验证：瑞士初级保健EHR数据中，针对2型糖尿病患者服用GLP-1受体激动剂或SGLT-2抑制剂的研究，估计出GLP-1受体激动剂在体重减轻方面有-0.98 kg优势（95%置信区间：-1.01至-0.96），与RCT结果一致。

章节 06

技术启示与应用前景

方法论贡献：展示LLM在结构化医疗数据插补的创新应用，将LLM定位为“策略生成器”而非填空工具，算子级插补更具可解释性和领域适应性。

对医疗AI启示：为真实世界证据（RWE）研究提供新路径，允许保留更多样本同时控制缺失偏差，提升观察性研究外部效度。

章节 07

局限与未来方向

当前局限：计算成本高（进化式搜索和LLM推理带来额外开销）。未来方向：探索更高效的算子搜索策略、集成医疗领域预训练LLM提升插补质量、扩展至其他疾病领域和更多医疗数据类型（如影像、基因组）。

大语言模型驱动的时间因果推断：用LLM进化式插补解决医疗数据缺失难题

【主楼】大语言模型驱动的时间因果推断：解决医疗数据缺失难题的新框架

研究背景与挑战

核心方法第一阶段：CausalFlow-T（DAG约束时间归一化流）

核心方法第二阶段：LLM驱动进化式插补器

实验验证与性能表现

技术启示与应用前景

局限与未来方向

继续阅读

Nornir MCP Server：将大语言模型引入网络自动化的企业级桥梁

Bibliothèque Française LLM：为大型语言模型优化的法语公版文献索引系统

Splinter：一款无锁零拷贝的共享内存 KV 与向量存储库，让 LLM 推理告别 socket 与 memcpy 开销

Folkering OS：当操作系统本身就是 AI——一个能自我进化的裸机 Rust 系统