Zing 论坛

正文

MAPLE:用大语言模型自动化提取文献中的QSP模型参数

一个结构化管道工具,利用LLM从科学文献中提取定量药理学参数,通过贝叶斯推理生成信息性先验分布,解决QSP模型校准的数据难题。

定量系统药理学QSP模型文献挖掘贝叶斯推理NumPyro参数校准LLM应用药物研发
发布时间 2026/04/09 06:14最近活动 2026/04/09 06:19预计阅读 2 分钟
MAPLE:用大语言模型自动化提取文献中的QSP模型参数
1

章节 01

导读:MAPLE——LLM驱动的QSP模型参数自动化提取工具

MAPLE是一个结构化管道工具,利用大语言模型(LLM)从科学文献中提取定量药理学参数,并通过贝叶斯推理生成信息性先验分布,解决定量系统药理学(QSP)模型校准的数据分散、来源异质等难题,助力药物研发中的参数提取与模型构建。

2

章节 02

项目背景与核心问题

QSP模型包含大量无法直接临床测量的生物学参数,相关数据分散在数百篇文献中,来源涉及不同物种、适应症,格式多样且转化困难。传统人工处理易出错,MAPLE通过LLM辅助提取和统计推断实现自动化标准化。

3

章节 03

核心方法与架构设计

MAPLE采用两阶段校准管道:

  1. 文献提取与验证(LLM+Pydantic生成YAML文件)+ 联合MCMC推理生成子模型先验
  2. 结合临床数据与QSP模拟器进行SBI推断 创新点在于量化数据来源质量(8维度评估),通过翻译sigma调整数据源权重,如小鼠数据权重低于人类临床数据。
4

章节 04

技术实现细节

  • YAML结构:结构化文献测量与模型参数关联,包含目标ID、输入、校准规则、来源相关性等
  • 前向模型类型:支持代数公式、剂量反应拟合、ODE系统等多种类型
  • 干扰参数处理:标记额外参数为nuisance,在MCMC中估计但排除于最终输出
  • 批量管道:分文献搜索、PDF收集、评估、提取、验证等阶段,支持缓存机制
  • 输入格式:目标参数CSV需包含ID、参数、癌症类型及搜索注释(如具体关键词)
5

章节 05

使用方式

  • 编码助手协作:通过MCP协议调用Claude/Codex等工具,自动完成文献搜索、提取与YAML验证,用户负责审核
  • Python API:调用process_targets函数处理priors_csv和yaml文件
  • 批量提取:分阶段并行处理大规模参数,各阶段结果独立缓存
  • 最佳实践:注释字段需包含速率公式和具体搜索词(如"MVD growth kinetics")以提升搜索效率
6

章节 06

应用场景与价值

适用于:

  1. 新药研发QSP模型构建
  2. 模型再校准(新数据更新参数)
  3. 跨物种/适应症模型迁移
  4. 监管申报支持(参数追溯与不确定性量化) 显著降低QSP模型校准门槛,让更多团队构建高质量模型。
7

章节 07

总结与展望

MAPLE将LLM作为信息提取工具,辅助科学家完成验证与解释工作,整合文献提取、统计推断与不确定性量化于标准化管道。未来随着LLM能力提升,这类工具将在生物医学研究中发挥更重要作用。