正文

AcmGENTIC：用大语言模型自动挖掘基因组变异功能证据的端到端方案

临床基因组学面临的最大瓶颈之一，是如何将海量文献中的实验证据转化为可用于变异致病性判读的结构化数据。本文介绍的AcmGENTIC系统，通过LLM实现摘要筛选、全文证据提取与分类、证据摘要生成等全流程自动化，在ClinGen基准上取得96%准确率，为精准医学的证据管理提供了可扩展的技术框架。

基因组变异功能证据大语言模型精准医学文献挖掘ClinGenACMG指南临床基因组学

发布时间 2026/03/31 23:08最近活动 2026/04/02 09:48预计阅读 2 分钟

章节 01

AcmGENTIC：用LLM自动挖掘基因组变异功能证据的端到端方案（导读）

临床基因组学面临将海量文献实验证据转化为变异致病性判读结构化数据的瓶颈，多数变异为意义不明变异（VUS）。AcmGENTIC系统通过大语言模型实现摘要筛选、全文证据提取与分类、证据摘要生成等全流程自动化，在ClinGen基准上取得96%准确率，为精准医学证据管理提供可扩展技术框架。

章节 02

精准医学时代，基因组测序已成常规，但多数变异是VUS，需整合功能实验、人群频率等多维度证据。功能证据分散在数万篇文献中，人工处理耗时费力且难规模化。传统文献挖掘依赖关键词匹配，难以处理复杂生物医学语境；LLM应用需解决准确识别相关文献和提取结构化证据的核心问题。

章节 03

构建ClinGen专家注释的基准数据集，提取PubMed标识符、证据标签等形成"变异-文献"配对。评估gpt-4o-mini（非推理）和o4-mini（推理）模型，任务分两阶段：摘要筛选（判断文献是否报道特定变异功能实验）、全文证据提取与分类（提取证据方向、强度、实验类型）。

章节 04

摘要筛选中，两模型召回率高（0.88-0.90），特异性较低（0.59-0.65）。"宁可错杀不可放过"策略合理，初筛保证召回率，后续全文分析精细过滤。模型局限：难以判断实验是否真正针对目标变异，需后续验证。

章节 05

引入"变异匹配门控"后，o4-mini表现显著：证据分类准确率96%，特异性0.83（gpt-4o-mini仅0.37），F1分数0.98。LLM-as-judge评估显示o4-mini生成的摘要质量更高，为模型迭代提供评价框架。

章节 06

AcmGENTIC流程包括：1.变异标识符扩展（HGVS转多种形式）；2.智能文献检索（PubMed等获取元数据和全文）；3.LLM摘要筛选（轻量级模型初筛）；4.多模态证据提取（PDF全文分析含图表解析）；5.结构化报告生成（供专家审核）。

章节 07

技术洞察：采用"人在回路"方案，LLM处理繁琐任务，专家审核决策，发挥各自优势。临床意义：解决基因组测序需求增长带来的变异注释压力，人机协作模式平衡自动化与准确性，为精准医学提供可行思路。

章节 08

局限：训练数据来自ClinGen可能有领域偏差；仅处理英文文献；复杂图表解析待提升。未来方向：扩展数据覆盖更多疾病和变异；优化微调策略；增强图表理解；建立专家反馈机制持续迭代。