章节 01
【主楼/导读】AROMA:融合多模态推理与强化学习的虚拟细胞基因扰动预测新框架
AROMA是ACL 2026收录的多模态虚拟细胞建模框架,通过整合文本证据、图拓扑结构与蛋白质序列,结合检索增强策略与GRPO强化学习,实现基因扰动效应的高精度预测与可解释性分析,旨在解决传统基因扰动实验成本高、周期长等痛点,推动自然语言处理与计算生物学的交叉融合。
正文
AROMA是ACL 2026收录的多模态虚拟细胞建模框架,通过整合文本证据、图拓扑结构与蛋白质序列,结合检索增强策略与GRPO强化学习,实现基因扰动效应的高精度预测与可解释性分析。
章节 01
AROMA是ACL 2026收录的多模态虚拟细胞建模框架,通过整合文本证据、图拓扑结构与蛋白质序列,结合检索增强策略与GRPO强化学习,实现基因扰动效应的高精度预测与可解释性分析,旨在解决传统基因扰动实验成本高、周期长等痛点,推动自然语言处理与计算生物学的交叉融合。
章节 02
在生物医学研究中,基因扰动实验是理解细胞功能与疾病机制的核心手段,但传统wet-lab实验成本高昂、周期漫长,难以系统性探索海量基因组合影响。虚拟细胞建模作为计算生物学前沿方向,可模拟细胞对基因扰动的响应,降低成本并加速药物靶点发现。 该领域面临三大挑战:
章节 03
AROMA的技术架构包含数据构建、模型推理阶段:
构建两个互补的生物学知识图谱:
当给定基因扰动查询时:
这种设计实现"神经-符号"有机融合,结合符号化知识推理与神经网络表示学习能力。
章节 04
AROMA采用两阶段训练策略优化模型:
在PerturbReason数据集上进行多模态监督学习,学习输入查询到扰动效应预测的基本映射,确保模型掌握基础生物学知识与预测能力。
引入Group Relative Policy Optimization(GRPO)进行强化学习微调。GRPO通过组内相对奖励信号优化策略,避免传统PPO算法中critic模型训练不稳定问题。 此阶段不仅提升预测精度,更引导模型生成生物学意义上可解释、合理的推理过程,实现"性能-可解释性"双重优化。
章节 05
AROMA基于Qwen3-8B基座模型微调,充分利用开源大语言模型的语言理解与生成能力。研究团队已在Hugging Face平台完整开源:
章节 06
AROMA对AI for Science领域的启示:
随着单细胞测序技术普及与空间转录组学发展,虚拟细胞建模有望整合更精细的细胞状态信息。AROMA架构具备良好扩展性,可进一步融合单细胞表达谱、空间位置信息等新兴数据模态,向"数字孪生细胞"终极目标演进。