Zing 论坛

正文

RINAMI:基于深度学习的蛋白质稳定性预测模型

RINAMI是一个用于预测蛋白质折叠自由能变化(ΔG)的机器学习模型,结合图神经网络和蛋白质语言模型,为蛋白质工程和设计提供计算支持。

RINAMI蛋白质稳定性ΔG预测图神经网络ProteinMPNN深度学习蛋白质工程ESMFold计算生物学开源
发布时间 2026/05/13 12:56最近活动 2026/05/13 13:00预计阅读 2 分钟
RINAMI:基于深度学习的蛋白质稳定性预测模型
1

章节 01

【导读】RINAMI:基于深度学习的蛋白质稳定性预测模型核心介绍

RINAMI是一个用于预测蛋白质折叠自由能变化(ΔG)的开源深度学习模型,结合图神经网络和蛋白质语言模型(ProteinMPNN),为蛋白质工程、药物设计等领域提供计算支持。其开源特性促进科学社区协作,有望加速相关研究进展。

2

章节 02

研究背景与科学意义

蛋白质稳定性直接影响生物体运作,ΔG是衡量稳定性的核心指标(正值表示突变使蛋白质更不稳定,负值则更稳定),准确预测ΔG对疾病机理理解、酶设计和治疗性蛋白质开发至关重要。但ΔG预测面临多重挑战:蛋白质结构复杂,氨基酸相互作用非线性;实验数据稀缺;不同蛋白质家族特性差异大。传统物理模拟难兼顾精度与效率,纯统计方法缺乏物理可解释性。

3

章节 03

RINAMI模型架构

RINAMI采用混合架构:

  1. 图神经网络层:以氨基酸残基为节点、空间邻近关系或化学键为边,通过多层消息传递捕捉残基远程相互作用,适应不同大小蛋白质。
  2. ProteinMPNN特征融合:整合ProteinMPNN的节点表示和输出特征,结合结构(GNN)与序列进化(ProteinMPNN)信息提升精度。
  3. 多任务学习框架:在Mega-scale、Maxwell、Garcia等基准数据集联合优化,学习通用表示,减少过拟合风险。
4

章节 04

技术实现细节

  • 环境配置:基于Python,依赖PyTorch、PyTorch Geometric,推荐NVIDIA GPU加速(如RTX3080+CUDA12.1),通过Conda管理依赖。
  • 数据准备:用ESMFold预测蛋白质结构,通过脚本生成ProteinMPNN特征;大规模数据集预处理文件可在Zenodo下载。
  • 训练与推理:训练脚本封装简化流程,推理支持PDB文件输入及ΔG热图生成,提供Colab笔记本供无GPU用户使用。
5

章节 05

应用场景与实用价值

  1. 定向进化指导:预筛选突变体,减少实验工作量;
  2. 疾病突变解读:评估突变致病潜力,为临床诊断提供线索;
  3. 蛋白质设计优化:评估设计方案稳定性,指导序列优化。
6

章节 06

开源生态与社区贡献

RINAMI代码(GitHub)和数据(Zenodo)均开源,降低复现门槛。数据托管于Zenodo确保可追溯性,提供可解释性分析功能(导出ΔG贡献矩阵),帮助理解模型决策依据。

7

章节 07

局限性与未来方向

局限性:训练数据覆盖不足(未出现的蛋白质家族精度下降);仅关注单点突变,对多点突变和插入删除预测有限。 未来方向:扩大训练集覆盖;引入物理约束提升可解释性;开发膜蛋白、抗体等专用模型;优化推理速度支持大规模虚拟筛选。

8

章节 08

总结与展望

RINAMI是计算生物学与深度学习融合的前沿成果,为蛋白质稳定性预测提供高效易用工具。其开源特性推动社区协作,加速蛋白质工程研究。随着深度学习进步和实验数据积累,此类工具将在生命科学中发挥更重要作用,推动基础研究到应用开发的全面进步。