Zing 论坛

正文

DISCO:多模态扩散模型驱动的蛋白质协同设计系统

基于多模态扩散模型的蛋白质设计工具,实现序列与三维结构的协同生成,为药物发现和合成生物学提供全新范式。

蛋白质设计扩散模型多模态生物信息学药物发现合成生物学结构预测AI4Science
发布时间 2026/05/02 12:37最近活动 2026/05/02 12:49预计阅读 2 分钟
DISCO:多模态扩散模型驱动的蛋白质协同设计系统
1

章节 01

DISCO:多模态扩散模型驱动的蛋白质协同设计系统导读

DISCO是基于多模态扩散模型的蛋白质设计工具,实现序列与三维结构的协同生成,为药物发现和合成生物学提供全新范式。其核心创新在于协同设计范式与多模态条件机制,解决传统蛋白质设计中序列与结构割裂的问题,有望推动AI驱动的生物技术创新。

2

章节 02

蛋白质设计的范式转移背景

蛋白质功能由氨基酸序列决定的三维结构定义。传统蛋白质设计依赖物理模拟和启发式搜索,计算成本高且成功率有限。近年来扩散模型在图像生成领域突破,科学家探索将其应用于分子设计,DISCO是该方向的最新成果。

3

章节 03

DISCO的协同设计范式与多模态条件机制

传统方法将蛋白质设计分为序列设计与结构预测两个独立阶段,导致序列与结构不一致。DISCO提出协同设计范式,同时生成序列和三维结构,相互约束优化:序列层面考虑生化特性、进化保守性等;结构层面考虑二级结构排布、活性位点约束等。核心创新是多模态条件扩散架构,接受生物分子条件(功能域、结合位点等)、配体条件(小分子结构)、文本描述(如"热稳定酯酶")作为输入引导生成。

4

章节 04

扩散模型在分子空间的适配方案

DISCO针对分子设计挑战采用专门适配:1. SE(3)等变性:通过等变神经网络确保输出与坐标系无关,避免不合理构象;2. 离散-连续混合空间:用统一连续扩散框架,解码时将序列概率投影到离散空间;3. 多尺度表征:从原子到残基层级学习,捕捉氢键网络与整体拓扑折叠模式。

5

章节 05

DISCO的应用场景与实验验证结果

DISCO在基准测试中表现优越:酶设计方面,设计的酶活性接近天然酶水平;结合蛋白设计方面,针对给定配体的成功率较传统方法提升3倍以上;结构填充方面,可补全已知部分结构的缺失区域,对蛋白质工程和修复研究重要。

6

章节 06

DISCO对药物发现与合成生物学的影响

药物发现方面,DISCO实现"按需设计",针对疾病靶点从头设计结合蛋白或抗体,缩短新兴传染病响应时间;合成生物学方面,为人工代谢通路提供元件设计能力,可设计特定酶组装高效生物合成途径(如转化廉价底物为高价值化学品、降解塑料的微生物系统)。

7

章节 07

技术局限与未来发展方向

DISCO存在局限:主要优化静态结构,对动态构象和变构调控建模待提升;实验验证仍是瓶颈。未来方向包括整合分子动力学模拟精修结构、引入实验反馈的主动学习、扩展到蛋白质-蛋白质相互作用系统。此外,DISCO开源降低研究准入门槛,促进开放协作加速AI生物技术创新。