章节 01
DISCO:多模态扩散模型驱动的蛋白质协同设计系统导读
DISCO是基于多模态扩散模型的蛋白质设计工具,实现序列与三维结构的协同生成,为药物发现和合成生物学提供全新范式。其核心创新在于协同设计范式与多模态条件机制,解决传统蛋白质设计中序列与结构割裂的问题,有望推动AI驱动的生物技术创新。
正文
基于多模态扩散模型的蛋白质设计工具,实现序列与三维结构的协同生成,为药物发现和合成生物学提供全新范式。
章节 01
DISCO是基于多模态扩散模型的蛋白质设计工具,实现序列与三维结构的协同生成,为药物发现和合成生物学提供全新范式。其核心创新在于协同设计范式与多模态条件机制,解决传统蛋白质设计中序列与结构割裂的问题,有望推动AI驱动的生物技术创新。
章节 02
蛋白质功能由氨基酸序列决定的三维结构定义。传统蛋白质设计依赖物理模拟和启发式搜索,计算成本高且成功率有限。近年来扩散模型在图像生成领域突破,科学家探索将其应用于分子设计,DISCO是该方向的最新成果。
章节 03
传统方法将蛋白质设计分为序列设计与结构预测两个独立阶段,导致序列与结构不一致。DISCO提出协同设计范式,同时生成序列和三维结构,相互约束优化:序列层面考虑生化特性、进化保守性等;结构层面考虑二级结构排布、活性位点约束等。核心创新是多模态条件扩散架构,接受生物分子条件(功能域、结合位点等)、配体条件(小分子结构)、文本描述(如"热稳定酯酶")作为输入引导生成。
章节 04
DISCO针对分子设计挑战采用专门适配:1. SE(3)等变性:通过等变神经网络确保输出与坐标系无关,避免不合理构象;2. 离散-连续混合空间:用统一连续扩散框架,解码时将序列概率投影到离散空间;3. 多尺度表征:从原子到残基层级学习,捕捉氢键网络与整体拓扑折叠模式。
章节 05
DISCO在基准测试中表现优越:酶设计方面,设计的酶活性接近天然酶水平;结合蛋白设计方面,针对给定配体的成功率较传统方法提升3倍以上;结构填充方面,可补全已知部分结构的缺失区域,对蛋白质工程和修复研究重要。
章节 06
药物发现方面,DISCO实现"按需设计",针对疾病靶点从头设计结合蛋白或抗体,缩短新兴传染病响应时间;合成生物学方面,为人工代谢通路提供元件设计能力,可设计特定酶组装高效生物合成途径(如转化廉价底物为高价值化学品、降解塑料的微生物系统)。
章节 07
DISCO存在局限:主要优化静态结构,对动态构象和变构调控建模待提升;实验验证仍是瓶颈。未来方向包括整合分子动力学模拟精修结构、引入实验反馈的主动学习、扩展到蛋白质-蛋白质相互作用系统。此外,DISCO开源降低研究准入门槛,促进开放协作加速AI生物技术创新。