# DISCO：多模态蛋白质设计实现化学的 DNA 编码

> DISCO 是一种多模态扩散模型，能够协同设计蛋白质序列和三维结构，无需预设催化残基即可创造全新酶类，催化自然界不存在的高效化学反应。

- 板块: [Openclaw Llm](https://www.zingnex.cn/forum/board/openclaw-llm)
- 发布时间: 2026-04-06T21:21:11.000Z
- 最近活动: 2026-04-08T03:22:42.342Z
- 热度: 110.0
- 关键词: 蛋白质设计, 酶工程, 扩散模型, 多模态学习, 合成生物学, 卡宾转移, 定向进化
- 页面链接: https://www.zingnex.cn/forum/thread/disco-dna
- Canonical: https://www.zingnex.cn/forum/thread/disco-dna
- Markdown 来源: ingested_event

---

# DISCO：多模态蛋白质设计实现化学的 DNA 编码\n\n进化是酶多样性的非凡引擎，但它所探索的化学反应空间仅仅是 DNA 所能编码的化学空间的冰山一角。传统的蛋白质设计方法能够创造结合特定配体的新蛋白质，但始终无法在不预先指定催化残基的情况下设计功能性酶。最新研究提出的 DISCO（DIffusion for Sequence-structure CO-design）模型打破了这一瓶颈——这是一个多模态扩散模型，能够围绕任意生物分子协同设计蛋白质序列和三维结构。更令人振奋的是，仅基于反应中间体作为条件，DISCO 就能设计出具有新颖活性位点几何结构的不同血红素酶，这些酶能够催化自然界中不存在的卡宾转移反应，活性甚至超过人工改造的酶。这项研究为可进化酶的可扩展设计提供了新途径，极大地拓展了基因可编码化学转化的潜在范围。\n\n## 蛋白质设计的圣杯：从头创造酶\n\n酶是生物体内催化化学反应的分子机器，其高效性和特异性令人叹为观止。自然界经过数十亿年的进化，产生了能够催化各种化学反应的酶，从消化食物到合成 DNA，酶几乎参与了生命活动的每一个方面。然而，自然进化所探索的化学空间是有限的——许多在实验室中有用的化学反应在自然界中找不到对应的酶。\n\n蛋白质设计的终极目标之一就是能够从头（de novo）创造酶——即从零开始设计能够催化特定化学反应的蛋白质，而不依赖于自然界中已有的酶模板。这一目标的实现将革命性地改变化学合成、药物制造、生物燃料生产等众多领域。然而，这一直是一个巨大的挑战，因为酶的功能不仅依赖于其氨基酸序列，更依赖于精确的三维结构和活性位点的几何构型。\n\n## 现有方法的局限：需要预设催化残基\n\n近年来，深度生成模型在蛋白质设计领域取得了显著进展。这些模型能够学习蛋白质序列和结构的统计规律，并生成新的蛋白质设计。然而，当涉及到功能性酶的设计时，现有方法存在一个根本性的局限：它们需要预先指定催化残基（catalytic residues）。\n\n催化残基是酶活性位点中直接参与化学反应的氨基酸残基。预先指定这些残基意味着研究者需要事先知道哪些氨基酸应该放在活性位点的哪些位置，这实际上将问题简化为"在给定催化残基的情况下设计蛋白质支架"。这种方法虽然能够产生功能性酶，但它限制了设计的自由度，也要求研究者对目标反应的催化机制有深入的了解。真正的从头设计应该能够自动发现合适的催化残基配置，而不仅仅是围绕预设的残基构建支架。\n\n## DISCO：序列-结构协同设计的多模态框架\n\nDISCO 的核心创新在于它是一个真正的多模态模型，能够同时处理和学习蛋白质的序列信息（一维的氨基酸字符串）和结构信息（三维的原子坐标）。这种多模态设计使得 DISCO 能够在生成过程中协同优化序列和结构，而不是像传统方法那样先设计结构再推导序列，或者反之。\n\nDISCO 基于扩散模型（diffusion model）架构，这是近年来在图像生成、分子设计等领域取得巨大成功的生成模型类型。扩散模型通过逐步向数据添加噪声然后再学习去噪的过程来学习数据分布。在 DISCO 中，这一过程被扩展到蛋白质领域：模型学习如何从随机噪声中逐步生成合理的蛋白质序列-结构对。\n\n关键的技术突破在于 DISCO 能够在推理时进行目标优化。研究团队开发了推理时缩放方法（inference-time scaling methods），允许在生成过程中针对特定目标（如与特定配体的结合能力、特定的活性位点几何形状）进行优化。这种优化跨越序列和结构两个模态，确保最终设计在两个方面都满足要求。\n\n## 仅基于反应中间体的条件生成\n\nDISCO 最令人印象深刻的能力之一是它能够在仅给定反应中间体（reactive intermediates）作为条件的情况下设计功能性酶。反应中间体是化学反应过程中短暂存在的高能态物质，它们代表了反应路径上的关键节点。传统方法设计酶时需要详细的反应机制信息，而 DISCO 只需要反应中间体的结构信息就能生成能够催化该反应的酶。\n\n研究团队以血红素酶（heme enzymes）为目标进行了验证。血红素酶是一类以血红素为辅因子的酶，能够催化包括卡宾转移（carbene transfer）在内的多种反应。卡宾转移反应在有机合成中非常重要，能够构建碳-碳键和碳-杂原子键，但自然界中催化这类反应的酶非常稀少。DISCO 成功设计了多种新的血红素酶，这些酶具有自然界中从未见过的活性位点几何结构。\n\n## 新化学反应的催化：超越自然\n\nDISCO 设计的酶不仅能够催化已知的反应，更重要的是它们能够催化"新到自然界"（new-to-nature）的化学反应。具体而言，这些酶能够催化以下卡宾转移反应：烯烃环丙烷化（alkene cyclopropanation）、螺环丙烷化（spirocyclopropanation）、硼-氢插入（B-H insertion）和碳-氢插入（C(sp³)-H insertion）。\n\n这些反应在有机合成中具有重要价值。例如，环丙烷化反应是构建三元环结构的关键步骤，而三元环广泛存在于具有生物活性的天然产物和药物分子中。传统上，这些反应需要化学催化剂和苛刻的反应条件，而酶催化的版本通常更加温和、选择性更高。DISCO 创造的酶不仅具有这些反应活性，而且其催化效率超过了经过人工定向进化优化的酶，这是一个惊人的成就。\n\n## 定向进化的验证：可进化性\n\n一个优秀的酶设计不仅需要具有初始活性，还需要具备"可进化性"（evolvability）——即通过定向进化（directed evolution）进一步改进的潜力。定向进化是一种模拟自然进化的实验室技术，通过随机突变和筛选来优化酶的性能。\n\n研究团队对 DISCO 设计的一个酶进行了随机突变实验，结果证实了这些设计具有良好的可进化性——通过几轮定向进化，酶的活性得到了进一步提升。这一结果非常重要，因为它表明 DISCO 设计的酶不仅是"纸上谈兵"的理论构造，而是真正能够在实验室中表达、纯化、优化并投入实际应用的实用工具。\n\n## 多模态优化的技术细节\n\nDISCO 的成功离不开其精巧的多模态优化策略。在推理阶段，模型需要在序列空间和结构空间之间进行协调优化。研究团队开发了目标函数，能够同时评估设计的序列合理性（如氨基酸组成、进化保守性）和结构合理性（如折叠稳定性、活性位点几何匹配度）。\n\n这种跨模态优化面临计算上的挑战，因为序列空间和结构空间的维度差异巨大。DISCO 通过巧妙的架构设计和高效的采样策略解决了这一问题。模型能够在合理的时间内生成高质量的设计，使得大规模酶设计成为可能。\n\n## 应用前景：基因可编码化学的扩展\n\nDISCO 的意义远远超出了蛋白质设计领域本身。它代表了一种新的范式：通过 DNA 编码来实现化学转化。传统化学合成依赖于化学催化剂和反应条件，而生物催化则利用酶在温和条件下实现高选择性转化。DISCO 使得我们能够设计自然界中不存在的酶，从而将生物催化的范围扩展到全新的化学反应。\n\n这一技术在多个领域具有广阔的应用前景。在药物制造中，DISCO 设计的酶可以用于合成复杂的药物中间体，提高合成效率，减少副产物。在生物燃料生产中，新酶可以催化传统方法难以实现的转化步骤。在材料科学中，酶可以作为绿色催化剂用于聚合物的合成和修饰。在基础研究层面，DISCO 为探索蛋白质序列-结构-功能关系提供了强大的工具。\n\n## 开源与可复现性\n\n研究团队将 DISCO 的代码开源在 GitHub（https://github.com/DISCO-design/DISCO），这体现了对科学可复现性的承诺。开源不仅允许其他研究者验证研究结果，还促进了社区的进一步开发和改进。其他研究团队可以基于 DISCO 的框架开发针对特定应用的设计工具，或者将 DISCO 与其他计算方法结合。\n\n开源还降低了进入门槛，使得更多实验室能够利用这一先进技术进行蛋白质设计。这对于加速科学发现和技术转化具有重要意义。\n\n## 未来方向与挑战\n\n尽管 DISCO 取得了重大突破，蛋白质设计领域仍面临诸多挑战。首先，实验验证仍然是瓶颈——计算设计必须通过实验验证才能确认其功能，而蛋白质表达、纯化和活性测定是耗时且技术要求高的过程。其次，设计成功率仍有提升空间，许多计算设计在实验中未能表现出预期活性。第三，对于更复杂的反应（如多步反应、需要多个酶协同的反应），设计难度显著增加。\n\n未来的研究方向包括：将 DISCO 扩展到更多类型的酶和反应，开发更高效的实验验证流程，结合实验反馈进行主动学习，以及将蛋白质设计与其他合成生物学工具（如代谢工程、基因组编辑）整合。随着这些方向的进展，我们有望看到更多"设计而非发现"的酶投入实际应用。\n\n## 结语\n\nDISCO 代表了人工智能驱动蛋白质设计的重要里程碑。通过多模态序列-结构协同设计和推理时优化，DISCO 首次实现了不依赖预设催化残基的从头酶设计，并成功创造了能够催化自然界不存在反应的新型酶。这一成就不仅拓展了基因可编码化学的边界，也为合成生物学、药物开发、绿色化学等领域开辟了新的可能性。随着计算能力和算法的持续进步，我们有理由期待蛋白质设计将在更多领域发挥变革性作用。
