章节 01
导读:用图神经网络预测分子溶解度的端到端平台
这个开源项目提供完整端到端平台,将分子表示为图结构,对比GCN、GraphSAGE、GIN三种GNN架构预测水溶性(药物研发关键性质),集成可解释AI(GNNExplainer)和生产级部署(FastAPI+React),解决传统机器学习处理分子拓扑结构的难题。
正文
一个完整的分子性质预测平台,将分子表示为图结构,使用GCN、GraphSAGE和GIN三种架构进行对比,并集成可解释AI和REST API部署。
章节 01
这个开源项目提供完整端到端平台,将分子表示为图结构,对比GCN、GraphSAGE、GIN三种GNN架构预测水溶性(药物研发关键性质),集成可解释AI(GNNExplainer)和生产级部署(FastAPI+React),解决传统机器学习处理分子拓扑结构的难题。
章节 02
传统机器学习处理分子数据的核心难题:分子非表格数据,拓扑结构(原子连接方式、环、分支)决定化学性质。GNN将原子建模为节点、化学键为边,保留拓扑结构同时学习性质,项目聚焦水溶性预测(40%候选药物因溶解度失败)。
章节 03
工作流程:SMILES字符串→RDKit解析→图构建→GNN模型→预测→GNNExplainer解释。
三种GNN架构:
章节 04
ESOL数据集(1128个分子)测试结果:
| 模型 | MAE | RMSE |
|---|---|---|
| GCN | 1.4526 | 1.8407 |
| GraphSAGE | 1.4160 | 1.7666 |
| GIN | 0.6876 | 0.8566 |
GIN误差不到其他模型一半,被选为生产主模型。
章节 05
集成GNNExplainer提供:
章节 06
后端API(FastAPI):
前端界面(React+Vite):支持输入SMILES预测、查看结构、解释图、浏览基准结果。
章节 07
应用:
未来方向:
结语:项目改变分子科学范式,为AI+化学提供工具链,选择适配数据结构的模型(如GIN)是关键。