Zing 论坛

正文

FEHGNN:融合分子指纹与层次图神经网络的分子性质预测方法

一种结合分子指纹和层次图神经网络的新型深度学习架构,用于更准确的分子性质预测,在MoleculeNet基准数据集上验证了有效性

分子图神经网络药物发现分子性质预测深度学习计算化学图神经网络
发布时间 2026/06/10 17:13最近活动 2026/06/10 17:21预计阅读 3 分钟
FEHGNN:融合分子指纹与层次图神经网络的分子性质预测方法
1

章节 01

导读 / 主楼:FEHGNN:融合分子指纹与层次图神经网络的分子性质预测方法

一种结合分子指纹和层次图神经网络的新型深度学习架构,用于更准确的分子性质预测,在MoleculeNet基准数据集上验证了有效性

2

章节 02

原作者与来源

3

章节 03

研究背景与动机

分子性质预测是计算化学和药物发现领域的核心问题。传统的机器学习方法通常依赖单一的特征表示——要么是分子指纹(如Morgan指纹),要么是分子图结构。然而,这两种表示各有优劣:分子指纹捕捉了子结构信息但丢失了拓扑关系,而图神经网络能建模原子间关系却可能忽略全局化学模式。

FEHGNN(Fingerprint-Enhanced Hierarchical Graph Neural Network)的提出正是为了解决这一矛盾,通过同时学习层次化分子图和分子指纹的信息,实现更全面的分子表示。

4

章节 04

核心方法创新

双通道架构:FEHGNN的核心创新在于同时利用两个信息源——层次化分子图和分子指纹。这种设计允许模型在原子-键层面(微观)和子结构模式层面(宏观)同时捕获化学信息。

层次化图表示:不同于传统的平面分子图,FEHGNN采用层次化图结构,能够建模不同粒度级别的化学实体关系,从原子到官能团再到更大尺度的结构单元。

指纹增强机制:通过将分子指纹嵌入到图神经网络的特征空间中,模型可以显式地利用人类化学家多年积累的结构-活性关系知识,同时保持端到端学习的灵活性。

5

章节 05

技术实现细节

代码库基于Python 3.7和PyTorch 1.12.1构建,主要依赖包括:

  • RDKit (2018.03.4):用于分子结构处理和指纹生成
  • PyTorch Geometric:提供图神经网络基础架构
  • scikit-learn:用于数据分割和评估指标计算

关键模块包括:

  • featurization.py:分子特征提取和指纹生成
  • fehgnn.py:核心网络架构实现
  • loader.py:数据加载和批处理
  • train.py:训练流程和超参数配置
6

章节 06

实验验证与数据集

项目在MoleculeNet基准数据集上进行了验证,MoleculeNet是深度学习化学领域最权威的基准测试集合,涵盖从量子力学性质到生物活性的多种预测任务。

代码仓库还包含了R语言脚本(Annotation.R、Cluster.R、Markers_plot.R等),用于结果的可视化分析和生物学注释,显示出这是一个跨学科的完整研究项目。

7

章节 07

应用价值与意义

FEHGNN的方法论对以下领域具有重要价值:

药物发现:更准确的分子性质预测可以加速先导化合物筛选,减少实验成本。

材料科学:预测分子材料的物理化学性质,指导新材料设计。

计算化学:为量子化学计算提供快速准确的替代方案。

8

章节 08

使用方法与复现

项目提供了清晰的训练入口:

python train.py \
  --dataset <数据集名称> \
  --data_dir <CSV文件路径> \
  --save_dir <模型保存路径> \
  --batch_size <批次大小> \
  --epochs <训练轮数> \
  --lr <学习率> \
  --depth <编码器深度>

所有使用的数据均来自公开的MoleculeNet,保证了研究结果的可复现性。