Zing 论坛

正文

深度学习预测基因剪接位点:splice-site-predictor的技术突破与生物医学意义

splice-site-predictor项目使用扩张预激活残差卷积神经网络,在人类DNA序列中预测经典的GT-AG剪接供体和受体位点。该项目基于HS3D数据集训练,展示了深度学习在基因组学中的强大应用潜力。

基因剪接深度学习卷积神经网络生物信息学基因组学剪接位点预测HS3D数据集扩张卷积残差网络精准医学
发布时间 2026/05/16 21:26最近活动 2026/05/16 21:30预计阅读 2 分钟
深度学习预测基因剪接位点:splice-site-predictor的技术突破与生物医学意义
1

章节 01

导读:深度学习预测基因剪接位点的技术突破与意义

splice-site-predictor项目采用扩张预激活残差卷积神经网络,预测人类DNA序列中的经典GT-AG剪接供体和受体位点,基于HS3D数据集训练,展现了深度学习在基因组学中的应用潜力,对罕见疾病诊断、癌症研究及合成生物学等领域具有重要生物医学意义。

2

章节 02

背景:基因剪接的关键作用与错误剪接的危害

基因表达过程中,剪接是切除内含子、连接外显子的关键步骤,由剪接体执行。剪接位点的精确识别决定基因产物正确性,错误剪接会导致蛋白质功能异常,与癌症、神经退行性疾病及遗传性疾病等密切相关。

3

章节 03

方法:扩张预激活残差卷积网络的技术架构

针对剪接位点预测的信号微弱、上下文依赖、长程相互作用等挑战,项目采用扩张卷积(扩大感受野,捕获长程依赖)和预激活残差块(更直接的梯度流、更好正则化、更高训练效率)。网络架构大致包括输入层(one-hot编码DNA序列)、初始卷积层、扩张残差块堆叠、全局池化层、全连接层及输出层。

4

章节 04

证据:HS3D数据集的构建与应用

HS3D是剪接位点预测基准数据集,包含真实剪接位点(正样本,含周围序列上下文)和符合GT-AG模式的假位点(负样本,与正样本特征相似),确保模型学习区分真实剪接位点的关键特征。

5

章节 05

结论:生物医学应用前景

该工具可助力罕见疾病诊断(致病性变异注释、剪接异常检测、药物靶点发现)、癌症研究(诊断标志物、预后指标、治疗靶点)、合成生物学与基因治疗(优化基因表达盒、设计可调控剪接系统、改进基因治疗载体)。

6

章节 06

局限与建议:未来改进方向

当前局限:仅预测经典GT-AG位点、序列长度限制、忽略组织特异性、未关注分支点等元件。未来方向:多任务学习(同时预测多种剪接元件)、引入注意力机制、组织特异性模型、迁移学习、提升可解释性。