![]() 背景 确定药物的蛋白质靶点为药物再利用和药物开发奠定了不可或缺的知识基础。尽管昂贵且耗时,体外试验仍被广泛用于发现药物靶点。这表明,现有的相关机器学习算法在预测准确性和性能效率方面仍不能满足药物研发实际应用的需求,亟待提高。传统计算方法的主流可以分为两类:基于配体的虚拟筛选方法和对接方法。基于配体的虚拟筛选方法将候选配体的化学结构与已知配体进行比较,并使用机器学习方法来预测蛋白质是否可以与候选配体结合。然而,对于那些研究较少、了解甚少的蛋白质,其已知配体的数量非常有限,这些方法很难应用。另一种计算方法是基于分子对接,动态模拟蛋白质靶点的3D结构数据。然而,它需要大量关于药物或靶点的三维结构的数据。 在过去的几年里,图神经网络在生物信息学领域的一些重要预测问题上被证明具有出色的表现力和强大的预测性能。最近,已经有一些尝试使用图神经网络来预测新的DTI,然而,这些预测模型的预测性能仍然不足以用于实际应用,需要改进。 方法 在这项工作中,作者使用先验知识来计算相似性,以构建药物和靶点的特征。具体来说,药物的相似性是基于它们的化学结构。在其中五个数据集中,从KEGG LIGAND数据库中的药物和化合物部分收集药物的化学结构信息,并计算药物相似性的Tanimoto评分。 ![]() 作者使用特征映射部分将药物和靶蛋白特征向量Fd和Ft映射到节点的相同新特征维度向量空间中,接着应用了图神经网络的近似个性化传播层来进一步提取特征,通过双线性解码器重建了二分图的链接,以预测药物-蛋白质对的相互作用。由于sigmoid激活函数适用于二值化分类中处理得很好,因此作者采用的双线性解码器包括双线性运算和sigmoid函数。为了训练如上所述建立的模型,设置交叉熵损失函数。 结果 作者将PPAEDTI与多种方法进行对比。如表1所示,PPAEDTI的表现超越了现有的方法。 ![]() 为了进一步评估PPAEDTI在预测中的效率,作者选择了药物D00618(尼索地平)、靶蛋白hsa:775(钙电压门控通道亚单位Alpha1C)和靶蛋白hsa:779(钙电压调控通道亚单位Alpha1S)进行案例研究。对于它们中的每一个,通过查阅公开的独立数据库来手动检查相应的前20名预测列表。Hsa:775提供了制造几种钙通道之一的指令,这些钙通道将带正电的钙原子(钙离子)输送到细胞中,在细胞产生电信号的能力中发挥关键作用。Hsa:779提供了制造被称为钙通道的结构的主要部分(亚单位)的说明。在用于运动的肌肉(骨骼肌)中发现了含有hsa:779蛋白的通道。这些骨骼肌钙通道是一个称为兴奋-收缩耦合的过程的关键,通过这个过程,电信号(兴奋)触发肌肉紧张(收缩)。结果显示(详见原文),hsa:775和hsa:779分别在前20名中有18名和17名被确认。D00618用于治疗高血压,属于钙通道阻滞剂类药物。结果显示,在表2中,D00618已经确认了前20名中的所有DTI。 ![]() ![]() 查询药物化学结构或蛋白质序列,然后单击submit按钮,完成后,结果将显示如图3所示。可以通过单击表的name按钮找到序列。点击表格相应的download按钮,即可下载相应的预测结果。 ![]() 总结 在这项工作中,作者提出了基于自动编码器的PPAEDTI模型,该模型由特征映射模块、近似个性化传播层和双线性解码器组成。作者认为药物的结构信息和蛋白质的进化信息对DTI的预测有很大影响,并且基于这种考虑,所提出的模型使用图神经网络结构来组合这类信息进行预测。交叉验证实验结果表明,PPAEDTI可以有效识别药物和蛋白质之间的潜在相互作用。对比实验还表明,PPAEDTI的性能优于现有方法。综合实验结果表明,PPAEDTI是预测DTI的可靠模型。作者预计,在研究人员通过给定的药物结构信息或蛋白质序列查询最潜在的DTI的情况下,所提出的PPAEDTI模型可以作为一个有用的工具。 参考资料: [1] Li et al. PPAEDTI: Personalized Propagation Auto-Encoder Model for Predicting Drug-Target Interactions. IEEE J Biomed Health Inform. 2023 |
|