分享

J. Chem. Inf. Model. | 双通道异构图神经网络用于预测microRNA调控的药物敏感性

 DrugAI 2023-09-04 发布于韩国

今天为大家介绍的是来自Hui Liu团队的一篇关于预测miRNA和药物关系的论文。许多研究已经确认microRNA(miRNA)在肿瘤细胞对抗癌药物的敏感性中起到调节作用。miRNA作为一种有前景的治疗靶点,正在逐渐受到关注,以克服药物抵抗。然而,对于miRNA与药物敏感性之间的关联的计算预测受到了有限的关注。在这项工作中,作者提出了一种基于异构网络的表示学习方法来预测miRNA药物敏感性关联(DGNNMDA)。通过整合miRNA相似性网络、药物相似性网络和实验证实的miRNA药物敏感性关联,构建了一个miRNA-药物异构网络。接下来,作者开发了一个双通道异构图神经网络模型,在同质和异质节点之间执行特征传播,以便使方法可以学习miRNA和药物节点的表达表示。

癌细胞对药物的敏感性是有效治疗的关键因素。抗癌药物的抗药性来自于多种原因,如基因突变和/或表观遗传变化使癌细胞能够避免程序性细胞死亡,运输蛋白的活性变化降低细胞内药物浓度,以及其他细胞和分子机制。对药物反应机制的系统了解将极大地促进新治疗策略的开发,导致更好的临床结果。

microRNA(miRNA)是一种长度约为19-25nt的小非编码RNA,参与细胞形成、分化、增殖和凋亡等各种细胞过程。大多数miRNA与靶向mRNA的3'非翻译区(3' UTR)相互作用,诱导其降解和翻译抑制。近年来,许多研究表明miRNA在不同癌症中调控药物反应方面发挥了非可忽视的作用。特别是,一些miRNA是增强药物敏感性的潜在治疗靶点。例如,抑制miR-21和miR-200b可以增加人类胆管癌细胞对吉西他滨的敏感性。miR-155-5p的上调增强了肝癌细胞对阿霉素的敏感性,并通过抑制自噬促进细胞凋亡。miR-21、miR-146a、miR-148a、miR-34a和miR-27a在介导乳腺癌中的他莫昔芬敏感性方面发挥了重要作用,是他莫昔芬耐药乳腺癌的潜在治疗靶点。

随着生化技术的发展,大规模实验已经证实许多miRNA与抗癌药物的敏感性密切相关。两个数据库,NoncoRNA和ncDR,已经整合了来自生物医学文献的miRNA药物敏感性关联。NoncoRNA是一个手工策划的实验支持的非编码RNA(ncRNA)和药物靶标关联数据库,旨在为探索不同人类癌症中与药物敏感性/耐药性相关的ncRNA提供高质量的数据资源。ncDR数据库通过手工策划和计算分析,收集了实验验证和预测的药物耐药相关microRNA和长非编码RNA。这些数据来源使我们能够开发计算方法来有效预测miRNA介导的药物效力。作者关注于预测miRNA介导的药物敏感性。在异质网络上提出了一种双通道图神经网络,名为DGNNMDA,用于预测miRNA-药物敏感性关联。

数据来源

miRNA-药物敏感性关联来自NoncoRNA和ncDR数据库。ncDR数据库包括了140种药物和1039个非编码RNA之间的实验验证和预测关联。NoncoRNA数据库收集了来自134种癌症中的5568个非编码RNA和154种药物之间的实验支持的关联。作者在研究中仅选择了miRNA与药物敏感性之间的实验验证关联,即涉及到药物抵抗性或非miRNA的关联被排除在外。总共获得了431个miRNA与140种药物之间的2049个miRNA-药物敏感性关联。该数据集被用作基准数据集,用于评估方法的性能。

模型结构

图 1

作者通过计算miRNA之间的序列相似性来构建miRNA相似性网络。miRNA序列是从miRBase数据库中获取的。miRNA的相似性计算采用了Levenshtein距离方法,即将一个序列转化为另一个序列所需的删除、插入或替换操作的次数。miRNA对的相似性其分布几乎符合正态分布。相似性最高的前5%的miRNA对,共计7812对。作者计算了这些miRNA的边数,发现大多数miRNA的度数不超过25,因此决定每个miRNA节点的连接边数不应超过25。通过这种方式构建了miRNA相似性网络,并且每个miRNA节点的表示汇聚了其相邻miRNA节点的信息。

对于每个药物,作者从PubChem数据库中获取了药物的标准SMILES表示。接下来,提取了MACCS指纹并计算了每对药物的相似性。为了构建药物相似性网络,作则会选择了相似性最高的前5%的药物,共计1333对药物。结果显示,大多数药物的邻居数量不超过10个,因此确定每个药物的连接边数不应超过10个。

最后将,miRNA相似性网络、药物相似性网络和已知的miRNA-药物敏感性关联整合到一个miRNA-药物异质网络中。图1展示了模型架构。对于每个miRNA-药物的输入样本,模型会输出一个预测得分,表示miRNA在药物敏感性中的可能性。总体而言,该模型包含三个步骤:节点编码和映射到特征空间,异质图上的表示学习,以及关联预测。首先,miRNA和药物被编码并映射到相同的特征空间。接下来,在miRNA-药物异质图上运行节点表示学习,以整合同质节点之间的相似性信息和异质节点之间的关联信息。最后,miRNA和药物的表示被用来预测miRNA和药物敏感性之间的关联。

在大多数关联预测研究中,负样本通常是通过对节点对进行随机采样来生成的。然而,随机生成的负样本往往包含可能导致偏倚决策边界的噪声标签。实际上,验证过的miRNA-药物关联的数量远远少于真实数量,因为潜在的miRNA-药物关联是巨大的。因此,随机生成的负样本可能包含正样本,这可能会在模型训练过程中产生偏倚的决策边界。作者采用了新的策略来构建高度可信的负样本。这个策略的主要思想是,如果miRNA与某药物没有关联,那么它与所有与该药物有关联的miRNA的相似性通常会很低,反之亦然。基于这个原理,我们对计算出的miRNA之间的相似性进行了排序,然后选择与药物相关的miRNA中相似性最低的miRNA。同时,也对计算出的药物之间的相似性进行了排序,选择了与任何miRNA关联的药物中相似性最低的药物。最后,随机地将所选的miRNA和药物进行配对,生成高度可信的负样本。

实验部分

图 2

表 1

图 3

为了验证方法的性能,首先在基准数据集上进行了五折交叉验证。将训练样本随机分成五个大致相等大小的子集,每个子集依次作为测试集,其余四个子集用于训练模型,然后评估模型在测试集上的预测准确度。为了避免随机偏差,交叉验证过程重复进行了10次,并将性能指标平均作为最终结果。如图2所示,我们的方法在平均ROC-AUC、AUPR、准确率、F1分数、精确率和召回率方面的值分别为0.9255、0.9224、0.8523、0.8726、0.8261和0.8481。实验结果表明,作者的方法在预测miRNA与药物敏感性之间的关联方面表现良好。为了验证方法的性能,作者将其与七种最先进的关联预测方法进行了比较。在基准数据集上评估了这些竞争方法。图3显示了DGNNMDA和七种竞争方法的ROC曲线和AUC值,从中可以发现作者的方法获得了最高的AUC值0.9255,其次是GANLDA。此外,表2列出了其他性能指标,并验证了方法在AUC、AUPR、准确率、召回率和F1分数等指标方面优于其他方法,除了精确率指标。由于miRNA与药物敏感性之间的关联相对稀疏,竞争方法无法很好地拟合数据或遭受过拟合问题,因此表现不如作者提出的方法。

结论

作者提出了一种新的计算方法来预测miRNA-药物敏感性关联,开发了一个双通道的异质图神经网络模型,来学习miRNA和药物的潜在表示。通过将miRNA和药物编码并映射到相同的嵌入空间,在同质节点和异质邻居节点上进行特征聚合,通过多层图聚合获取节点嵌入。此外,将miRNA相似性网络和药物-药物关联网络整合到miRNA-药物异质网络中,可以有效缓解数据集中稀疏连接的问题。为了评估所提出的方法,作者构建了一个基准数据集和一个手动筛选的独立测试集。性能比较实验验证了文章的方法表现出色,并在链接预测方面胜过其他六种先进方法。

参考资料

Deng, L., Fan, Z., Xiao, X., Liu, H., & Zhang, J. (2022). Dual-Channel Heterogeneous Graph Neural Network for Predicting microRNA-Mediated Drug Sensitivity. Journal of Chemical Information and Modeling, 62(23), 5929-5937.

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多