|
2024年12月25日,来自中国科学技术大学的刘际等人在Journal of Chemical Information and Modeling上发表文章ReduMixDTI: Prediction of Drug−Target Interaction with FeatureRedundancy Reduction and Interpretable Attention Mechanism。 ![]() 本文提出了一种基于深度学习的端到端模型——ReduMixDTI。该模型通过创新性的特征冗余消减模块(CSFR)和多通道双向交叉注意力机制(MBCA),在提高预测精度的同时增强了模型的可解释性,为DTI预测领域带来了新的可能性。 1. 引言:药物-靶点相互作用预测的关键性 药物与靶点间的特异性相互作用是药物发挥治疗作用的核心。随着药物开发需求的增加,计算预测方法在药物发现中的应用变得愈发重要。然而,在药物-靶点相互作用(DTI)的预测过程中,依然存在以下挑战: 特征冗余问题:许多现有方法在处理药物分子和靶点蛋白的特征时,未能有效消减冗余信息,导致模型效率低下。 结合机制复杂性:药物分子与靶点蛋白之间的结合涉及多种非共价作用,如氢键、疏水相互作用和范德华力等,这些机制难以在传统模型中完整表征。 预测结果缺乏可解释性:在药物研发领域,可解释性是一个至关重要的因素,能够帮助研究人员理解药物如何与靶点结合并优化分子设计。 ![]() 图1: ReduMixDTI的架构设计 2. 模型设计与技术创新 ReduMixDTI的核心在于其特征处理方法和交互机制的创新,具体包括特征冗余消减模块(CSFR)和多通道双向交叉注意力模块(MBCA)。 2.1 特征冗余消减模块(CSFR) 特征冗余消减模块旨在动态筛选药物和靶点特征中的关键信息,降低冗余特征对预测结果的干扰。CSFR模块由以下两部分组成: 通道重构:通过多尺度通道注意机制,对药物和靶点特征的不同通道进行权重调整,突出对预测任务贡献最大的特征。 空间重构:基于特征图的局部和全局信息,重新组织特征分布,过滤掉对预测无关或影响较小的信息。 这种设计显著提高了模型的学习效率,确保了关键特征的高效利用。 2.2 多通道双向交叉注意力模块(MBCA) MBCA模块是ReduMixDTI的另一大创新。该模块通过多头双向注意力机制,从多个角度捕获药物与靶点之间的局部相互作用特性: 双向建模:药物分子特征作为查询(Query),靶点蛋白特征作为键(Key)计算相似性,反之亦然,从而实现全方位的相互作用捕捉。 多头注意力:每个注意力头学习不同类型的结合特性,例如氢键和疏水相互作用,为预测任务提供更加细粒度的信息。 通过MBCA模块,模型不仅可以更精确地捕获药物-靶点间的复杂交互,还能为研究人员提供关于结合区域的直观解释。 2.3 模型整体架构 ReduMixDTI模型由以下主要部分构成: 输入层:药物和靶点的分子结构以SMILES字符串和序列格式输入,通过GCN和CNN分别提取药物和靶点的特征。 特征处理模块:CSFR模块动态优化药物和靶点特征表示,剔除冗余信息。 交互建模模块:MBCA模块捕捉药物与靶点的局部交互特性,生成结合模式预测。 输出层:通过全连接层生成药物-靶点相互作用预测值,同时通过注意力权重实现可解释性输出。 ![]() 图2: 多头机制捕捉生物分子子结构及其对应配体之间的多种潜在结合模式 3. 数据与实验设置 3.1 数据来源 研究团队在以下三个公开数据集上测试了ReduMixDTI模型的性能: 1.BindingDB:包含49199个药物-靶点相互作用样本,是目前应用最广泛的DTI数据集之一。 2.Human:包括6728个药物与人类蛋白的相互作用,用于评估模型在真实生物环境下的表现。 3.BioSNAP:包含27464个DTI样本,涵盖多个蛋白家族,重点考察模型的泛化能力。 3.2 评价指标 模型性能通过以下指标进行评估: AUROC:衡量模型预测的整体准确性。 AUPRC:评估在不平衡数据集上的表现能力。 准确率(Accuracy)和F1分数:用于综合评价分类性能。 3.3 对比方法 实验中,ReduMixDTI与以下七种主流模型进行了性能对比,包括DeepDTA、NeoDTI和GraphDTA等。这些模型代表了当前DTI预测领域的最高水平。 ![]() 图3: 模型在BindingDB数据集的三个未知测试集上的性能比较 4. 实验结果与讨论 4.1 预测性能 实验结果表明,ReduMixDTI在所有数据集上均表现出色: 在BindingDB数据集中,ReduMixDTI的AUROC达到0.970,较最佳基线模型提升了1.0%。 在BioSNAP数据集中,ReduMixDTI的AUPRC提升至0.928,显著优于其他方法。 在Human数据集中,模型的F1分数达到0.989,展示了卓越的预测能力。 4.2 特征冗余消减的贡献 通过消减特征冗余,ReduMixDTI有效提升了预测性能: 引入CSFR模块后,模型的AUROC从0.950提升至0.967。 空间重构子单元进一步优化了特征表示,使AUPRC从0.930提高至0.961。 4.3 可解释性分析 MBCA模块的多头注意力机制使得模型能够直观展示药物与靶点结合区域的具体特征。例如,分析显示,某些药物的羟基和氨基功能团在结合过程中起到了决定性作用。这些可视化结果为药物设计提供了有力支持。 ![]() 图4: 预测的蛋白质注意力权重和结合位点的可视化分析以增强可解释性 5. 应用前景与未来展望 5.1 应用前景 ReduMixDTI的高效性能和强可解释性使其在以下领域具有广阔应用: 新药筛选:显著降低实验筛选成本,加速候选药物发现。 药物再定位:识别现有药物的新靶点,拓宽其适用范围。 结合机制研究:帮助研究人员深入理解药物-靶点间的相互作用,为结构优化提供指导。 5.2 未来方向 尽管ReduMixDTI表现优异,但未来仍需进一步优化: 结合三维结构信息:引入蛋白和药物的三维结构数据,提升对真实结合位点的捕捉能力。 多模态数据融合:整合药物-疾病关联、蛋白-蛋白相互作用等多源数据,拓展模型的适用范围。 工业化验证:在实际药物开发项目中验证模型的稳定性与实用性。 6. 结论 ReduMixDTI通过特征冗余消减和多通道双向注意力机制,在药物-靶点相互作用预测中实现了显著的性能提升。其高精度和强可解释性为药物筛选和设计提供了重要工具,也为DTI领域的进一步研究奠定了基础。 参考资料: Liu,M.;Meng,X.;Mao,Y.;Li,H.;Liu,J.ReduMixDTI:Prediction of Drug–Target Interaction with Feature Redundancy Reduction and Interpretable Attention Mechanism.J.Chem.Inf. Model.2024. DOI: 10.1021/acs.jcim.4c01554 |
|
|