2023年4月10日,来自奥斯特拉尔大学的研究者在Journal of Chemical Information and Modeling上发表了题为的”The Impact of Supervised Learning Methods in Ultralarge High- Throughput Docking“的研究论文。论文讨论了超大型高通量虚拟筛选的动机和问题,特别强调了被动监督学习和主动监督学习在虚拟筛选中的应用和发展前景。
1 摘要
如今,基于结构的虚拟筛选方法(structure-based virtual screening methods)是计算药物发现的关键支柱之一。近年来,有很多对大型数据库(大小从数百到数千万种化合物)进行基于对接的虚拟筛选(docking-based virtual screening),筛选结果进一步在实验中进行验证以确定新的苗头化合物的工作报道。同时出现了基于机器学习的方法(machine learning- based protocols)来加速超大化学空间内的虚拟筛选。本文阐述了筛选大型数据库背后的动机和问题,概述了机器学习方法特别是监督学习方法的关键概念和基本应用。本文还讨论了该领域与这些新发展的关系,强调了未来的研究方向。图 暴力方法与监督学习方法用于虚拟筛选
作者认为机器学习虽然有助于加速大规模的虚拟筛选,但目前还不能取代小规模的分子对接。一方面,目前有大量关于启动药物发现的小规模虚拟筛选项目的例子,另一方面,现在完全判断大规模的虚拟筛选完全取代小规模的分子对接还为时过早,还需要观察更广泛的蛋白质靶标以及不同的分子对接的结果。由于在大型化学数据库中对接每一种化合物的暴力方法是不可行的,机器学习方法在苗头化合物识别方面具有效率高的优势。特别是,如前文所述,主动学习方法已经取得了令人印象深刻的实验结果。随着这些有希望的结果以及更多研究和验证的出现,作者相关研究将是朝着加速且更准确的基于结构的虚拟筛选的方向发展。 参考文献Cavasotto C N, Di Filippo J I. The Impact of Supervised Learning Methods in Ultralarge High- Throughput Docking[J]. Journal of Chemical Information and Modeling, 2023.