分享

DFRscore: 为高通量虚筛设计的可合成性打分

 GoDesign 2023-10-03 发布于北京

——研究背景——

虚拟筛选是先导化合物发现中的常用计算方式,随着算力的提升,我们能筛选的化合物越来越多,探索的化学空间越来越广,现有的虚拟筛选库已经到到了10^9以上的量级。然而,化学作为一门物质科学,研究者们希望虚筛或设计得到的分子能够落到实处,所谓talk is cheap, show me the molecule,一个不能被合成的分子,即使在模拟计算中的结果再好,也缺乏具体的实际意义。因此,如何挑选值得合成的分子成为了我们这个时代的新问题。我们需要一种办法,在开始有机合成之前判断一个分子的合成复杂程度,以此过滤虚筛得到的大批量分子,从而高效地完成活性测试。

逆合成分析是解决可合成性最自然的手段。如果我们能够对一个分子写出合成路线,那么它的合成难度是一目了然的——然而即使是全自动的逆合成路线搜索,也有着不小的时间成本。因此,人们转向了对于分子可合成性的描述。时至今日,关于分子可合成性打分主要有两种途径:

1.基于分子片段复杂度的加和,以SAScore为代表。这种方法将分子分解为大量碎片并基于规则进行打分,可以快速处理大量分子,但由于分子的复杂度并不直接等价于分子的可合成性,这种办法在整体上趋势正确,但不乏与具体可合成性相悖的个例;

2.基于逆合成路径的打分,以SCScore为代表,这些方法会利用已知的逆合成路线信息,通过已知的路线来评估分子的合成难度(以SCScore为例,模型训练时会假设产物的合成困难度高于反应物),然而这种方法并没有显式地利用化合物的合成步骤等信息。

本文的通讯作者是来自韩国科学技术院(KAIST)化学系与人工智能研究所的김우연/Kim Woo Youn教授,第一作者是KAIST化学系Kim Hyeongwoo副教授,主要研究领域在分子设计与有机合成方向。作者认为,现有的计算机辅助逆合成路线规划(Computer-Aided Synthesis Planning)程序也可以用来作为分子可合成性的研究,通过拟合这些生成逆合成路线的步数,可以描绘一个分子的合成难度。然而,考虑到这些CASP程序给出的路线可靠程度参差不齐,作者将路线应用的反应类型限定在了常用的114个药物化学反应中,即所谓drug-focused retrosynthetic score,并预测分子利用这些反应的合成步数,拟合了DFRscore这一改进的可合成性打分。

——方法与结果——

作者依旧是从逆合成路线预测的角度来评估分子合成难度,但与前人工作的主要区别是,作者舍弃了自动提取模板的工作模式,而是采用了手动挑选的114个常用药物化学反应。作者认为,使用这些反应可以确保逆合成路线有效,而不是仅仅生成所谓的合成路线,在实验室中不起作用。值得一提的是,药物化学常用的反应在过去的几十年中都相当保守,因此挑选的这些常用药物化学反应也局限在一个较小的范围中。

通过类似蒙特卡洛树搜索的方式,作者实现了对训练集中250,000个分子的路线搜索,这些分子从PubChem中随机选取,满足以下条件:1)分子量小于600;2)由常见有机化合物元素组成;3)中性分子,不是盐或水合物;4)其SMILES可以被RDKit读取。这个训练集的化学空间和常见小分子化学空间类似,按照其合成路线步数,作者将其分为1~4步和“无路线“五类,对应DFRscore为1~5,且其分子个数在训练集中占比分别为1:1:1:1:4。

图1. DFRscore工作流程。

作者使用了一个图注意力网络来对分子图进行卷积,从而拟合这个分子的DFRscore。为了检验模型的效果,作者设计了三个测试集合:测试集A由ZINC/ChEMBL/MOSES中的10,000个分子构成,在DFRscore的五个类别上分别各占据了2,000个;测试集B对应2019至2021年间FDA批准上市的29个小分子药物;测试集C从生成模型GGM生成的分子中随机抽取了10,000个,又从虚筛库GDBChEMBL中随机抽取了10,000个,这个测试集构建的目的是为了验证DFRscore能否真正用于生成模型或虚拟筛选分子的可合成性评估。

测试集A与训练集的化学空间相对重叠程度较大,其结果也相对较好,在此略下不表。在测试集B上,作者利用其它两种可合成性指标SAscore与SCscore作为baseline进行对比,在29个药物上对其可合成性打分与实际合成步骤进行拟合,发现DFRscore的拟合优度最好,与实际合成路线步骤最接近,这说明DFRscore比之前的可合成性打分更能够表征分子的合成步数,有更好的化学意义。

图2. 三种可合成性打分与实际合成步数在测试集B上的拟合表现。

相比之下,DFRscore在生成分子数据集上的结果则更有意义,从结果来看,对于那些合成步骤多于4步的复杂分子,通过将DFRscore的过滤条件设置为4即可去除大部分。由于生成模型可以方便地探索化学空间,在利用可合成性过滤不想要的分子时,相对而言不那么看重精确率,而是更在乎召回率,我们希望筛选过后的都是相对较好合成的分子,从这个角度来看,当设置过滤标准为3或4时,DFRscore均达到了0.9以上的召回率,说明了该模型在这种情景下的有效性。

图3. DFRscore在生成模型GGM(a)和虚筛分子库GDBChEMBL(b)上的预测得分分布,图中不同颜色线条代表对应分子设计逆合成路线的真实步数。

——小结——

综上所述,作者发展了一种基于药物化学常用反应的可合成性打分,通过将反应类别限制在常用反应中,作者对可合成性打分做出了更有意义的预测,DFRscore的背后含义即“该分子需要用几步常见反应合成得到”,可以用作对生成模型所得到分子的快速过滤。

然而,作为一个可合成性打分指标,笔者认为作者和同类型工作(如RetroGNN)的对比还不够,自始至终作者的大规模比较都在拟合模型生成的逆合成路线,而这些路线的可靠性(即使使用的是最常见的药物化学反应)并不能一概而论。同时,起点分子的复杂度不同,也会造成“合成步数”这个指标的误导性,从这个角度来说,DFRscore更像是在拟合与已知in stock分子库的合成距离,但in stock分子具体是什么,每个分子的获取难度有多大,这一点在可合成性预测中也应该予以考虑。我们期待有新的研究可合成性的方式,从逆合成路线与分子片段复杂度以外的角度看待这个问题,赋予分子可合成性新的意义。

参考文献:
1. Kim, H. et al. DFRscore: Deep Learning-Based Scoring of Synthetic Complexity with Drug-Focused Retrosynthetic Analysis for High-Throughput Virtual Screening
. JCIM 2023.

2. Liu, C.-H. et al. RetroGNN: Fast Estimation of Synthesizability for Virtual Screening and De Novo Design by Learning from Slow Retrosynthesis Software. JCIM 2022, 62 (10), 2293-2300.

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多