在药物发现工作流中,化学优化的一个重要概念是化学系列 (chemical series)。这些是共享一个共同结构基序 (structural motif, 或称之为骨架) 的分子集合。2022年11月9日,来自瑞士诺华生物医学研究院的研究团队在Journal of Chemical Information and Modeling上发表论文“25 Years of Small-Molecule Optimization at Novartis: A Retrospective Analysis of Chemical Series Evolution”。在论文中,作者报告了来自诺华化合物数据库的约3000个化学系列的回顾性重建,这使研究者能够理解化学系列的一般性质以及结构性质、ADMET特性和靶标活性随时间的演变情况。
在过去几十年中,统计分析揭示了多种有关化合物的类药性信息的因素,并在药物发现的早期阶段得到了广泛应用。由于其简单性,类药五原则(Lipinski’s rule of five, Ro5),可能是最著名且具启发式的原则,其提供了关于氢键供体数量、氢键受体数量、亲脂性、可旋转键数量和分子量的指导。重要的是,如果是口服活性药物,则应以Ro5原则同时考虑各个成分。这种并行优化对大多数ADMET性质是有必要的,因为这些性质常常是是协同变化的或者是对立的。在相关的方向上,已有研究者根据批准药物的概况开发了预测方法,扩展了类药五原则,以定量估计类药性,其可用分数来排序化合物。
在这项工作中,作者描述了化合物系列的相关结构和性质随时间的演变。在第一步中,使用层次聚类来识别诺华公司化合物集合中具有预定义特异性的骨架。然后,将所有与之匹配的化合物分配给每个骨架,这产生了最初的单骨架系列。 这个系列的定义有一些潜在的缺点。首先,由于没有像先导化合物优化项目中那样在有限的化合物子集背景下定义系列,因此该骨架是特异的以避免对通用 (非特定) 结构基序(motifs)的解释。特别是对于在优化过程开始时合成的化合物,这可能会导致设置过于限制,因为这里会进行更大的结构探索,共享的骨架越小越通用。本文的方法无法很好地捕捉这些信息。第二,在优化过程中,随着时间的推移,骨架可能会发生变化。在一个项目中,这些修饰的骨架通常被定义为更大的公共系列的子系列。换句话说,本文的算法可能会在某一点上定义一个新的框架,并拆分系列,这将产生重叠的化学系列。优化了系列定义方法后,作者研究了化合物的注册时间分布。这表明,对于大多数骨架,可以确定一段高活跃时期(即,合成的许多类似物)。在此期间之前和之后,与各自骨架匹配的其他化合物有时在各个方向上登记超过一年。大约50%的已鉴定骨架表现出这种行为。多骨架系列中的活跃阶段确定后,作者提取了属于这些时间框架的各自化合物。并将这些子集称为项目系列,然后将其用于描述优化过程。对时间轨迹的分析揭示了几种反复出现的模式。在结构方面,作者发现分子Fsp3尺寸的增加和立体中心的相对频率是最显著的特征,而芳香环的相对频率降低。作者认为,这些模式确实反映了先导化合物优化的典型方法,因为它们将直接影响ADMET性质,如化合物的溶解度或亲脂性。关于ADMET模式,作者发现溶解度的增加和渗透性的降低是最显著的影响,尽管也可以观察到安全性指标 (CYP、hERG) 的改进。进一步的分析表明,增加的重原子数量是观察到的渗透率下降的主要原因。除了平均时间轨迹之外,作者还筛选了单个项目系列的结构或性质的显著趋势。文中作者进行了类似的观察,并可以证实所描述的趋势的存在超出了平均值。这项工作中呈现的背景不仅提供了大量信息供分析,还提出了许多值得研究的有趣问题。例如,在当前的工作中,作者研究了彼此独立的性质。然而,在现实中,这些都是相关的。其中许多关系是已知的,例如,溶解度和亲脂性通常呈负相关。可以预期,在时间趋势的背景下对这些关联的进一步分析将提供更多信息。作者朝着这个方向迈出了第一步,通过分析重原子数量增加背景下的ADMET性质的趋势。对靶标活性随时间的分析表明,当配体效率随时间降低时,pAC50和亲脂性效率趋于增加。这进一步突出了监测重原子数量和亲脂性的重要性。必须提到的是,系列到项目分析的匹配是一个自动化的工作流程,因此并不完美,但手动检查显示出与预期结果的良好一致性。总的来说,这项工作为系统分析过去几十年的药物优化工作奠定了基础。本文用数据证实和挑战了一些常见的医学化学知识。虽然本文开发的方法基于一些基本假设(特异性、活跃阈值、分子指纹),但结果似乎足够稳健,可以进行更深入的分析。尤其是更好地理解是否有可能根据历史数据得出化学系列进行/不进行决策的关键标准。参考文献Beckers M, Fechner N, Stiefl N. 25 Years of Small-Molecule Optimization at Novartis: A Retrospective Analysis of Chemical Series Evolution[J]. Journal of Chemical Information and Modeling, 2022.