分享

Arxiv | 利用AlphaFold和其他人工智能平台,高效发现CDK20的小分子抑制剂

 DrugAI 2022-04-19

今天与大家分享的是英矽智能(Insilico Medicine)研究小组发表在arxiv上的“利用AlphaFold加速人工智能赋能的药物发现:高效发现CDK20的小分子抑制剂。”

AlphaFold计算机程序预测了整个人类基因组的蛋白质结构,被认为是人工智能(AI)应用于结构生物学的显著突破。尽管置信度不同,这些预测的结构仍然可以大大促进基于结构的药物设计(SBDD),特别是对于那些没有可用的蛋白结构信息或蛋白结构信息有限的新靶点。

在这项工作中,研发团队地将AlphaFold应用于端到端人工智能药物发现引擎中,该引擎由一个生物计算平台PandaOmics和生成化学平台Chemistry42组成。以低成本和高效率的方式,发现了一个针对没有可用的蛋白结构信息的新型靶点的潜在全球首创(first-in-class)苗头化合物。

在这个过程中,PandaOmics提供了一系列,Chemistry42基于AlphaFold预测的结构生成小分子化合物,科学家们合成被选中的化合物,并在生物学试验中展开测试。通过这种方法,该团队在30天内仅合成测试了7个化合物,就确定了一个针对CDK20的小分子苗头化合物(Kd=8.9 ± 1.6 µM)。

据我们所知,这是第一个公布的针对CDK20的小分子化合物,更重要的是,这项工作首次将AplhaFold应用于苗头化合物的确定,展现了AlphaFold在早期药物发现过程中的助力。

靶点选择和识别

根据国际癌症研究机构 (IARC) 发布的全球癌症(GLOBOCAN)统计报告2020年版,原发性肝癌是全球第六大常见癌种,也是癌症死亡的第三大原因。肝细胞癌 (HCC) 是肝癌的主要类型,约占患者总人数的 75%。由于预后不佳,全球范围内肝癌的死亡率和发病率不相上下。

目前晚期肝细胞癌的新标准一线疗法是PD-L1抑制剂阿替利珠单抗(atezolizumab)与贝伐珠单抗(bevacizumab)联用,相比于索拉非尼(Nexavar)(前晚期肝细胞癌标准疗法),能使死亡风险和疾病恶化风险分别降低42%和41%,但肝细胞癌患者仍有巨大未满足的医疗需求。

人工智能药物发现引擎PandaOmics可加速和优化早期药物发现的关键步骤。该生物计算平台将生物信息学的方法用于数据的分析、可视化和解读,并将它与多种先进的深度学习方法相结合来发现靶点。

PandaOmics的靶点发现和生物标志物识别系统是从组学和文本数据中获得信息,以此对基因与疾病靶点的关联性进行打分。根据文本证据(文本、科研经费和行业权威观点的综合评分)挑选出被广泛提及的热门靶点,而组学数据评分则基于基因的差异性表达、基因的各种异变体、蛋白相互作用、信号通路网络,进行基因与疾病关联的运算,然后通过传统的基因敲除/过表达等实验方法验证基因与疾病的联系。

这种方法可以帮助使用者无偏见的、更全面的发现靶点,人工智能工具对于高效发现靶点非常有帮助。这种基于靶点与疾病关联度评分的方法,将产生针对目标疾病的靶点关联度排序表,随后可以根据潜在靶点的新颖性、成药性、安全性、组织特异性等参数进行筛选。

PandaOmics 平台的另一个独特功能是能够将不同实验的数据组合到一个整合分析中,并利用对数据集的解读精确地给靶点排序。在这项研究中,科学家对目标疾病的数据进行了整合分析,该数据由10 个肝细胞癌的数据集组成(包括1133 个患者样本和 674 个健康样本)。在获得靶点与疾病关联度的排序表后,研发团队应用 PandaOmics 的筛选功能来获得具有全球首创(first-in-class)的靶点,并从中筛选出最有潜力的前20个靶点。这些靶点目前并无明确晶体结构,但AlphaFold已公布预测结果。我们选择了针对肝细胞癌得分最高的靶点CDK20,并运用Chemistry42 平台设计和生成了靶向CDK20的苗头化合物。

图1-研发团队将 AlphaFold与英矽智能的AI药物发现平台 PandaOmics 和 Chemistry42 相结合,针对肝细胞癌进行靶点发现与苗头化合物的设计和生成。

CDK20 有望成为癌症治疗的靶点

CDK20,又称细胞周期相关激酶(CCRK),是细胞周期蛋白依赖性激酶家族中最新发现的成员,由于其细胞周期依赖性和非依赖性功能(肿瘤微环境免疫抑制),近年来引起广泛关注。越来越多的证据表明,CDK20 在许多肿瘤细胞株中过度表达,在不同类型癌症患者的肿瘤样本中高表达,例如结直肠癌、肝细胞癌、肺癌和卵巢癌。

体外研究表明,雄激素受体 (AR)、CDK20 和 β-catenin构成了促进肝癌细胞周期进程的正反馈回路,CDK20 过表达经常与原发性肝癌组织样本中雄激素受体和 β-catenin的异位表达相关,并与患者肿瘤进展分期和较低的总生存率相关。

在肺癌细胞中,CDK20与NRF2 竞争和KEAP1的结合,从而防止NRF2 降解并增强其转录活性,以此降低肿瘤微环境ROS的水平。此外,肺癌细胞中的 CDK20 耗竭显示细胞增殖受损、G2/M 期阻滞缺陷,并增强对放化疗的敏感性。

除了通过调节细胞周期和致癌信号传导发挥促肿瘤作用外,CDK20 还参与某些肿瘤的免疫抑制。已有研究显示,通过激活 EZH2-NF-κB 通路,肝癌细胞过表达的CDK20 诱导 IL-6 的产生并促进MDSC 扩增;抑制CDK20的活性可增加IFN-γ+TNF-α+CD8+T细胞浸润并上调肿瘤细胞的PD-L1表达,从而增加了与PD-1/PD-L1阻断剂联合用药,以治疗肝细胞癌的可能性。因此,CDK20 抑制剂有望成为癌症,特别是肝细胞癌 (HCC) 的创新疗法。

基于AlphaFold 预测的结构设计和生成针对CDK20的苗头化合物

到目前为止,尽管针对 CDK 家族的其他成员的药物研发大获成功,但尚无针对 CDK20抑制剂的研发,可能的原因是该靶点没有可用的蛋白结构信息。图 2描述了我们基于Alphafold 预测的蛋白结构,利用生成化学平台 Chemistry42 基于结构的药物发现方法,设计和生成CDK20 抑制剂的过程(从结构提取到苗头化合物生成)。

图2-英矽智能针对CDK20靶点的苗头化合物生成过程

AlphaFold 预测的 CDK20 蛋白结构 (AF-Q8IZL9-F1-model_v1) 总体具有较高的置信度,其中C端因为占据并阻塞了 ATP 口袋的溶剂化区域(图3A),在分子生成时将其移除。Chemistry42从预测的蛋白结构中发现 CDK20 有一个较浅 的ATP 结合口袋(~150 Å,图 3B), 并且具有DFG-in构象。其中在铰链区残基Met84附近,Phe81占据了“gatekeeper”位置,在溶剂化区域含有两个酸性氨基酸残基(Asp87和Glu90)。研发团队使用Chemistry42基于结合口袋的结构特性,设计并生成了8918分子结构,通过分子对接和聚类得到了打分最高的54个具有不同铰链核心结构的分子,并选择了 7个化合物进行合成。

图3-A) CDK20 (AF-Q8IZL9-F1-model_v1) 的 AlphaFold 预测结构;B) CDK20 的 ATP 结合口袋。Met84 是铰链区残基,绿色标记为P-loop,酸性氨基酸残基 Asp87和Glu90 位于溶剂化区域。

  • 结果和讨论

图4-Chemistry42生成的7 个分子的化学结构

图 4 显示了被合成的7个化合物的化学结构,研发团队对这些化合物与CDK20的结合能力进行了评估。结果表明,在CDK20激酶结合测定中,化合物ISM042-2-001的Kd值为 8.9 ± 1.6 µM(n = 4,如图5A 所示)。研发团队还预测了ISM042-2-001的结合模式,如图 5B 所示(四个氢键相互作用用虚线表示)。除了与铰链区残基Met84形成的两个氢键外,ISM042-2-001还通过酰胺-NH基团以及吡咯-NH基团分别与残基Leu85、P-loop中的残基Ile10相互作用。酰胺-NH基团或吡咯-NH基团也可能与溶剂区域中的两个酸性氨基酸残基Asp87和Glu90形成氢键相互作用。基于预测的结合模式,研发团队目前正在对ISM042-2-001进行更多衍生物的设计与合成,以进一步提高酶活性。

图5- A) ISM042-2-001与CDK20的结合活性;B) ISM042-2-001与CDK20的预测结合模式。

结论

基于结构的药物发现 (SBDD) 一直是发现苗头化合物分子和进行先导化合物优化的主要方法。AlphaFold 预测的蛋白质结构为没有结构信息或者结构信息有限的新靶点的苗头化合物发现提供了强大的助力。在这篇论文里,研发团队展示了将AlphaFold与英矽智能的人工智能引擎PandaOmics和Chemistry42相结合来快速发现CDK20靶点的苗头化合物分子,以治疗肝细胞癌。在30天时间内,完成了靶点选择、分子生成、化合物合成和生物学测试。在合成的 7 个化合物中,ISM042-2-001展现与CDK20 的结合能力(Kd =8.9 ± 1.6 µM),可作为评估该靶点生物学功能的工具分子,对该分子的进一步优化仍在进行中。此外,这项研究也是将 AlphaFold 预测的蛋白结构用于药物研发的一个实例,之后英矽智能也会继续公布对其他靶点类型如 GPCR 和 E3 连接酶的进一步研究。

参考资料

arXiv:2201.09647 [q-bio.BM]

https:///abs/2201.09647

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多