分享

人工智能正在如何改变药物发现 | Nature 2018

 智药邦 2020-09-18

文章来源于微信公众号 智药邦(ID:PHAIMUS)

近年来,人工智能技术在各行各业的应用逐渐受到关注,正在改变我们生活的每一个领域。那么,人工智能技术对药物发现领域究竟有多大影响呢?前景如何?

为了尽可能完整的看待这一过程,我们做一些回顾。

早在2018年,科普作家Nic Flemming在Nature(IF=42.778)上发表过一篇评论文章《How artificialintelligence is changing drug discovery》,文章介绍了一些人工智能推动药物发现的案例,并客观评述了这种推动作用的价值和前景。 

我们对该文章进行了概要整理,欢迎阅读。 

01 新药开发技术的新视角

从新药开发的成本说起。

一个新药的平均开发成本大约26亿美元,这包括了花费在候选药物上的费用。
有没有新的解决方案呢?

辉瑞、赛诺菲、罗氏等制药巨头正在使用人工智能技术来促进药物发现。

新型科学家-机器人来了! 
事实上,人工智能技术在药物发现中的使用,可以追溯到2007年剑桥大学开发的Adam机器人成功预测酵母菌新功能的案例。另外,比Adam更高级的机器人Eva发现了牙膏中的成分三氯生可以靶向抑制DHFR酶来治疗疟疾。  

02 使用AI进行药物发现的初创公司举例

波士顿附近的生物技术公司Berg开发了一种模型,通过对比癌症细胞和健康细胞的生物学数据的关键差异,来寻找潜在的靶点和药物。

Berg的联合创始人兼首席执行官Niven Narain说:“我们正在通过使用患者驱动的生物学数据,来获得更具预测性的假设,而不是传统的试错法,从而颠覆了药物发现范式” 。

伦敦初创公司BenevolentBio可以从研究论文、专利、临床试验和患者记录等来源获取数据,形成基因、症状、疾病、蛋白质、组织、物种和候选药物关系的知识图-基于云的生物体。并使用该系统发现了5个治疗肌萎缩性侧索硬化症(ALS)的化合物,其中4个具有治疗前景。

马萨诸塞州的剑桥的无锡NextCODE公司使用AI对基因进行分类,帮助耶鲁大学研究人员发现了FGF控制葡萄糖代谢的机制。

NextCODE公司的负责人认为:我们开发药物并在临床试验中进行评估的方式,都将归结为非常复杂的模式识别

03 AI应用于药物发现的条件是否成熟

在过去的二十年中,计算机处理能力的持续快速增长,大数据集的可用性以及高级算法的发展推动了机器学习的重大改进。

目前,许多使用人工智能进行药物发现的初创公司都使用机器学习来识别隐藏在大量数据中的模式。 

04 关于未来需要做哪些准备

发现药物的技术不可能一直保持不变。

Narain说,博士学位和其他研究生课程的实施方式需要“发生根本性转变”,Chittenden对此表示同意,而斯坦福大学的Russ Altman则认为生物学的本科生需要拓展到统计学和计算思想,但是博士级别更需要专业的深度而不是广度。

正在使用人工神经网络进行基于结构的药物设计的牛津大学的Anthony Bradley认为,学会编码至少在接下来的5-10年内将是有用的,其他的工作计算机很大程度上都可以做到。

那么究竟可以做些什么,来为迅速发展的环境做好准备?Bradley认为很关键的是自我学习,充分利用可用工具的功能。

05 炒作or事实

人工智能和机器学习是否将会迎来一个更快、更便宜、更有效的药物发现时代?

有些人持怀疑态度,他们认为,计算机辅助药物设计的计算机模拟技术,并没有阻止自1990年代中期以来制药业R&D生产率的下降。

但大多数专家确实希望这些工具变得越来越重要。 

目前一些关于人工智能将彻底改变药物发现的预测,可能是夸大其词了。批评者认为,是有商业利益在起作用。并且到目前为止,还没有获批准的基于AI开发的药物。  

Narain认为,炒作不会持续太久,因为在未来五年左右的时间里,事实将在数据中显现出来。如果到那时我们正在创造更好的药物,并且更快、更便宜地生产它,那么人工智能将真正起飞



以下是《How artificialintelligence is changing drug discovery》的全文翻译,有兴趣的小伙伴可以继续阅读。全文4800字左右,预计阅读12分钟。 

人工智能正在如何改变药物发现

Nic Fleming

机器学习和其他技术有望使药物发现更快、更便宜、更有效。

Michele Marconi的插图

一个巨大的数字笼罩在新药发现科学家的心头,那就是:开发一种新药的价格估计为26亿美元。实际上,很多钱都被浪费了,因为这个估计的价格包括了花费在十分之九的候选药物上的费用,而这些候选药物在I期和正式批准之间的一些地方失败了。这个领域很少有人怀疑做一些不同事情的必要性。

领先的生物制药公司认为解决方案即将到来。辉瑞公司正在使用IBM Watson这一机器学习的系统来增强其对免疫肿瘤药物的搜索。赛诺菲已经签署协议,使用英国初创公司Exscientia的人工智能(AI)平台来寻找代谢疾病的治疗方法,罗氏子公司Genentech正在使用马萨诸塞州剑桥市GNS Healthcare的AI系统,以推动跨国的癌症治疗方法的寻找。大多数规模较大的生物制药公司都有类似的合作或内部计划。

如果这些技术的支持者正确的话,那么人工智能和机器学习将迎来一个更快、更便宜、更有效的药物发现时代。有些人持怀疑态度,但大多数专家确实希望这些工具变得越来越重要。这种转变给科学家带来了挑战和机遇,特别是当这些技术与自动化相结合时(请参阅“机器人来了”)。尤其是青年研究人员,必须掌握AI可以做什么,以及怎样最好地获得他们需要在明天的就业市场中就业的技能。

机器人来了-新型科学家

当需要编写人工智能(AI)的历史时,执行任务的算法很可能会把2007年6月12日标记为值得关注的日子。那一天,一个名为亚当(Adam)的机器人通过确定酵母基因的功能,结束了人类对科学知识发现的垄断。通过搜索公共数据库,对于催化酿酒酵母中反应的关键酶,Adam产生了关于哪些基因编码关键酶的假设,并在实验室中使用机器人技术对该预测进行了物理测试。之后,英国阿伯里斯特威斯大学和剑桥大学的研究人员独立地检验了Adam关于19个基因功能的假设。其中9个是新的而且准确的,只有1个是错误的。 

“使用AI的机器人科学家可以测试更多的化合物,可以提高准确性和可重复性,并且记录保存全面、可搜索”。剑桥大学系统生物学家史蒂夫·奥利弗(SteveOliver)说。他是开发Adam的小组的成员。  

1月,同一团队宣布,Adam的更高级的机器人同事夏娃 (Eve),发现三氯生(牙膏中的一种常见成分)有潜在的治疗耐药性疟疾寄生虫的作用。研究人员开发了酵母菌株,其中生长必需的基因已被疟原虫或人类的等价基因替代。Eve随后筛选了成千上万种化合物,以发现那些能够阻止或严重减慢依赖于疟疾基因的菌株生长的化合物,而不是那些能够阻止或严重减慢依赖于人类基因的菌株生长的化合物,以降低寄生虫的危害,同时降低毒性风险。早期结果被用来作为后期筛选候选药物的参考。 

这表明三氯生通过抑制DHFR酶来影响疟疾寄生虫的生长,DHFR酶也是抗疟药乙胺嘧啶的目标。然而,对乙胺嘧啶的耐药性很常见。研究人员表明,即使是在耐乙胺嘧啶的寄生虫中,三氯生也可以作用于DHFR。

Nic Fleming

19世纪50年代的AI先锋们讨论了可以像人一样感知、推理和思考的建筑机器-一种称为“通用AI”的概念,这种概念很可能会在科幻小说的领域中保留一段时间。但是,在过去的二十年中,计算机处理能力的持续快速增长,大数据集的可用性以及高级算法的发展推动了机器学习的重大改进。这有助于实现专注于特定任务的“狭义AI”。其中包括借助一种被称为自然语言处理的AI技术,来提高分析、理解和生成文本和语音的能力,以及提高旨在模仿我们的大脑理解世界的人工神经网络的能力。这样的技术已在诸如计算机视觉、语音分析和路线选择的领域中被广泛使用。这一进展也引发了一系列使用AI进行药物发现的初创公司,其中许多公司都使用AI来识别隐藏在大量数据中的模式。

例如,马萨诸塞州波士顿附近的生物技术公司Berg的研究人员开发了一种模型,该模型可以通过对1000多种癌症细胞和健康人类细胞样本进行测试来发现以前未知的癌症机制。他们通过改变细胞所接触的糖和氧气的水平,来模拟患病的人类细胞,然后追踪其脂质、代谢产物、酶和蛋白质的分布。该小组使用其AI平台来生成和分析来自患者的大量生物学和结果数据,以突出患病细胞与健康细胞之间的关键差异。

Berg方法的目的是根据疾病的精确的生物学原因,来找到潜在的治疗方法。Berg的联合创始人兼首席执行官Niven Narain说:“我们正在通过使用患者驱动的生物学数据,来获得更具预测性的假设,而不是传统的试错法,从而颠覆了药物发现范式” 。

使用这种方法,Narain的团队发现了某些天然存在的分子在癌症代谢中的重要性。这使该小组发现了一种新的癌症药物如何起作用,并指出了一些可能的治疗用途。这个药,BPM31510,目前正在涉及晚期胰腺癌患者身上进行II期临床试验。该公司还使用该AI系统来寻找针对其他疾病(包括糖尿病和帕金森氏病)的药物靶标和疗法。

伦敦的初创公司BenevolentBio有自己的AI平台,可以从研究论文、专利、临床试验和患者记录等来源获取数据。这形成了基于云的生物体(例如基因、症状、疾病、蛋白质、组织、物种和候选药物)之间超过十亿个已知和推断关系的表示。可以像搜索引擎一样查询它,以生成“知识图”。例如,医学状况以及与之相关的基因,或已证明会影响该基因的化合物。平台处理的大多数数据都没有注释,因此它使用自然语言处理来识别实体并了解它们与其他事物的链接。BenevolentBio首席执行官杰基·亨特(Jackie Hunter)说:“人工智能可以将所有这些数据放在上下文中,并为药物发现科学家提供最重要的信息” 。

当该公司要求该系统提出治疗肌萎缩性侧索硬化症(ALS),也称为运动神经元疾病(MND)的新方法时,它指出了大约100种现有化合物具有这方面的潜力。从这些化合物中,BenevolentBio的科学家们选择了5个,在英国谢菲尔德转化神经科学研究所的患者衍生的细胞中进行了测试。该研究于2017年12月在马萨诸塞州波士顿举行的ALS / MND国际研讨会上进行了报道,其中4种化合物具有前途,其中一种可以延缓小鼠的神经系统症状。

模式识别

尽管已经有这些前景广阔的应用,但许多科学家仍未意识到AI的能力。加拿大多伦多一家初创公司BenchSci在2月发布的一项调查,该调查为科学家提供了一种机器学习工具来寻找抗体。该研究发现,参与研究的330名药物发现研究人员中,有41%不了解AI(请参阅go./2xarpt3)。

该领域的领导者认为研究人员应该尽快掌握这些知识。 

“人工智能将导致人们对人类生物学的全面了解,并为我们提供充分应对人类疾病的手段”马萨诸塞州的剑桥的无锡NextCODE团队的负责人Thomas Chittenden说。无锡NextCODE成立于2015年,此前中国的药物发现公司WuXi AppTec收购了NextCODE Health,NextCode Health是从冰岛公司CODE Genetics衍生而来的。他说:“我们开发药物并在临床试验中进行评估的方式,一言以蔽之,都将归结为非常复杂的模式识别” 。 

2017年五月,一个包括纽黑文耶鲁大学研究人员在内的团队,验证了一个叫做成纤维细胞生长因子家族(FGFs)的蛋白家族在血管扩张中的角色(P. Yu et al. Nature 545,224–228; 2017)。这个过程在肿瘤生长和心血管疾病中非常重要。无锡NextCODE使用AI作为对基因进行分类的方法(这种方法根据基因的作用和其他属性来分类)的一部分,以寻找RNA序列变异、表达水平、分子功能和基因定位之间的联系。Chittenden的团队使用这种方法发现FGF通过控制葡萄糖代谢发挥作用。

一些人认为,AI查明以前未知的病因的潜力,将加速针对具有特定生物学特征的患者进行设计治疗的趋势。Hunter说:“个性化医学已经讨论了很长时间,人工智能将启用它”。  

怀疑论者指出:这些观点中一些更为热情的主张,与1980年代初开始的计算机辅助药物设计的兴奋相呼应。尽管这种计算机模拟技术在现代药物研发(R&D)中很重要,但它们并没有阻止自1990年代中期以来制药业R&D生产率的下降。

正在移动的球门柱

无论发生什么,行业领导者都同意,发现药物的工作和完成这些工作所需的技能不可能保持不变。有些人认为需要更广泛的培训。Narain说,博士学位和其他研究生课程的实施方式需要“发生根本性转变”,这应该扩展到医学院和本科生的教学中。他补充说:“例如,仅专注于-并且比任何人都学得更多的-特定基因突变的学生时代已经结束。” Chittenden同意:“从现在起的十年内,博士学位的面貌将大相径庭。学术课程将更广泛。下一代首先需要对人类生物学的理解,但同时又需要计算机科学、计算统计学和统计机器学习” 。

另一些人则认为,掌握基础知识比将注意力从核心专业领域转移出去更重要。加州斯坦福大学的生物医学AI研究员Russ Altman说:“生物学的本科生需要朝着统计学和计算思想的基本能力迈进。” “但是在博士级别,人们需要掌握深厚的技术技能。他们将获得深度而不是广度”。

2003年,奥特曼(Altman)与想深入研究这两个学科的学生共同推出了生物医学计算本科学位。今年3月,它在该机构的生物工程系重新启动。他说:“我认为,在斯坦福大学,我们正在尽早了解全球校园中将发生的事情” 。

关于AI将(即便是十年之后)如何影响甚至发现未来的疗法所需的技能,几乎没有共识。“能够编码至少在接下来的5-10年内将是有用的,但是我怀疑,除此之外,计算机将在很大程度上为我们做到这一点,”英国牛津大学的计算药物化学家Anthony Bradley说。他说:“在实验室中,我们可能需要一支训练有素的专业团队,与自动化和AI专家一起对特定反应区域的过程进行微调” 。“或者”,他补充说,“可能是'湿’实验室技能(进行实际化学或生物学实验所需的技能)十年后就不再使用了”。 

Bradley在牛津附近使用钻石光源同步加速器来筛选化合物中与分子靶标结合(即使这些分子只是微弱地结合在一起)的细小化学碎片,目的是提高它们的结合强度以产生新的疗法。他是一个小组的成员,该小组正在使用人工神经网络(一种受我们大脑处理信息的方式启发的训练算法),该研究是牛津蛋白质信息学小组基于结构的药物设计项目的一部分。目的是利用关于小分子的结构和化学活性的公开数据来训练他们的系统,以识别将对蛋白质药物靶标起作用的分子。

那些希望从事药物发现工作的人可以做些什么来为迅速发展的环境做好准备?采取措施使自己变得知情和灵活很重要,这一领域前沿的人士说。Bradley说:“我的培训为我奠定了基础,以便我大致了解该领域的位置,但是在一定程度上取决于学生自己来了解技术趋势的发展方向。只有保持通用性,您才能充分利用可用工具的功能” 他建议那些寻求进入药物发现领域的人,可通过追踪领先期刊以及以技术为重点的新闻来源和博客中的最新文章来跟踪AI的发展。 

Bradley说,自我驱动的学习尤为重要,因为大学能够提供的技能(学生需要去准备的、未来AI在研究中的角色相关的技能)是有限的。他说:“几乎可以确定是,没人能真正知道这些技能是什么”。

关于人工智能将彻底改变药物发现的能力的一些更夸张的预测,可能被证明是夸大其词了。批评者指出,有商业利益在起作用,并且到目前为止,还没有批准的AI开发的药物。Narain认为这项技术将推动重大进步,他同意提出夸大其词的主张,但表示不久就可以揭露它们的实质。他说:“炒作不会持续太久,因为在未来五年左右的时间里,事实将在数据中显现出来。” “如果到那时我们正在创造更好的药物,并且更快、更便宜地生产它,那么人工智能将真正起飞” 。

原文全文链接

https://www./articles/d41586-018-05267-x

参考文献

1.Fleming, N.(2018). "How artificial intelligence is changing drugdiscovery."Nature 557(7707): S55-s57

(Chris编译)

--------- End ------- --

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多