分享

AI能让化学合成实现自动化吗?

 CBG资讯公众号 2020-08-19

人工智能(Artificial Intelligence,AI)可谓目前科学界的头号“网红”,从沃森(Waston)机器人不到10分钟诊断出白血病,到AlphaGo击败世界排名第一的围棋选手;从战场到太空,随处都可见其身影。AI也早已渗透进科研领域,正以各种方式玩转科研,包括洞悉化学合成的秘密。

合成机器漫画(来源:Nature)

在世纪60年代,有机化学实验室看上去就像炼金术的天堂。成排的试剂瓶,老旧的木制试管,还有俯在案边忙碌的化学家。经过50年的快速发展,实验室场景在改变。如今的实验室拥有一连串通风橱和分析仪器。不过,科研人员工作的本质是一样的。有机化学家通常在纸上计划自己的工作,不断描绘六边形和碳链直到他们想出合成给定分子所需要的反应顺序,然后试着遵循这一顺序用手煞费苦心地进行操作。

化学家一直试图将机器和人工智能整合至科研进程中,通过创造能自动合成有机分子的设备,将双手从该领域中解放出来。首先,设备必须能够访问有关分子如何被合成的现有知识数据库。第二,它必须能将这种知识反馈给一种算法,以便规划合成步骤。最后,它必须能自动按顺序使用机器反应器中的试剂。

诺华—麻省理工连续生产中心的自动化系统(来源:Nature)

最后一步的技术进步最快。在实验过程方面,人们已经运用机器实现了诸多进展。例如,制药企业通常采用自动化高通量平台来进行药物设计。美国加利福尼亚州的两家初创公司Transcriptic和Emerald Cloud Lab正在创建系统,力争将几乎所有由生物化学家操作的实验任务自动化。科学家们可以在线提交实验方案,而后实验步骤被转换为代码,输入机器人平台,继而由机器人平台自动执行一连串的实验。这种解决方案在需要密集实验操作的学科中最为常见,例如分子生物学和化学工程。

尽管自动化设备正变得更万能,但教导一台计算机设计自己的合成工序仍然是个大问题。硬件一直在那里,但数据和软件是大问题。

17世纪英国哲学家、现代实验科学的始祖,弗朗西斯·培根爵士在他的著作《新工具》(Novum Organum)中,提出了如今被称为培根归纳法的科学发现模型:采用归纳逻辑,将对特定现象的观察进行系统的收集、列表和客观分析,以此得出普遍的观点。培根的观点揭示了一个重要事实:科学发现的过程本身是具有算法的。它经过有限步骤的不断重复,最终生成有意义的结果。培根明确地采用“机器”(machine)这个词来描述他的方法。他的科学算法具有三个主要步骤:首先,收集对现象的观察结果,并整合成一个知识总库;其次,通过新的观察结果,形成新的假设;最后,通过缜密的实验来验证假设。

如果科学具有算法,那么它就具备自动化的可能性。Corey于上世纪60年代确定了逆向合成规则。在接下来的10年间,Corey开发出LHASA(Logic and Heuristics Applied to Synthetic Analysis)软件,该软件能使用这些规则提示合成步骤的顺序,使得合成设计变成一门可以学习的科学,而不是带有个人色彩的绝学。但因为数据库包括的反应太少而错误太多,LHASA和后续者都未能成功。


Chematica通过已有的合成反应优化药物vardenafil的合成路线(来源:Angew. Chem. Int. Ed.

2001年波兰科学院与韩国蔚山国家科学技术学院联合团队,开始开发一款名为Chematica 的软件,希望能帮助化学家快速找到最佳合成路线。至今,该团队手动录入了超过1000万个分子和反应,并将它们彼此链接,形成网状布局。与目前市场上应用比较广泛的Scifinder和Reaxys等分子式检索数据库不同,Chematica的运转建立在“深度学习”基础上,可以在短时间内预测反应,甚至提供未被文献报道的分子合成途径。

化学家只需把目标分子输入Chematica就能得到基于成本、底物易得性、步骤数筛选出的反应路线,这一切仅仅需要数秒钟。每一步反应及产物都会基于两个方程进行评分:反应评分函数和化合物评分函数。如果涉及的化学反应很难操作,反应评分就会变低;如果涉及的化合物结构比较简单或常见,化合物评分就会较高,反应路线也就显得更合理。这些评分函数使Chematica能够评估每条路线,将那些明显不可行的去掉。

Syntaurus找出了epicolactone最佳合成路线(来源:Chemistry World)

2016年,该团队又开发出新的功能模块Syntaurus,它包含了两万多种化学合成规则,这些规则涉及不能共存的基团、保护基策略、甚至键长键角的细微差别等。

而Chematica仅仅是近年来开发的合成分析软件/数据库之一。出版巨头Wiley也开发了一款建立在“大数据”和“机器学习”基础上的化学合成软件Chemplanner。 作为计算机辅助有机合成设计系统,它可以通过云计算帮助化学家在多种合成路径当中筛选出简洁高效的最优方法。更重要的是,该系统也不局限于已有的文献报道,而是可以利用精选的合成规则预测反应路线图,完成从目标产物到可获取的起始原料间的逆合成分析。Chemplanner还可以根据需要(如成本控制,有无催化剂等)重新设计路线。

Norquist团队

Norquist团队失败实验记录(来源:Haverford College

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多