分享

Nat Synth|化学和材料科学中自动化实验室的兴起

 智药邦 2023-01-31 发布于上海

Nature Synthesis是Nature出版集团于2022年1月创办的期刊,旨在汇集来自化学和材料合成各个领域的基于有机、无机、有机金属和材料化学的工作,以及这些学科的跨学科研究。

2023年1月30日,来自北卡罗来纳州立大学化学与生物分子工程系的Milad Abolhasani等人在Nature Synthesis发表文章The rise of self-driving labs in chemical and materials sciences。

该文介绍了自动化实验室近年来的发展现状和实施路线图。

摘要

加快发现新的分子和材料,以及开发绿色和可持续的合成方法,将有助于解决能源、可持续性和医疗保健方面的全球挑战。最近,数据科学和自动化实验技术的发展推动了整合机器学习、实验室自动化和机器人技术的自我驱动实验室(self-driving labs,SDLs)的出现。

SDL是一个机器学习辅助的模块化实验平台,它可以迭代操作由机器学习算法选择的一系列实验,以实现用户定义的目标。这些智能机器人助手通过对化学空间的快速探索,帮助研究人员加快基础和应用研究的步伐。

在这篇综述中,我们介绍了SDL,并提供非专业科学家实施它们的路线图。我们介绍了SDL在该领域成功实施的现状,并讨论了它们目前的局限性和未来的机会。

主要内容

为能源、可持续发展和医疗保健方面的全球挑战寻找切实的解决方案非常重要。然而,目前应对这些挑战的策略是时间、资源和劳动密集型的。

这些例子有一个共同的挑战:需要探索大量的连续和离散的实验变量,以找到最有效的成分以及分子和材料的制造路线。目前在化学和材料科学中的探索策略依赖于先前的知识,并且在实验中依赖于一次一次地或以组合方式改变变量。尽管这些方法简单明了,但它们并不能满足化学和材料科学中解决相关挑战所需的探索速度。尽管最初非常有希望,但组合筛选策略并没有在能源材料或小分子领域取得重大突破,原因是每增加一个实验变量,所需的实验数量就会呈指数级增长。

实验探索化学空间的巨大规模和高维度(维度在此指连续或离散的实验变量),意味着需要新的综合策略来加速发现新分子和先进功能材料,并为它们的放大合成和制造找到可持续的方法。

机器人技术和人工智能的最新进展为重塑实验化学和材料科学的研究提供了一个令人兴奋的机会。ML、实验室自动化(例如合成、分离、纯化和表征)和机器人技术(例如试剂制备和不同实验模块之间的样品转移)的融合推动了"自我驱动实验室(SDLs)"的发展。

SDL采用了过去十年学术界和工业界在实验室自动化、反应小型化(通过流动化学和微流控技术)和在线分析表征方面取得的科学和技术进展。与传统化学和材料科学实验室中依赖人类的实验环境相比,SDL使用机器人操作多种重复性任务(这些任务耗时长、要求精确或在处理有毒或易燃化学品时有安全问题),而计算机在某些任务中可以胜过人类科学家,如处理高维大数据。

通过这种方式,SDL解决了传统化学和材料科学实验室的三个挑战:(1)低效和缓慢的实验空间探索,(2)不同实验阶段之间的物理隔断,(3)执行一个实验和选择下一个实验的时间间隔。

图1:传统实验室与自我驱动实验室

研究人员从传统化学和材料科学实验室(a)过渡到SDL(b)的图示,通过使用模块化机器人实验和实验的智能规划,来解决当前互不关联的实验工作流程的挑战。

通过实验模块的机器人集成,SDLs将原本物理上不相干的试剂制备、合成、表征和性能评估等阶段连接起来,建立了一个端到端的实验工作流程,以加速新分子和材料的合成和开发。

通过加入ML,SDL可以智能地探索化学空间,而不是一次改变一个变量,同时最大限度地减少或消除获得实验结果和为下一个实验条件作出决策之间的时间差距。

智能机器人助手的目的是加速发现,并利用化学家和材料科学家的时间来解决高水平的科学问题。例如,为图1a所示的每个研究人员提供一个研究加速度为10倍的SDL(图1b),可以使他们的整体研究生产率提高至少30倍,这使得他们可以研究新的科学问题。因此,SDL重塑了操作员和/或研究人员在化学和材料科学工作流程中的角色(图1b)。

在过去的十年中,SDL在加速分子和材料的合成和制造方面有很好的应用,例如碳纳米管、复杂的有机化合物、纳米材料、相变记忆材料和薄膜材料。然而,SDL在化学和材料科学中的应用仍然是有限的。导致SDL进展缓慢的原因是缺乏:(1)标准化和具有成本效益的硬件,(2)容易获得的软件,(3)方便化学家和材料科学家的操作指南,(4)基于物理学的模型与自主实验的结合。

这篇综述介绍了用于实验化学和材料科学的SDL,并强调了最近自主合成有机分子和功能(纳米)材料的成功案例。同时提供了在传统化学和材料科学实验室启动SDL的路线图,并讨论了成功实施SDL的步骤。

化学和材料科学中的SDL

SDL是一个智能实验平台,配备了不同的硬件模块,以闭环的形式迭代操作由ML算法选择和规划的一系列合成或物理过程,以实现预定的目标。SDL的闭环操作是指通过遵循一系列自动化的任务、获取实验数据、更新ML模型并对SDL要测试的下一组实验条件做出决定来执行ML选择的实验的循环。通过智能实验计划,SDL产生的大数据可以迅速提供有关复杂多阶段反应的基本反应机制的重要信息。

图2说明了SDLs最近在化学和材料科学中的实施情况。例如,SDLs实现了半导体的闭环合成-属性关系映射(图2a)和按需合成(图2b),比传统技术快1000倍以上。一个连续8天无人看管的SDL操作(688次实验)揭示了一种有效的光催化剂配方,用于从水中产生氢气,其活性比现有技术高6倍(图2e)。

图2:SDLs在化学和材料科学中的成功例子

SDLs的路线图

考虑在化学或材料科学研究中采用SDL的科学家最常问的问题是:我应该从哪里开始、哪些ML算法可以用于实验选择和数据挖掘、建立一个SDL需要多长时间、建立一个SDL的成本是多少。

这些问题的答案与要制备的分子或材料的类型以及研究的目标直接相关。图3a展示了SDL的一般路线图,旨在回答"我应该从哪里开始"这个问题。

从硬件的角度来看,目标分子或材料的类别决定了所需SDL硬件模块的选择,即指定试剂和反应的类型(即气相、液相或固相),以及必要的表征技术。从软件的角度来看,SDL操作的目标也决定了智能实验计划的范围和SDL闭环所需的软件组件。

图3:SDL的路线图

a, 在化学和材料科学实验室建立SDL的方法概述。b, 一个使用机器人液体处理和基于孔板的合成建立的SDL的流程图。c, 一个端到端SDL的流程图,用于在无空气和水分环境下加速清洁能源材料和设备的协同设计。

如图3a所示,SDL不同模块之间的样品转移可以由固定的或移动的机器人处理,或者使用泵、阀门和管道。

带有流体样品传输和固定式机械臂的SDL配置需要定制开发,并将表征模块与SDL的合成模块具体整合,而移动式机器人则是对传统化学和材料科学实验室的一种改装。除了样品转移,机器人手臂还可用于自主重新配置从起始试剂到最终纯化产品的端到端模块化工作流程,这大大扩展了SDL探索连续和离散变量的能力,并能够进入比传统实验平台更大的设计空间。

从软件角度看,不同SDL模块之间的数据流是闭环操作的关键点。使用强大的数据表征和元数据跟踪策略的可靠数据流,即记录和报告每个实验的潜在特征,是真正将分子和材料的合成和制造数字化的必要条件,具有可扩展和可转让的知识。只有当SDL测试的所有反应的标准化和可靠的数字数据变得容易获得时,加速发现才成为可能。

SDLs结合了ML建模和实验数据的不确定性量化或遗传算法,以顺序、闭环和自适应的方式有效探索分子或(纳米)材料的合成设计空间。自主实验的这个关键的适应性方面利用了数据驱动的ML模型的不确定性量化,以克服非适应性组合筛选技术的局限性。

建立一个SDL需要多长时间?建立一个SDL的成本是多少?这些问题的答案与所需实验模块的复杂性(例如,单阶段与多阶段实验)、操作过程条件的范围和数量(例如,压力和温度)、溶剂的类型、所需的表征技术和可接受的精度直接相关。为化学和材料科学实验室建立一个可靠的、具有高度可重复性的SDL,可能需要几周到1-2年的时间,费用从不到1000美元到超过100万美元。

SDL的成功案例

在过去的五年中,概念验证SDL(例如Chemputer、BEAR、CAMEO和Artificial Chemist)被成功地用于自主合成纳米粒子、聚合物和共聚物、薄膜材料、碳纳米管、超分子团块、复杂的有机分子、光催化剂和形状记忆材料,应用于添加剂制造、液体产品配方、药品和清洁能源技术。

图4显示了SDL硬件和机器人集成的三种方法。

图4:机器人技术在SDL中的应用

移动式(a)、固定式(b)或流体式(c)机器人的照片,用于SDLs的实验模块之间的自动样品转移。

移动机器人(图4a)的独特之处在于可以方便地使用化学实验室中的常规表征技术,而不需要与SDL的合成模块直接整合。尽管有这一优势,但移动机器人的成本很高,它能提供精确和可重复的样品转移,并有多个抓手,这对这种SDL来说是一个主要瓶颈。

图5显示了平行间歇式反应器(图5a)和流动式反应器(图5b)的例子,用来在SDL中自动进行反应。

图 5: SDL反应器的多样性

平行间歇式反应器(a)和小型流动反应器(b)用于薄膜材料(a,左)、金属纳米颗粒(a,右)、活性药物成分(b,左)和胶体量子点,QD(b,右)的控制合成。

从表征的角度来看,在线和离线模块,如定制开发的光谱技术和成像工具,以及现成的分析单元,如高效液相色谱、傅立叶变换红外光谱、核磁共振光谱和气相色谱,都已经成功地与SDL整合,用于自主合成和开发功能材料和分子。

此外,在线表征模块可以在多阶段合成或材料制造的每个阶段后提供测量的机会。这种中间阶段的信息可以通过早期识别更有利的合成路线来加速在多阶段过程的高维空间中进行搜索。SDL与在线表征技术的整合利用了过去20年通过芯片上的实验室技术的出现和发展而开发的大量硬件开发和在线反应采样技术。除了常见的光谱表征技术外,使用电子显微镜(透射电子显微镜和扫描电子显微镜)和小角度和广角X射线散射对制造的(纳米)材料进行结构表征也可以与SDL整合。

从ML的角度来看,一系列适合处理连续和离散参数的策略,从贝叶斯优化到进化算法(例如协方差矩阵适应进化策略和遗传算法)已经成功地在SDL中实施,用于加速开发和按需合成有机分子、纳米材料和薄膜材料。

SDL的局限性和未来机遇

尽管SDL在加速合成复杂的有机分子和先进的(纳米)材料方面有成功的概念验证案例,但仍有许多机会需要进一步研究和开发。

首先,对于自主机器人实验的非专业人员来说,SDL从复杂的定制开发技术过渡到实验化学和材料科学的主流方法,需要在硬件开发方面取得重大进展,这包括模块工程和在线表征技术,以减少进入障碍,如成本、模块组装、操作和故障排除。机器人和表征模块的高成本,定制开发的模块的复杂组装和大量的故障排除,所有这些加上硬件模块、数据流、数据表示和智能实验选择算法的缺乏标准化,是目前SDL的主要限制。但SDL的初始成本障碍是化学和材料科学领域研究加速的一个有利机会。此外,最近世界各地云实验室的增长为早期职业研究人员提供了另一个潜在的途径,使他们能够在没有重大资本投资的情况下获得最先进的机器人实验设施。

科学家们在整个化学和材料科学领域采用SDL,将意味着研究实验室的高度智能化和灵活自动化,并具有自主可重构的实验模块。与小分子材料相比,自主开发先进功能材料的挑战在于文献中缺乏可重复的数据。不过,尽管证明有偏差,但在有机合成方面已经实现了,并成功地实现了数据驱动的逆向合成或高度精确的反应预测,但在高级(纳米)材料方面却基本上失败了。然而,这种失败为SDL创造了一个独特的机会。总的来说,SDL可以通过数字化、增强准确性、可转移的知识和最大限度地减少人为错误的影响来提高实验数据的可重复性。

尽管可以利用移动或固定的机械臂在不同模块之间转移液相试剂或产品,或自动重新配置SDL,但在处理固相试剂的SDL中,或在需要更强大的表征技术(如核磁共振光谱)的情况下,大多需要这些机械臂。处理固相反应、试剂或样品的SDL的一个关键要求是需要使用机器人技术进行精确的固体粉末计量,并在不同的SDL模块之间进行快速和可靠的样品转移。尽管在过去的20年里,机器人和固体喷点技术取得了快速的发展,但精确的固体喷点和机器人手臂的高成本,以及所需的精度、可重复性、移动性和速度,对SDL的广泛实施构成了限制。因此,采用SDL的下一个关键步骤是开发具有成本效益的移动机器人操纵器,以实现SDL设计的自动重新配置和适应工作空间的动态变化的灵活性。降低移动机器人机械手的成本,可以在SDL中加入多个机器人,这样可以防止在特定机器人可能出现故障的情况下,SDL的闭环操作出现中断。

SDL的一个重要的软件方面是它们与ML的强大和灵活的整合,为在分子和材料的设计空间中的导航提供自主性。快速增长的ML建模和实验选择策略清单使得算法选择对非专家来说是一项具有挑战性的任务。这一挑战对于SDL未来的发展是一个令人兴奋的机会,它可以使ML算法标准化,适合不同的端到端实验工作流程、操作模式(探索、开发或机理研究)和目标分子或(纳米)材料类别。

随着未来几年SDL的实验模块和独立输入参数数量的增加,将需要更多的数据和/或物理信息的ML策略,以减少计算和实验的总成本,以发现新的材料和分子或可持续的方式来大规模制造它们。

SDL最吸引人的方面之一是它们的远程操作能力,通过云端或远程连接来定义SDL操作的下一个目标,这一点在很大程度上还没有被开发出来。自动访问起始试剂库,结合可靠和可重复的自动样品制备、合成以及在线和离线表征技术,将会大大减少SDL操作过程中研究人员在实验室的时间。

参考资料

Abolhasani, M., Kumacheva, E. The rise of self-driving labs in chemical and materials sciences. Nat. Synth (2023). https:///10.1038/s44160-022-00231-0

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多