【原】Nature | 突破优化合成反应瓶颈，机器学习提供新思路！

DrugAI 2022-04-19

展开全文

今天给大家介绍的是来自不列颠哥伦比亚大学Jason E. Hein教授发表在Nature官网News and Views上的文章。在本文中，作者介绍了Shields等人最近发表在Nature上关于加快各种合成反应的优化速度的可访问机器学习工具这一工作，并揭示了人为认知偏见如何影响优化。

详细内容参见《Nature | 贝叶斯优化算法为合成化学带来了哪些突破？》。

＋

背景

无论是在开发应急救生药物的合成途径还是探索新材料的潜能方面，合成目标化合物的反应优化问题对于化学研究和发现都至关重要。但反应优化通常需要反复进行实验，以平衡众多耦合变量发生冲突带来的影响，并且经常涉及在成千上万种可能的实验条件中寻找最佳位置。目前，专业合成化学家使用简化的模型反应，启发式方法和从对实验数据的观察中得出的直觉来解决这一广阔的实验空白。Shields等人在Nature中报告了一种机器学习软件，该软件在优化各种反应类别时所需的迭代次数平均地比人类更少。

机器学习已成为化学合成各个方面的有用工具，因为它非常适合于推断预测模型，该模型通过识别多维数据集中的模式来解决合成问题。但是，化学家需要学习新技能，才能在他们的研究中正确部署机器学习，从而限制了这种方法的广泛采用。Shields等人开发了一个开放源代码的软件工具包来解决此问题，该工具包可以被化学家轻易采用。

为了训练他们的模型，Shields等人选择了机器学习中的贝叶斯优化法。他们的开源软件包含研究人员对具有任意数量实验变量的系统进行贝叶斯反应优化所需的所有组件。

＋

模型

正如Shields等人的工作所强调的那样，贝叶斯算法非常适合于反应优化，因为它们擅长处理相对较小的数据集。从稀疏数据开始，该算法会创建一个替代模型，以尝试数学定义输入变量（反应参数）如何影响输出目标（反应收率或其他性能指标）。随后，该算法获取新实验的数据更新模型。反复循环，直到反应性能达到指定目标或试剂耗尽为止。

随后将贝叶斯优化的性能与人类专家的性能进行实验比较，结果如图1所示，专家们做出了更好的初始选择，但是在第三批实验之后，该算法的平均表现优于人类。

图1 专家和算法在反应优化中的比较

＋

总结

Shields等人开发了一种易于使用的工具，可引导研究人员(包括非专家)完成多种化学的编码和优化过程，而无需更改代码。该工具不仅加快了化学合成研究的步伐，而且有助于增加测试的反应变量的范围，进一步消除了化学家对潜在的实验变量进行分类以减少时间和材料成本的需要。本文作者希望这项技术会被广泛采用，从而能够快速优化反应条件并发现新颖的合成路线。

参考资料

1.Hein J E. Machine learning made easy for optimizing chemical reactions[J]. Nature 590, 40-41 (2021).

https:///10.1038/d41586-021-00209-6

2.Shields, B.J., Stevens, J., Li, J. et al. Bayesian reaction optimization as a tool for chemical synthesis. Nature 590, 89–96 (2021).

https:///10.1038/s41586-021-03213-y