分享

Nat. Comput. Sci. | 化学反应网络和机器学习的机会

 DrugAI 2023-02-02 发布于韩国

报道人:肖宇航

审稿人:赵宏博

今年1月中旬,Nature Computational Science上刊登了一篇名为“Chemical reaction networks and opportunities for machine learing”的文章,此文旨在向读者展示机器学习在化学反应网络中的潜在作用和巨大机遇。

概要

首先给读者们介绍一下化学反应网络(CRNs)(下图):由化学物质、化学反应以及一些化学属性组成的网络。目前CRN广泛应用于化学研究中。

计算机与各类学科深层次交叉的今天,化学研究中使用计算机协助已不是什么稀奇事。化学反应中的中间物种存在时间短、通过计算机技术合成新材料等一系列问题与机遇都为机器学习(ML)提供了优质的培育土壤。接下来将为大家介绍本文的主角CRN-ML,它目前在化学领域的应用,并讲述开发人员在未来将面对的技术挑战。

CRN-ML之组成

结构组成三大要素:物种、反应、反应属性。起初的CRN结构都很简单,需要靠专业知识以及人力描述来人工构建,但这种方法也仅限于小型系统。于是有了更强力的自动化方法,主要分两类:

一、涉及势能面(PES)探索的方法。使用密度泛函理论(DFT)和相关的量子化学理论来发现反应物、中间体和反应。

二、基于预定义规则系统地列举物种和反应的方法。其又分两种:

1、使用一定规则定义物质和反应的反应模板;

2、过滤器。

不管是使用模板、过滤器或者PES搜索,都存在网络不完整性的问题。要解决这些问题,需要有能识别能量化网络不完整性的方法,另外有选择且最小限度地扩展CRN的技术也是必不可少的。

至于如何使用CRN,下面举一个经常遇到的应用:回答“这个物种是如何形成的?”。简单解释就是寻找从初始反应物到感兴趣的物种反应的途径。主要方法有最短路径算法,但代价函数的选取是目前主要困难之一,不过目前也有一些改进方法如蒙特卡洛树搜索等。当然,CRN还有一些其他的功能特性,比如识别关键中间体和产物、动态反应系统等等。

CRN-ML之应用

CRN-ML数据选择

  1. 学习势能面。化学ML开发了一种PES的替身——ML原子间相互作用势(或立场)。例如ML原子间相互作用点位可在精度和运行速度间取得平衡、使用ML原子间势模拟甲烷燃烧反应分子动力学并提取反应机制等。

  2. 精炼反应属性。反应中的一些属性(如动力学性质)难以预测,且提升成本昂贵。一种方法是通过高斯过程或贝叶斯神经网络量化数据的不确定性,另一种是迁移学习。

  3. 解决CRN不完整性。

    初步构建CRN之后,一般还需要扩展网络来解决不完整性问题。

    目前的一些工作有Grzybowski小组通过对文献数据和专家编码的反应规则进行训练来解决问题、Lan和An在不了解中间体情况下构建了描述氨在铁上合成的网络等。

CRN-ML数据源

  1. 自然语言处理。科学文献包含的丰富先验或理论数据可作为CRN构建的数据源。例如,Kononova等人编制的无机合成数据集,就包括了400多万篇论文和188000段描述合成、提取、反应和处理的步骤过程。

  2. 反应属性预测。

    ML回归模型在给定反应及反应性质的条件下可用于近似模拟每个反应及相关性质之间的关系。

    其可作为数据源来快速预测未知反应的性质。

    例如,FieldSchNet可模拟分子与任意外部场的相互作用,来描述显隐式的分子环境,最终完成求解可极化连续介质模型的任务。

CRN-ML数据分析

  1. 系统动力学。求解不同花絮物质浓度随时间的变化被称为化学动力学的“正”解。在给定观察到的系统动力学的情况下,通过恢复潜在的反应或速率方程也可以解决“逆”问题。目前已开发的求解方法有基于耦合微分方程的方法和使用基于物理的ML模型的方法。

  2. 模型简化。

    为提高CRN分析的效率,可适当消除影响小的物种和反应来简化CRN。

    传统方法有敏感性分析、时间尺度利用法和基于奇异值分解的方法等。

    也有不同角度出发的简化方法,如Katsoulakis和Vilanova开发的同时优化灵敏度分析和简化网络的方法等。

总结

CRN-ML方法的开发任重而道远。目前主要有三大挑战:

1、CRN存在特定的长期挑战(如网络扩展、模型简化)。设计利用CRN特征的新ML方法当是重中之重;

2、缺乏高质量的数据。像NLP等新兴的ML技术在缓解数据稀缺问题方面会有巨大潜力;

3、技术上的落后。目前用于构建和分析CRN的专业工具还很少。强烈建议CRN社区开发人员多多合作开发数据集等工具,这不仅有助于现有工作,更能吸引更多研究人员来开发CRN。

若能克服现有的CRN-ML的挑战,未来的CRN将会带来更大的机遇和发展空间。

参考资料

Wen, M., Spotte-Smith, E.W.C., Blau, S.M. et al. Chemical reaction networks and opportunities for machine learning. Nat Comput Sci 3, 12–24 (2023).

https:///10.1038/s43588-022-00369-z

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多