分享

【分子动力学】基于神经网络获得构象能量辅助优化力场参数

 GoDesign 2022-08-17 发布于北京

研究背景——

分子动力学(MD,Molecular Dynamics)在许多学科中都有不少的应用,包括物理学,化学,生物学和材料科学,而其准确性取决于原子相互作用的模型。快速且准确对分子力场(FF,Force Field )参数化仍然是一个未解决的问题。通用的力场并不适用于所有分子,例如一些新型的药物分子。虽然存在基于量子力学(QM,Quantum Mechanics)的方法可以更准确地对这些分子进行特定的参数化,但是它们在计算上是很昂贵的,这使得对这些特殊的分子建立适合的参数化相对困难。Acellera研究所Gianni De Fabritiis组利用密度泛函理论(DFT,Density Functional Theory)数据训练神经网络模型NNPsNeural Network Potentials,极大地加快了新型药物分子获得QM精度数据的速度,使得特异性的分子参数优化变得容易。研究成果以“A Scalable Molecular Force Field Parameterization Method Based on Density Functional Theory and Quantum-Level Machine Learning”于20197月发表在JCIM上。

——主要内容——

对于常用的力场例如AMBER(GAFF)和CHARMM(CGenFF),它们通过引入更多的化学基团使力场的通用性可以覆盖更大的化学空间。但它并不总是能提供合适的力场参数,尤其是二面角参数。例如在二甲基戊烷沿图1a中的轴旋转得到的构象中,使用GAFF参数的能量分布与量子力学(QM)计算不一致。这种不准确的参数化可能使我们无法识别最佳候选药物。

图1:不同构象下通用力场与DFT计算结果

在本文中,作者开发了一种名为Parameterize的方法,用于单个分子的力场参数化。它结合了一般FF和NNP:首先,使用GAFF2参数和AM1-BCC原子电荷构建初始FF。其次,通过产生一组旋转异构体来选择和扫描可参数化的二面角(即可旋转的键)。使用初始FF将旋转异构体最小化,并用已经训练完成的ANI-1x模型评估它们的参考能量。最后,拟合二面角参数以再现参考能量,从而改善目标分子的FF。这在改进二面角参数的同时,降低了原本需要进行DFT计算的成本。具体流程图如下:

图2:Parameterize方法流程图

ANI-1x模型计算每个原子能量,并将它们的总和作为分子的总能量。原子能量用原子NN计算。每个原子NN是使用CELU激活函数的具有三个隐藏层的完全连接的NN,并且被训练以计算特定元素的能量。原子NN的输入是描述每个原子的局部环境的原子环境向量(AEV,Atomic Environment Vectors)。目前,ANI-1x支持四种元素(H,C,N和O),它由8个NNP集合组成,具有不同数量的隐藏层,并在训练数据的不同子集上进行训练。总能量计算为集合的平均值。集合中的不一致可以用作预测误差的估计。

例如将NNP应用于水分子(图3),其中r是原子坐标,Z是元素,G是产生原子n的AEV的特征函数,DNN是深度神经网络,En是原子n的能量,ET是总势能。可以看出,在计算两个氢的能量时使用了相同的网络,而氧的能量由与氢无关的氧网络计算。

图3:水分子的ANI-1x能量计算

图4:评估分子集TopDrugs

为了验证本文的参数化方法,作者在三个方面进行了评估。首先是测量NNP能量的准确性;然后,评估FF参数的整体质量;最后我们检查参数化时间,可靠性和缩放性。评估所用的数据集有三个,分别是(1)来自Sellers等人的45个分子;(2)TopDrugs(图4);(3)ZINC,由来自ZINC12数据库的1000个分子组成。

首先将NNP,GAFF和GAFF2的能量与DFT结果进行比较(图5)。可以看到NNP比GAFF和GAFF2更准确。其次可以看到新FF参数的准确性接近于NNP结果的准确度。以图1a中的示例分子进行参数化,总参数化时间为31 s,其中NNP的能量计算仅需3 s,而DFT需要约50min,具体比较如表1。同时使用ZINC数据集验证它的可靠性和缩放性,结果也很不错。

图5:不同方法计算得到的能量与DFT能量的比较 

表1:参数化时间比较


图6:二面角数量对MAE和参数化时间的影响

——小结——

本文作者开发了一个利用QM计算和NNP能量预测的力场参数化程序,实现了比GAFF2更好的准确性,同时它可以在几分钟内获得小分子的参数,但仅限于由CHON四种元素构成的分子。

参考文献:

Raimondas Galvelis, et al. "A Scalable Molecular Force Field Parameterization Method Based on Density Functional Theory and Quantum-Level Machine Learning" J. Chem. Inf. Model. (2019). DOI:10.1021/acs.jcim.9b00439

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多