当前位置:首页|资讯|机器学习

npj Computational Materials: 机器学习力场用于分子液体:碳酸乙烯酯/碳酸甲乙酯二元

作者:新威智能发布时间:2023-11-02


原创声明:本文为【新威智能】原创文章,转载及相关事宜请联系小智(微信号:nwMobile)。

背景介绍

机器学习方法在分子模拟方面的发展使得具有从头算级别的精度的大空间与时间尺度模拟计算成为可能。目前,机器学习方法已经被广泛应用于模拟以定向分子内相互作用占主导的独立分子体系,以及具有均匀相互作用的无机固体和液体体系。然而,由于分子内相互作用和分子间相互作用之间存在较大的分离尺度,机器学习方法难以实现准确模拟分子凝聚相。特别是对于分子混合物,由于分子间环境的异质性,使得情况变得更加复杂。

分子液体的许多重要物理性质如密度、粘度和介电常数等都依赖于分子间的相互作用力。因此,机器学习模型在分子内和分子间尺度上都需要获得良好的准确性。许多研究已经证明了机器学习方法在水溶液、甲烷、离子液体以及电解质溶液研究方面具有良好的前景。基于经典力场,利用机器学习方法来对分子体系中分子内部与分子间相互作用创建了专门的力场参数,巧妙地解决了尺度分离的问题。然而,在反应性系统中,由于分子在模拟过程中发生了变化,这种近似方法会失效。

文章简介

在本工作中,作者开发了一个针对二元电解质溶剂的机器学习力场,该溶剂是标准的LP57电解质(1M LiPF6 in EC:EMC (3:7 M) < 10 ppm H2O)。这种电解质由环状和线性碳酸酯的混合物组成,因为它们具有互补的特性:环状碳酸酯具有较大的偶极矩,可以高效解离盐类,而线性碳酸酯具有更高的运动性,可以改善电解质的离子扩散速率。通过使用经典动力学结合量子计算、极化力场、反应力场、短程从头计算动力学和最近的神经网络势能,研究了混合液体碳酸酯电解质的溶剂化结构和离子传输性质。

相关研究成果以“Machine learning force fields for molecular liquids: Ethylene Carbonate/Ethyl Methyl Carbonate binary solvent”为题,发表在国际著名期刊npj Computational Materials上。

图文解读

 

图1. A, B分别为NVE和NPT系综中GAP-MD模拟的势能和温度。C显示了四种不同GAP模型的NPT系综密度的演化,这表明轨迹是不稳定的,并形成气泡(绿色阴影体积)。在opls生成的训练集上训练的所有GAP模型都存在这个问题,与模型超参数的选择无关。

 图2. 连续的迭代(从左到右)展示了不同温度下参考分子组成(A)和400 K时一系列分子组成(B)的48个分子的GAP-MD轨迹逐渐变得更加稳定。顶部的弯曲箭头表示这些关键模型之间最重要的改进。C显示了从每个GAP-MD轨迹的最后80ps中提取的密度分布。这表明在相同的热力学条件下,不同的起始构型,温度依赖性(中间)和分子组成依赖性(底部)的再现性(顶部)。

 图3. A展示了在PNO-LCCSD(T)-F12计算方法下,EC2、EMC2和EC1EMC1二聚体的相互作用能曲线。B-D分别展示了采用四种不同的交换相关(XC)泛函计算得到的EC2、EMC2和EC1EMC1二聚体的相互作用能,包括有无分散校正,以及参考的PNO-LCCSD(T)-F12结果。

 图4. A、B展示了在ρ = 0.95 g cm−3下选择的分子内径向分布函数(C-O和H-C)。B对远程部分的分子结构进行了放大。C展示了三种密度下的C-O分子间径向分布函数。D展示了在ρ = 0.95 g cm−3下长达0.5 ps的速度自相关函数(VACFs)。E、F展示了由VACF傅里叶变换得到的振动态密度(VDoS),分别对应于C-H键的高频峰。G展示了在三个不同的固定密度,稳定为500 K的NVT系综中获得的目标分子组成下的压力分布。H展示了三个模型的平衡压力与密度的关系,以及根据数据拟合的Murnaghan-Tait状态方程。垂直虚线标记了零压截距,而通过NPT GAP-MD模拟获得的平衡压力用十字标记表示。I展示了从液态中获得的相应的能量分布(类似于G)。J展示了从能量波动计算得到的等体积比热(CV)。

 图5. A、B分别展示了使用Gen16/DTS进行的1000原子、总时长为1纳秒的GAP-MD模拟结果,稳定分别为300 K和350 K。C展示了来自参考文献(加号)和本研究(三角形)的不同组成和温度下的实验密度值。参考文献给出的是按重量浓度计算的,这里将其转换为摩尔组成。曲线是对数据进行拟合的三次多项式。虚线垂直线指示了GAP-MD模拟的准确分子组成(颜色与其他图层一致),其中插值数据用于D。D将GAP-MD密度(圆圈)与从C中插值得到的实验密度(加号和三角形)以及来自参考文献的纯EC额外数据(方块)进行比较。

 图6. A展示了两种分解过程,总力也是平动、转动和振动分量的总和。B、C展示了基于DFT-GAP的力相关图,将其分为两个不同的GAP模型:Gen10/DS和Gen11/DS,分别展示了分子内和分子间的贡献。

 图7. A展示了按照溶剂结构类型进行标记的Gen16训练数据集的K-PCA结果:溶剂结构(粉色)、体积扫描(黄色)和孤立分子(浅绿色)。B展示了体积扫描结果。C展示了使用DFT和三个不同GAP代数得到的EC:EMC(3:7 M)的能量-体积曲线。

 图8. A展示了Gen16训练集中C1/EC碳原子(原子标签为SI)的K-PCA结果,根据全局分子组成C进行着色。B展示了在目标组成Ct条件下,从GAP-MD轨迹计算得出的局部环境的f(c|Ct)分布。C、D展示了在两种不同组成条件下使用DFT和三种不同GAP模型获得的一系列体积扫描结果。Gen5+IM/DS和Gen6+IM/DS是在训练集Gen5和Gen6中加入了OPLS孤立分子后进行拟合的。插图说明了相应的分子组成:EC(橙色)和EMC(青色)。

 图9. A展示了在500 K和目标组成条件下的12分子Gen15/DS-MD模拟的密度曲线。B显示了放大的波动。使用DFT和Gen15/DTS重新计算了分子内和分子间能量。C展示了Gen15/DS和Gen15/DTS在包含40个构型的测试集上的DFT-GAP分子间能量和力的相关性图(其中包括B中的15个构型)。D展示了在目标组成条件下,一个分子在体积扫描中所经历的分子间质心力。

总结与展望

在这项研究中,作者展示了一种针对EC:EMC二元溶剂的机器学习训练方法,并通过与从头计算分子动力学(ab initio MD)结果以及与实验值比较来验证了该模型的准确性。其中,对于固定的数据集拟合的机器学习势在分子动力学(MD)中不稳定性,特别是在NPT系综中,密度波动对于准确描述分子间相互作用非常敏感。迭代训练是获得稳健模型的关键,非物理的密度波动可以被用作扩展训练集的代理指标。分子内和分子间相互作用具有不同的尺度和维度,这给机器学习建模带来了复杂性。在训练模型时,主要困难源自分子内和分子间相互作用之间的巨大失衡,并且这种挑战在所有分子凝聚相系统中可能普遍存在。此外,内分量更容易从总能量和力中拟合出来,因为它支配着损失函数。然而,明显较弱的分子间相互作用则决定了液体的热力学性质,因此一个好的模型必须以极高的准确性描述这一部分的相互作用。作者开发了一系列技术,如刚性分子体积扫描和分子内/分子间误差分离。通过使用这些技术来评估势函数,并提高其在相关分子间尺度上的性能。多组分的分子液体对机器学习建模提出了更大的挑战,因为它们具有复杂的局部分子环境。因此,用于模拟目标分子组合物仍然必须在所有组合物上进行训练,以这种方式扩展数据,确保所有局部分子环境在训练集中具有一致表示。此外,在使用SOAP描述符时,需要仔细选择超参数以准确描述分子内和分子间相互作用,通过优化径向基函数和稀疏集合,以实现在两个尺度上都表现良好的权衡。该机器学习模型可以推广到更复杂的系统,如电解质(溶剂+盐)和溶剂-电极界面(SEI)。在这两种情况下,需要准确描述系统中的长程静电相互作用以得到准确的离子传输和界面化学信息。


聚焦电化学、储能、材料领域

更多大咖报告/顶刊动态/资源干货

/科研招聘/学术会议 码上免费看



Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1