ai分类函数公式(AI与DFT密度泛函数)(1)

DeepMind的AI,战果累累。我们熟悉的是它的AlphaGo在2015年10月以五比零击败了围棋职业二段樊麾。在科学领域,2016年DeepMind开始将AI应用于蛋白质折叠的计算–AlphaFold,在2018年预测了25个蛋白质的精确结构,并在2020年对蛋白质结构的预测达到了可与实验相媲美的精确度,以至于Andriy Kryshatofovych评价说,预测蛋白质如何折叠的问题“基本上已被解决了”。2021年12月,DeepMind在Science上发表了他们对AI应用于密度泛函的研究。

与AI相关的化学和材料领域的论文和专利比例在2005年之前相对较少,2005 – 2016保持了一个平稳的比例,2015、2016年开始有指数式增长。DeepMind并不是第一个将AI应用于密度泛函的,但他们通过AI获得的密度泛函DM21是迄今为止精确度最高的密度泛函,甚至超过了Perdew等人的密度泛函SCAN。密度泛函是当代化学研究中最重要的理论方法之一,2014年Nature的新闻团队的统计发现,历史上被引用最多的100篇文章中有12篇是关于密度泛函理论的。

在Kohn-Sham 密度泛函理论(DFT)中,电子间的交换相关(xc)能量是电子密度的函数,而电子密度是空间坐标的函数,即多电子系统的性质由电子密度泛函决定。但电子密度泛函的具体形式未知,只能予以近似。近似的方法通常属于两类或两类方法的混合,一类是在满足严格的限定条件下构造严格的泛函,一类是通过数据拟合构造泛函。前者产生的近似可以通过所采用的限定条件来预判,后者产生的近似则在于插值。在严格的限定条件中,与电子的非局域性相关的两个限定条件很难控制,即:原子、分子的分数电荷和分数电子自旋z分量。在Science的这篇文章(DOI: 10.1126/science.abj6511)中, DeepMind的 Kirkpatrick 团队将这两项限定条件和分子的数据表达成机器可以学习的数据,通过机器学习,向化学的精确预测前进了一大步。

在密度泛函理论下,时间无关的薛定锷方程变为有效单电子方程;在计算机上,计算量子力学软件和计算化学软件通过计算得到这一方程的自洽解,可以有效地预测什么样的分子和材料可以存在,以及它们有什么样的性质。但是在一些情况下,只有严格遵守分数电荷、分数电子自旋的限定条件才能给出电子密度及电子自旋在分子的原子中的恰当分布,对这些限定条件的忽略会导致标准密度泛函的明显的定性的失败。

ai分类函数公式(AI与DFT密度泛函数)(2)

图源:link.springer.com/chapter/10.1007/978-1-4757-0818-9_10

以一对完全分开的中性Na原子和中性Cl原子为例,严格的能量极小值对应的是两者之间的电荷转移为零,每个原子对能量的严格贡献是随电荷转移变化的两条直线,这两条直线在零电荷转移处不连续。但简单的密度泛函会是一条连续的曲线,且其极小值对应的是非零的电荷转移。有17个电子的氯原子会被错误的分配给17.4个电子,即电子数在17和18之间涨落,电子数为17的概率是60%、电子数为18的概率是40%。

人类已发展出几百种密度泛函,这些给定的方程与确切解以及实验数据之间的差异,是判断这些密度泛函对严格密度泛函的近似是否足够好的标准。类似于人类或者机器做人脸识别的过程,人工智能(深度神经网络机器学习)也可以通过类似的数据训练来识别电子密度的特征和模式。

在技术上,Kirkpatrick等发展的DeepMind 2021 (DM21) 泛函是局域杂化泛函。它的特征可以通过以下成份来构建,包括:局域自旋密度及其空间梯度,非相关、有效单电子的动能密度,以及严格的屏蔽和非屏蔽交换能密度。在拟合了一些主族分子的数据集之后,DM21通过标准的Kohn-Sham电子结构程序在训练数据集之外的分子上做了测试,所测试的大量数据包括55个具有多样性的关于分子热化学性质的大数据集,测试的结果,DM21的加权绝对误差是4 kcal/mol。

与大多数密度泛函相比,DM21的这个非常小的误差得益于它所采用的大量的、精选的拟合因素以及所拟合的分子数据。而且,不论拟合因素中是否包括分数电荷与分数自旋 (DM21,DM21m),两者在测试集上的误差基本上是一致的;但是,包含分数电荷与分数自旋这两个拟合因素的DM21在测试集之外的电荷转移问题和强相关问题上的表现比DM21m更好,比如H2 和H2的结合能曲线、DNA碱基对的电荷转移以及压缩状态下的氢链。在不破坏对称性的情况下,DM21捕捉到强相关现象的能力令人印象深刻。

对密度泛函的限定条件越多并且所拟合的系统越多,对严格密度泛函的近似就越好。SCAN (Strongly Constrained and Appropriately Normed functional by Sun, Ruzsinszky and Perdew) 密度泛函的方程组有17个严格限定条件,但这些限定条件中并不包括分数电荷和分数自旋的限定。与DM21不同,SCAN没有对成键系统做拟合,也没有使用交换相关作用中计算量大的严格交换泛函。但在不使用严格交换泛函但添加了标准耗散修正的情况下,SCAN在与DM21所测试的同样的55个测试集上达到了 8 kcal/mol的加权平均误差;并且,在不使用SCAN获得的自洽电子密度而使用Hartree-Fock电子密度时,SCAN的误差可以进一步改善到 6 kcal/mol且能消除电荷转移误差。这是在DM21之前所能达到的最好的精度。

DM21对主族元素化学来说非常好,但因为没有拟合更具挑战性的过渡金属系统,它对过渡金属化学的描述有可能不那么精确。同时,因为以下因素,对固体和液体的描述也可能不那么令人满意:一是DM21的训练集中还不包含固体和液体的数据;一是完整的严格交换泛函能够很好地描述原子和小分子的长程相互作用,但不能很好地描述固体和液体这些扩展系统。

在原则上,DM21中的分数自旋限定条件是严格的,但这一限定条件会抑制自旋对称性的破缺,而对称性破缺在固体和液体扩展系统中可以是真实的并且是物理性的。比如,氧化镍 (NiO)是反铁磁固体,它的局域自旋密度净值在无限长时间上的平均值是零,但在有限时间内则可以表现为局域自旋角动量沿着一列固定的有序的过渡金属原子交替变向,并保持数年。P.W. Anderson在1972年指出,与时间相关的电子密度或自旋密度的涨落,其维持的时间尺度可以随着系统增大到晶格尺寸而增大。这些大的涨落造成对称性破缺,而严格保持对称性的基态波函数所预测的只能是电子密度或自旋密度在无限长时间上的平均值。

这些局域自旋磁矩可以通过包括SCAN在内的标准的自旋密度泛函来预测。在超晶胞上的计算表明,甚至在反铁磁有序温度以上,这些磁矩及其产生的电绝缘仍然可以保持。因为能够打破对称性,SCAN能够解释并揭示强相关相互作用,解释了铜酸盐高温超导材料的绝缘体-金属转变、自旋-电荷条纹,对压缩氢链的计算结果也很好。

Kirkpatrick等发展的DM21的重要性不在于它得到了终极密度泛函,而在于用人工智能方法处理了分数电荷和分数自旋,这两者是阻碍得到密度泛函解析形式的原因之一。他们的工作表明,结合限定条件与AI对大数据和多样化数据集的拟合,可以设计并得到有更精确预测性的密度泛函。

参考文献:

https://www.science.org/doi/10.1126/science.abm2445

https://www.science.org/doi/10.1126/science.abj6511

,