利用機器學習成功建立:高度精確的分子水模型!
雖然水被認為是世界上最簡單的物質(zhì)之一,但幾十年來,在原子或分子水平上模擬水的行為一直讓科學家們感到沮喪。到目前為止,還沒有一個單一的模型能夠準確地描述更多水的奇異特性,包括它在略高于熔點的溫度(4℃)下密度最大。

美國能源部阿貢國家實驗室(DOE)的一項新研究在數(shù)學上描述水的行為方面取得了突破。為了做到這一點,阿貢研究人員利用機器學習開發(fā)了一種新的、計算成本較低的水模型,該模型能更準確地表示水的熱力學性質(zhì),包括水在分子尺度上如何變成冰。

博科園:在這項研究中,阿貢納米材料中心(CNM是美國能源部科學用戶設(shè)施辦公室)研究人員使用機器學習流程優(yōu)化了一個新的水分子模型。根據(jù)大量實驗數(shù)據(jù)訓練模型,以生成一個高度精確,水的分子尺度模型。該研究的通訊作者Argonne nanoscientist Subramanian Sankaranarayanan說:優(yōu)化水的模型參數(shù)長期以來一直是一個挑戰(zhàn),目前存在50多種不同的水模型。在試圖了解如何在復(fù)雜參數(shù)空間中為任何給定的模型導(dǎo)航,以獲取水的廣泛特性,這是非常困難的。目前還沒有一個模型可以同時解釋水的熔點、密度最大值和冰的密度。

試圖建立量子力學或原子模型來捕捉水的行為讓研究人員感到困惑,因為計算量太大,而且仍然無法再現(xiàn)水的許多與溫度有關(guān)的特性。Argonne博士后研究員、該研究的第一作者Henry Chan表示:對于簡單的模型,如本研究中使用的模型,這一點更難實現(xiàn)。對于研究人員來說,選擇使用整個水分子作為模型的基本單元使他們能夠以較低計算成本進行模擬。這項研究的第一作者之一,路易斯維爾大學助理教授巴德里·納拉亞南(Badri Narayanan)說:雖然傳統(tǒng)上這些簡單的模型引入了許多近似,而且往往精度較低,但機器學習能在保持簡單性的同時創(chuàng)建更精確模型。

然而,即使這樣降低了計算開銷,如果沒有大型超級計算機,一些物理特性也很難模擬。研究小組利用美國能源部下屬的科學用戶設(shè)施Argonne Leadership Computing Facility的Mira超級計算機,對多達800萬個水分子進行了模擬,以研究多晶冰中界面的生長和形成。根據(jù)共同第一作者和CNM助理科學家Mathew Cherukara的說法:這個被稱為“粗粒度”的新模型達到了與包含原子級描述的模型相同。一般會認為引入這些近似通常會導(dǎo)致一個糟糕得多的模型:一個有效但效果不太好的模型。美妙之處在于,這個分子模型沒有像原子模型那樣精確,但最終仍是如此。

為了實現(xiàn)粗粒度模型的高精度,研究人員使用了來自近10億個原子尺度的信息來訓練模型,這些信息涉及眾所周知的與溫度有關(guān)的特性。訓練模型涉及Chan所稱的“分層方法”,其中每個候選模型都要經(jīng)過一系列測試或評估,從基本的基本屬性開始,然后逐步發(fā)展到更復(fù)雜的屬性??梢园阉胂蟪稍噲D教孩子一項技能,你從一些基本的東西開始,一旦你看到了進步,就會一步步增加難度。研究人員還表明,該方法可以用來提高其他現(xiàn)有原子和分子模型的性能。能夠使用分層方法顯著提高現(xiàn)有高質(zhì)量水模型的性能。理論上,應(yīng)該能夠重新審視所有的分子模型,并幫助它們中的每一個都達到最佳性能。


博科園-科學科普|研究/來自: 阿貢國家實驗室/Jared Sagoff
參考期刊文獻:《Nature Communications》
DOI: 10.1038/s41467-018-08222-6
博科園-傳遞宇宙科學之美
