智源論壇 | 王涵:基于深度學(xué)習(xí)的分子動(dòng)力學(xué)數(shù)值方法

2019 年 5 月 9 日,由北京智源人工智能研究院(Beijing Academy of Artificial Intelligence,BAAI)主辦的“智源論壇——人工智能的數(shù)理基礎(chǔ)”系列報(bào)告第一場(chǎng)開鑼。論壇當(dāng)日,北京?學(xué)副研究員王涵分享了其在人工智能數(shù)理基礎(chǔ)領(lǐng)域的研究探索。
王涵來自北京應(yīng)用物理與計(jì)算數(shù)學(xué)研究所,他的報(bào)告主題為《Deep Learning for Multiscale Molecular Modeling》,重點(diǎn)探討了基于深度學(xué)習(xí)的分子動(dòng)力學(xué)數(shù)值方法,介紹了深度學(xué)習(xí)在多尺度分子建模中獨(dú)特且有趣的應(yīng)用,以及過程中遇到的問題。
查看王涵完整報(bào)告視頻請(qǐng)點(diǎn)擊此處

首先什么是分子模擬,概念非常簡(jiǎn)單,假設(shè)這個(gè)世界由原子構(gòu)成,我們將每一個(gè)原子看作一個(gè)質(zhì)點(diǎn),然后依據(jù)牛頓運(yùn)動(dòng)第二定律,給定初值以后就能把這個(gè)方程解出來,從而獲知所有原子在任意時(shí)刻的坐標(biāo),這就是分子模擬在做的事。但是大家如果看過《三體》,馬上就會(huì)意識(shí)到這個(gè)方程要想精確求解,只能針對(duì)兩原子體系,任意一個(gè)多原子體系都無法在無窮長(zhǎng)的時(shí)間內(nèi)把這個(gè)方程精確地解出來,或者說你的初值誤差就會(huì)變得非常大,導(dǎo)致你的解完全不靠譜。
但我們想要通過分子模擬得到的并非原子運(yùn)動(dòng)的軌道,而是原子運(yùn)動(dòng)的軌道在無窮長(zhǎng)時(shí)間內(nèi)對(duì)相空間的作用。所謂相空間是什么?就是所有原子的坐標(biāo)構(gòu)成的一個(gè)空間。如果有 n 個(gè)原子寫在一起,我們想研究這個(gè)軌道在 n 空間中的分布,在這種情況下,數(shù)值誤差對(duì)這個(gè)分布的影響實(shí)際上是可以控制的。如果我們的離散做得足夠好,我們得到的結(jié)果就能夠和物理中想要的分布一致,這就是分子模擬一個(gè)最基本的理念,或者說是我們正在做的事情。

這里方程已經(jīng)寫出來了,但我們還不知道每一個(gè)原子的受力,每個(gè)原子的受力寫成公式實(shí)際上就是這個(gè)能量的負(fù)梯度,能量就是依賴于所有原子的。假設(shè)一個(gè)體系里有n個(gè)原子,知道坐標(biāo)后就能把體系能量寫出來,同時(shí)對(duì)任意一個(gè)原子坐標(biāo)求負(fù)梯度,就能知道原子的受力。我們所謂的分子建模,就是把能量函數(shù)的E給寫出來。多尺度分子建模就是說對(duì)這個(gè)原子坐標(biāo)做一定的粗?;缓笤趺礃訉懗鲆恍┑葍r(jià)的形式。

這里的 E 本質(zhì)上是多維函數(shù),多維函數(shù)在傳統(tǒng)數(shù)學(xué)的手段上處理起來還是比較困難的,正好深度學(xué)習(xí)為我們處理多維函數(shù)提供了非常有利的工具,這也是我們研究的出發(fā)點(diǎn)。
稍微回顧一下分子建?;蚪饽芰亢瘮?shù)E的傳統(tǒng)方法,包括兩種套路,其一是從頭算,就是把體系中的電子結(jié)構(gòu)給解出來,就像剛才邵老師講的,從學(xué)薛定諤方程出發(fā),把體系中所有電子的結(jié)構(gòu)解出來,這樣的話自然就獲得能量函數(shù) E。其優(yōu)點(diǎn)在于出發(fā)的模型幾乎沒有任何假設(shè),能量 E 可以解得非常精確,甚至和實(shí)驗(yàn)對(duì)得非常好;缺點(diǎn)則是非常昂貴的,典型的大家能夠算得起的體系實(shí)在是太小了。另外一種套路就是經(jīng)典力場(chǎng)建模,假設(shè)E有某種比較簡(jiǎn)單的函數(shù)形式,實(shí)際上是顯式的函數(shù)形式,當(dāng)然里面帶了一些參數(shù)。我猜出這種函數(shù)形式,然后我去套參數(shù),使得這個(gè) E 盡可能的靠譜。這么做的好處當(dāng)然是快,但是缺點(diǎn)就是精度非常有限。而我們的思路就是用深度學(xué)習(xí)去解決這個(gè)問題,我們希望達(dá)到的目標(biāo)就是能夠在保證第一性原理計(jì)算的精度條件下,做到計(jì)算開銷和經(jīng)典力場(chǎng)盡可能合并。
王涵及其合作者發(fā)展了基于深度學(xué)習(xí)的原子間相互作用建模方法——深度勢(shì)能,提出通過模型一致性估計(jì)深度勢(shì)能模型誤差的方法,在本質(zhì)上改善了原子間相互作用的建模精度。深度勢(shì)能的模型精度達(dá)到與第一性原理計(jì)算一致,同時(shí)計(jì)算開銷的階由 O(N3) 降低到 O(N),其中 N 為體系中原子個(gè)數(shù)。數(shù)值實(shí)驗(yàn)表明,在約 100 個(gè)水分子的模擬中,深度勢(shì)能的計(jì)算開銷比第一性原理計(jì)算節(jié)省將近 5 個(gè)數(shù)量級(jí),極大地提高了計(jì)算效率。
英國(guó)皇家學(xué)會(huì)外籍院士 Parrinello 使用深度勢(shì)能分子動(dòng)力學(xué)方法研究硅的熔化,克服了傳統(tǒng)原子間相互作用模型無法同時(shí)精確刻畫硅的固相和液相的困難。北京師范大學(xué)的崔剛龍教授課題組對(duì)深度勢(shì)能模型進(jìn)行了擴(kuò)展,用于對(duì)非絕熱激發(fā)態(tài)分子動(dòng)力學(xué)建模,克服了傳統(tǒng)方法在能量面交接錐處模型精度低的難題,獲得了和第一性原理一致的激發(fā)態(tài)動(dòng)力學(xué)模擬結(jié)果。
關(guān)于主辦方

北京智源人工智能研究院(Beijing Academy of Artificial Intelligence,BAAI)是在科技部和北京市委市政府的指導(dǎo)和支持下,由北京市科委和海淀區(qū)政府推動(dòng)成立,依托北京大學(xué)、清華大學(xué)、中國(guó)科學(xué)院、百度、小米、字節(jié)跳動(dòng)、美團(tuán)點(diǎn)評(píng)、曠視科技等北京人工智能領(lǐng)域優(yōu)勢(shì)單位共建的新型研究機(jī)構(gòu)。