DP答疑交流活動(dòng)第三期:DeePMD-kit參數(shù)設(shè)置


訓(xùn)練模型



輸入局域原子坐標(biāo)
經(jīng)過數(shù)學(xué)處理得到R矩陣
經(jīng)過嵌入神經(jīng)網(wǎng)絡(luò)得到G矩陣
G矩陣經(jīng)數(shù)學(xué)構(gòu)造得到滿足不變性的描述子D
描述子D經(jīng)過擬合神經(jīng)網(wǎng)絡(luò)最終預(yù)測(cè)能量
第一次上手可以只修改下圖中的參數(shù)

更細(xì)致的:

模型選擇:有碳的時(shí)候可能需要局域角度信息,需要用三體描述符se_e3模型(描述符引入了很多角度信息)
sel:截?cái)喟霃絻?nèi)最多原子數(shù)
rcut:經(jīng)驗(yàn)上6-9(對(duì)能量敏感或者不那么局域性的話調(diào)高一些,但初始訓(xùn)練6就夠了,后期再根據(jù)情況調(diào)到8或者9,9的時(shí)候計(jì)算量比較大了) 不需要根據(jù)盒子大小調(diào)整rcut


訓(xùn)練步數(shù):第一次嘗試可以設(shè)置10w-40w區(qū)間內(nèi);DPGEN:40-80w,因?yàn)樽铋_始不太需要那么高精度的模型,通常只是需要一個(gè)還可以的模型來(lái)快速補(bǔ)充訓(xùn)練數(shù)據(jù);最后的最后,在所有工作都完成,數(shù)據(jù)收集也基本完成的時(shí)候,最后收尾時(shí)可能需要把所有數(shù)據(jù)再重新高精度算一遍來(lái)做最后的能量精度提升以降低與DFT計(jì)算的誤差,此時(shí)numb_steps可能需要數(shù)百萬(wàn)甚至更多(尤其是對(duì)能量敏感的,例如彈性常數(shù),是一個(gè)對(duì)能量的二階導(dǎo)量,可能對(duì)能量收斂精度要求更高,需要更多的step)
這個(gè)步數(shù)設(shè)置其實(shí)是batch的個(gè)數(shù)
dpmdkit2.0不會(huì)自動(dòng)提供測(cè)試集數(shù)據(jù),需要自己額外提供,默認(rèn)傳入的數(shù)據(jù)都是訓(xùn)練數(shù)據(jù)