最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

量化大牛Donald G. Truhlar全新力作!

2023-01-03 10:20 作者:唯理計算  | 我要投稿

秋去冬來,北風凜冽,科研人宅在實驗室搗鼓實驗;

寒來暑往,四季更替,計算人貓在電腦前撥弄數(shù)據(jù)!

  1. Nature Machine Intelligence:大規(guī)模的化學語言表征捕捉分子的結(jié)構(gòu)和性質(zhì)


圖片

基于機器學習的模型,可以實現(xiàn)準確快速的分子性質(zhì)預(yù)測,這在藥物發(fā)現(xiàn)和材料設(shè)計中很有意義。各種監(jiān)督機器學習模型,已經(jīng)證明了有前景的性能,但廣闊的化學空間和屬性標簽的有限可用性,使監(jiān)督學習具有挑戰(zhàn)性。最近,在大型無標簽語料庫上預(yù)訓練的基于無監(jiān)督轉(zhuǎn)換器的語言模型,在許多下游自然語言處理任務(wù)中產(chǎn)生了最先進的結(jié)果。在此,為了解決這一挑戰(zhàn),來自美國IBM研究中心的Jerret Ross & Payel Das等研究者受到這一發(fā)展的啟發(fā),提出了通過訓練一個高效的?transformer編碼器模型MOLFORMER獲得的分子嵌入,該模型使用旋轉(zhuǎn)位置嵌入。該模型在PubChem和ZINC數(shù)據(jù)集中的11億未標記分子的SMILES序列上采用了線性注意機制,再加上高度分布的訓練。研究表明,在來自十個基準數(shù)據(jù)集的幾個下游任務(wù)上,學習的分子表示優(yōu)于現(xiàn)有的基線,包括監(jiān)督和自監(jiān)督圖神經(jīng)網(wǎng)絡(luò)和語言模型。該模型在另外兩個項目上表現(xiàn)得很有競爭力。進一步分析得知,特別是通過注意力的鏡頭,證明在化學SMILES訓練的MOLFORMER確實學習了分子內(nèi)原子之間的空間關(guān)系。這些結(jié)果提供了令人鼓舞的證據(jù),大規(guī)模分子語言模型可以捕獲足夠的化學和結(jié)構(gòu)信息來預(yù)測各種不同的分子性質(zhì),包括量子化學性質(zhì)。

圖片

參考文獻:

Ross, J., Belgodere, B., Chenthamarakshan, V. et al. Large-scale chemical language representations capture molecular structure and properties.?Nat Mach Intell?4, 1256–1264 (2022). https://doi.org/10.1038/s42256-022-00580-7

原文鏈接:

https://www.nature.com/articles/s42256-022-00580-7

2.Nature Computational Science:具有阻尼色散的化學泛函的監(jiān)督學習

Kohn-Sham密度泛函理論,在化學中被廣泛應(yīng)用,但沒有一種泛函能準確地預(yù)測化學性質(zhì)的全部范圍,盡管最近一些雙雜化泛函的進展接近于此。在此,來自美國明尼蘇達大學的Donald G. Truhlar &?華南師范大學的Ying Wang & 華東理工大學的Xiao He

等研究者優(yōu)化了一個稱為CF22D的單雜化泛函,它比大多數(shù)現(xiàn)有的非雙雜化泛函具有更高的化學精度,通過使用靈活的泛函形式,將依賴于密度已占軌道的全局雜化元不可分離梯度近似與依賴于幾何形狀的阻尼色散項結(jié)合起來。研究者通過使用一個大型數(shù)據(jù)庫和性能觸發(fā)的迭代監(jiān)督訓練優(yōu)化了這個能量函數(shù)。同時,結(jié)合了幾個數(shù)據(jù)庫,創(chuàng)建了一個非常大的組合數(shù)據(jù)庫,該數(shù)據(jù)庫的使用證明了CF22D在勢壘高度、異構(gòu)化能、熱化學、非共價相互作用、自由基和非自由基化學、小型和大型系統(tǒng)、簡單和復雜系統(tǒng)以及過渡金屬化學方面的良好性能。

參考文獻:

Liu, Y., Zhang, C., Liu, Z. et al. Supervised learning of a chemistry functional with damped dispersion.?Nat Comput Sci?(2022). https://doi.org/10.1038/s43588-022-00371-5

原文鏈接:


https://www.nature.com/articles/s43588-022-00371-5

3.Nature Computational Science:基于深度學習的長讀變量調(diào)用的串聯(lián)和全對齊

圖片

基于深度學習的變體調(diào)用器正在成為標準,并使用長讀取實現(xiàn)了優(yōu)越的單核苷酸多態(tài)性調(diào)用性能。在此,來自香港大學的Ruibang Luo等研究者介紹了Clair3,它利用了兩種主要的方法類別:堆積調(diào)用快速處理大多數(shù)變體候選全對齊處理復雜的候選,以實現(xiàn)最大化精度和召回率。Clair3運行速度比任何其他最先進的變體調(diào)用程序都快,并展示了改進的性能,特別是在較低的覆蓋率下。

圖片

參考文獻:Zheng, Z., Li, S., Su, J. et al. Symphonizing pileup and full-alignment for deep learning-based long-read variant calling.?Nat Comput Sci?2, 797–803 (2022). https://doi.org/10.1038/s43588-022-00387-x

原文鏈接:

https://www.nature.com/articles/s43588-022-00387-x

4.Nature Computational Science:通過神經(jīng)算子的主動學習發(fā)現(xiàn)和預(yù)測極端事件

圖片

社會和自然中的極端事件,如流行病激增、異常波動或結(jié)構(gòu)故障,可能產(chǎn)生災(zāi)難性后果。描述極端是困難的,因為它們很少發(fā)生,產(chǎn)生于看似良性的條件,并且屬于復雜且通常未知的無限維系統(tǒng)。這些挑戰(zhàn),使得描述它們的嘗試毫無意義。在此,來自美國麻省理工學院的Ethan Pickering & Themistoklis P. Sapsis等研究者通過將貝葉斯實驗設(shè)計(BED)中的輸出加權(quán)訓練方案深度神經(jīng)算子集合相結(jié)合來解決這些困難。該模型不確定框架將主動選擇數(shù)據(jù)用于量化極端事件的BED方案與近似無限維非線性算子的深度神經(jīng)算子集成相匹配。研究者表明,這個框架不僅優(yōu)于高斯過程,而且(1)只有兩個成員的淺集合表現(xiàn)最好;(2)無論初始數(shù)據(jù)的狀態(tài)如何(即有或沒有極端),都能發(fā)現(xiàn)極端;(3)該方法消除了“雙下降”現(xiàn)象;(4)與逐步全局最優(yōu)相比,分批次最優(yōu)采集樣本的使用不影響B(tài)ED性能;(5)蒙特卡羅采集在高維上優(yōu)于標準優(yōu)化器。總之,這些結(jié)論形成了一個可擴展的人工智能(AI)輔助實驗基礎(chǔ)設(shè)施,可以有效地推斷和查明從物理到社會系統(tǒng)等許多領(lǐng)域的關(guān)鍵情況。

圖片

參考文獻:

Pickering, E., Guth, S., Karniadakis, G.E. et al. Discovering and forecasting extreme events via active learning in neural operators.?Nat Comput Sci?2, 823–833 (2022). https://doi.org/10.1038/s43588-022-00376-0

原文鏈接:

https://www.nature.com/articles/s43588-022-00376-0

5.npj Computational Materials:機器學習引導發(fā)現(xiàn)三元化合物包括La和不混溶的Co和Pb元素

圖片

具有不混溶元素對的三元化合物是相對未被探索的,但有希望發(fā)現(xiàn)新的量子材料。探索某一第三種元素和它的比例,將其加入到一個不混溶的元素對中,使其獲得穩(wěn)定的三元化合物,仍然是一個巨大的挑戰(zhàn)。在此,來自美國愛荷華州立大學的Cai-Zhuang Wang等研究者將機器學習(ML)方法與從頭算計算相結(jié)合,有效地尋找含有不混溶元素Co和Pb的三元La-Co-Pb化合物。該方法正確地捕獲了三種先前報道的結(jié)構(gòu)。此外,研究者預(yù)測了一個基態(tài)La3CoPb化合物和57個低能La-Co-Pb三元化合物。通過多種技術(shù)合成La3CoPb的嘗試會產(chǎn)生混合或多相樣品,最多只能產(chǎn)生預(yù)測的最低能量La3CoPb和第二低能量La18Co28Pb3相的模糊信號。吉布斯自由能的計算結(jié)果與實驗結(jié)果一致,為進一步的實驗合成提供了有益的指導。

圖片

參考文獻:

Wang, R., Xia, W., Slade, T.J. et al. Machine learning guided discovery of ternary compounds involving La and immiscible Co and Pb elements.?npj Comput Mater?8, 258 (2022). https://doi.org/10.1038/s41524-022-00950-0

原文鏈接:

https://www.nature.com/articles/s41524-022-00950-0


量化大牛Donald G. Truhlar全新力作!的評論 (共 條)

分享到微博請遵守國家法律
衡阳市| 星子县| 鹤岗市| 准格尔旗| 赞皇县| 内丘县| 泰安市| 磴口县| 调兵山市| 齐齐哈尔市| 西充县| 察哈| 镇宁| 和硕县| 云龙县| 浠水县| 惠来县| 祁连县| 遵义县| 佳木斯市| 南溪县| 泸西县| 龙江县| 兴城市| 松江区| 蒲江县| 夏河县| 河津市| 呈贡县| 吉水县| 洛隆县| 溧水县| 株洲市| 顺义区| 奉新县| 如东县| 琼中| 芜湖市| 海丰县| 霍邱县| 海门市|