最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

J CHEMINFORMATICS | COMA:有效的結(jié)構(gòu)約束分子生成使用收縮和邊際損失

2023-06-13 10:18 作者:AIDDPro  | 我要投稿


今天給大家講一篇2023年1月在Journal of Cheminformatics上發(fā)表的一篇關(guān)于目標(biāo)導(dǎo)向的生成模型的文章,該模型具有兩個訓(xùn)練階段:首先,基于對比損失及邊際損失的方法來進(jìn)行結(jié)構(gòu)約束學(xué)習(xí)分子表征;其次,通過強(qiáng)化學(xué)習(xí)方法優(yōu)化分子結(jié)構(gòu)來改善目標(biāo)屬性。通過與各種最先進(jìn)的基準(zhǔn)模型進(jìn)行比較以及消融研究證明了該設(shè)計方法的優(yōu)越性。此外,作者用耐藥患者中索拉非尼為例進(jìn)行分子設(shè)計來證明了該方法在藥物發(fā)現(xiàn)中的應(yīng)用價值。

目標(biāo)導(dǎo)向分子生成研究背景

基于結(jié)構(gòu)約束的分子生成方法旨在通過施加結(jié)構(gòu)約束生成具有提升目標(biāo)化學(xué)性質(zhì)的新分子。因此,這個方法可以作為一種有效的策略來優(yōu)化分子設(shè)計和發(fā)現(xiàn)過程。在有機(jī)化學(xué)中,傳統(tǒng)的方法通常包括識別與目標(biāo)生物實體(如激酶)相關(guān)聯(lián)的分子亞結(jié)構(gòu),并對分子基序修飾從而發(fā)現(xiàn)潛在活性的新型候選藥物。深度生成模型在如VAE、GAN網(wǎng)絡(luò)等通過貝葉斯優(yōu)化、粒子群優(yōu)化和強(qiáng)化學(xué)習(xí)可以以特定的理化性質(zhì)運用于基于結(jié)構(gòu)約束的分子生成過程。例如,JTVAE和VJTNN是基于圖的分子生成模型,它們將變分自編碼器與連接樹結(jié)合來學(xué)習(xí)分子的結(jié)構(gòu)信息從而改進(jìn)其特定目標(biāo)屬性。這些傳統(tǒng)方法已經(jīng)被廣泛應(yīng)用于藥物發(fā)現(xiàn)和優(yōu)化領(lǐng)域,并仍然是當(dāng)今藥物設(shè)計的重要組成部分。

COMA模型介紹

2.1 ?COMA設(shè)計流程

其流程如圖1所示,作者首先根據(jù)具有提升屬性的分子對進(jìn)行正負(fù)樣本劃分,將源分子或者目標(biāo)分子與其小于相似性閾值的分子定義為負(fù)樣本對,反之為正樣本對。然后通過設(shè)計兩個具有基于SMILES的VAE結(jié)構(gòu)分別引入對比損失和邊際損失使得結(jié)構(gòu)相似的分子具有相似的潛在向量,從而鼓勵解碼器有效地生成與源分子類似的新穎分子。并采用了基于屬性值作為獎勵的強(qiáng)化學(xué)習(xí)算法來集中生成具有理想屬性的分子。

圖1 COMA設(shè)計流程

實驗結(jié)果

3.1 對比損失和邊際損失的消融實驗

如圖2所示,作者在DRD2基準(zhǔn)數(shù)據(jù)集上進(jìn)行了消融實驗,首先隨機(jī)選擇了10個分子對,并定義兩個分子對集合,其一是二者谷本相似度大于0.4,其二是小于0.4,并用主成分分析(PCA)計算分子對的歐氏距離值在源分子和目標(biāo)分子相應(yīng)的嵌入向量,并比較二者之間的距離分布。兩種分布之間的偏差是用Kruskal-Wallis-H檢驗測量的,H統(tǒng)計值較高意味著具有相似結(jié)構(gòu)的成對分子彼此接近,成對的不同分子位置較遠(yuǎn)。可以看出只有在同時使用對比損失和邊際損失時,才能識別出潛在空間中的理想分子嵌入分布

圖2 消融實驗

3.2 基準(zhǔn)方法比較理化性質(zhì)

如圖3所示,作者將JTVAE, VJTNN, VJTNN+GAN, CORE等模型與COMA在logP04、logP06、QED和DDR2四個任務(wù)上進(jìn)行比較。評價指標(biāo)為成功率,即衡量一個模型同時滿足三個約束(新穎結(jié)構(gòu)、改進(jìn)的屬性和結(jié)構(gòu)相似性)生成有效分子的比例。COMA模型在幾個閾值條件下與基準(zhǔn)模型具有同當(dāng)或更好的性能,因此認(rèn)為COMA能夠生成比基準(zhǔn)模型更高相似性約束(0.55–0.70)的分子。為了進(jìn)行定量比較,還計算了相似度閾值上的平均成功率,可以得出COMA對DRD2、QED、pLogP04和pLogP06的比例分別為0.180、0.301、0.154和0.213。

圖3 基準(zhǔn)方法比較

3.3 對接實驗比較

作者評估了生成的分子在ABCG2和BRAF上的對接姿態(tài)。首先用Open Babel生成配體的三維坐標(biāo),并將分子在pH值為7.4時質(zhì)子化,再用Meeko 0.3.0制作PDBQT文件。進(jìn)一步,為每個受體-配體對產(chǎn)生20個姿態(tài),并選擇了每個受體-配體對得分最低的姿勢來和索拉非尼進(jìn)行比較。其中親和力是由DeepPurpose預(yù)測得到的,由圖4可知,ABCG2上的數(shù)個分子的親和力低于索拉非尼,并且具有高相似性分?jǐn)?shù)。

圖4 ?生成分子與Sorafenib親和力比較

結(jié)論

目前的深度生成模型在設(shè)計同時生產(chǎn)滿足分子屬性提升、并且與源分子有高相似性分?jǐn)?shù)的分子方面存在局限性。作者提出了一種新的基于結(jié)構(gòu)約束的深度生成模型COMA(VAE架構(gòu)),該模型通過對比損失和邊際損失讓VAE學(xué)習(xí)如何生成與源分子相似的分子。這個階段的目標(biāo)是確定哪些分子被認(rèn)為是“相似”的,并且將那些相似的分子編碼于VAE中,從而讓模型重構(gòu)出更多與源分子相似的結(jié)構(gòu)。

強(qiáng)化學(xué)習(xí)階段,VAE學(xué)習(xí)如何生成符合所需增強(qiáng)屬性的分子。這個階段使用強(qiáng)化學(xué)習(xí)算法來最大化VAE生成的分子的提升屬性值,并基于獎勵值來更新VAE的權(quán)重參數(shù)。COMA在四個基準(zhǔn)數(shù)據(jù)集上(DRD2、QED、plogP04和plogP06)的表現(xiàn)優(yōu)于各種最先進(jìn)的模型。在未來或?qū)⑦\用提出的對比損失和邊際損失實現(xiàn)將生物活性相似性代替結(jié)構(gòu)相似性的先導(dǎo)化合物優(yōu)化工作。參考文獻(xiàn)

Chen Z, Min MR, Parthasarathy S, Ning X (2021) A deep generative model for molecule optimization via one fragment modifcation. Nat Mach Intell 3(12):1040–1049

版權(quán)信息

本文系A(chǔ)IDD Pro接受的外部投稿,文中所述觀點僅代表作者本人觀點,不代表AIDD Pro平臺,如您發(fā)現(xiàn)發(fā)布內(nèi)容有任何版權(quán)侵?jǐn)_或者其他信息錯誤解讀,請及時聯(lián)系A(chǔ)IDD Pro (請?zhí)砑游⑿盘杝ixiali_fox59)進(jìn)行刪改處理。

原創(chuàng)內(nèi)容未經(jīng)授權(quán),禁止轉(zhuǎn)載至其他平臺。有問題可發(fā)郵件至sixiali@stonewise.cn


J CHEMINFORMATICS | COMA:有效的結(jié)構(gòu)約束分子生成使用收縮和邊際損失的評論 (共 條)

分享到微博請遵守國家法律
平远县| 汤原县| 凤翔县| 班玛县| 安化县| 东乡族自治县| 辽阳市| 奉化市| 黔江区| 湾仔区| 伊春市| 泌阳县| 罗定市| 眉山市| 周至县| 石河子市| 临西县| 澄城县| 哈巴河县| 河北省| 榆林市| 富顺县| 崇信县| 拜城县| 霍城县| 云龙县| 兴仁县| 陆川县| 义马市| 磐安县| 建平县| 岗巴县| 凭祥市| 肇庆市| 濮阳县| 通州市| 古交市| 巴塘县| 孟州市| 宜春市| 和静县|