JMC | 一種基于流的自回歸模型的分段-引線優(yōu)化
今天給大家講一篇2023年6月在journal of medical chemistry上發(fā)表的一篇基于流的自回歸模型用于先導(dǎo)化合物的優(yōu)化的文章,作者利用基于流的生成模型FFLOM來做片段連接、PROTAC設(shè)計(jì)、R基團(tuán)增長(zhǎng)以及優(yōu)化的任務(wù)。在這四種任務(wù)下,該模型能夠完全重構(gòu)訓(xùn)練集的化合物,且可以生成超過74%具有新穎片段,且結(jié)合親和力高于真實(shí)化合物的分子。
基于流模型的分子設(shè)計(jì)研究背景
先導(dǎo)化合物的優(yōu)化在藥物設(shè)計(jì)中起著重要的作用,隨著生成模型的興起,如RNN,VAE,F(xiàn)low等多個(gè)生成式方法已運(yùn)用于分子生成中。基于流的方法主要是通過學(xué)習(xí)高斯分布與數(shù)據(jù)分步之間的可逆映射,并通過強(qiáng)化學(xué)習(xí)方法來指導(dǎo)模型生成更多類藥化合物。
此外,基于片段的藥物設(shè)計(jì)方法目前也有很多成功的案例,如PROTAC設(shè)計(jì),R-group設(shè)計(jì)以及骨架躍遷設(shè)計(jì)。受到GraphAF、Moflow等流模型的啟發(fā),作者設(shè)計(jì)了一個(gè)基于流的先導(dǎo)化合物優(yōu)化模型FFLOM。流動(dòng)模型通常由節(jié)點(diǎn)流層和邊流層構(gòu)成,分別控制原子和鍵的采樣過程,并在采樣中會(huì)有分子中不得有少于五個(gè)重原子的不飽和環(huán)的限制。FFLOM在不考慮靶標(biāo)信息的情況下,僅使用原子特征矩陣和配體的鄰接矩陣作為輸入,可以對(duì)先導(dǎo)化合物進(jìn)行優(yōu)化并成功應(yīng)用于現(xiàn)實(shí)場(chǎng)景。
FFLOM模型介紹
2.1 ?模型設(shè)計(jì)流程
FFLOM模型利用分子圖去表征分子的某個(gè)片段或者兩個(gè)片段,模型的輸入為片段的鄰接矩陣以及特征矩陣,模型將按照此輸入后以自回歸的方式逐個(gè)采樣原子,直至生成完整的分子。如圖1所示,F(xiàn)FLOM包括節(jié)點(diǎn)流層和邊的流層。在每個(gè)耦合層中,節(jié)點(diǎn)嵌入和邊嵌入首先通過圖卷積網(wǎng)絡(luò)(GCN)和多層感知器(MLP)層進(jìn)行傳遞,然后轉(zhuǎn)換為在計(jì)算X(節(jié)點(diǎn)特征矩陣)和A(鄰接矩陣)時(shí)涉及的參數(shù)(s和t)。為了使得訓(xùn)練速度和重構(gòu)率之間取得平衡,作者將以廣度優(yōu)先搜索(BFS)的順序生成完整的分子并將生成的部分限制在生成12個(gè)原子內(nèi)。

實(shí)驗(yàn)結(jié)果
3.1 PROTAC設(shè)計(jì)

作者以BRD4靶標(biāo)的PROTAC降解劑MZ1為例來設(shè)計(jì)其衍生物,首先讓FFLOM模型在Zinc數(shù)據(jù)集上訓(xùn)練300輪次并在PROTAC數(shù)據(jù)集上進(jìn)行微調(diào)30輪次。FFLOM 生成了54個(gè) SC scores 大于0.5且RMSDs 小于2 ?的分子,并進(jìn)一步進(jìn)行對(duì)接評(píng)估。圖2展示了部分FFLOM生成的相較于MZ1(?15.49千卡/摩爾)對(duì)接分?jǐn)?shù)更低的化合物。
3.2 R-group增長(zhǎng)設(shè)計(jì)
Schneider等人設(shè)計(jì)了一種選擇性較強(qiáng)的激酶B-Raf抑制劑Compound 4c,該抑制劑幾乎不與PXR結(jié)合。在這個(gè)案例中,作者以化合物4c進(jìn)行R-group增長(zhǎng)設(shè)計(jì)。為了探究模型生成的分子對(duì)PXR的選擇性,還進(jìn)行了額外的對(duì)接實(shí)驗(yàn),即將527個(gè)分子對(duì)接到PXR (PDB:6HJ2)中,并將其對(duì)接得分與對(duì)B-Raf-V600E的得分進(jìn)行比較。在527個(gè)分子中,有38個(gè)分子選擇性較好。圖3展示了527個(gè)化合物在B-Raf-V600E和PXR上的對(duì)接得分分布。紅線表示化合物4c在B-Raf-V600E上的對(duì)接得分。藍(lán)線表示dabrafenib在PXR上的對(duì)接得分。綠線表示化合物4c在PXR上的對(duì)接得分。其中縮放區(qū)域展示了具有期望選擇性的分子。該結(jié)果突顯了FFLOM在R基團(tuán)設(shè)計(jì)方案中的潛力,以及FFLOM有較強(qiáng)的學(xué)習(xí)分子結(jié)構(gòu)和優(yōu)化選擇性的能力。

結(jié)論
作者提出了一種新的基于自回歸流的模型FFLOM用于R-group及骨架躍遷設(shè)計(jì)。實(shí)驗(yàn)表明,該模型在有效性、唯一性、新穎性和恢復(fù)性方面都優(yōu)于其他模型。作者將FFLOM應(yīng)用于四個(gè)不同應(yīng)用場(chǎng)景研究,包括片段鏈接、PROTAC設(shè)計(jì)、Rgroup增長(zhǎng)及優(yōu)化。由結(jié)果可知,F(xiàn)FLOM模型能夠完全重構(gòu)真實(shí)分子,同時(shí)有效地生成比原始分子對(duì)接分?jǐn)?shù)更優(yōu)的新結(jié)構(gòu),未來希望用此模型來學(xué)習(xí)更復(fù)雜的分子結(jié)構(gòu)。
參考文獻(xiàn)
Cummings, M. D. & Sekharan, S. Structure-based macrocycle design in small-molecule drug discovery and simple metrics to identify opportunities for macrocyclization of small-molecule ligands.?J. Med. Chem.?62, 6843–6853 (2019)
版權(quán)信息
本文系A(chǔ)IDD Pro接受的外部投稿,文中所述觀點(diǎn)僅代表作者本人觀點(diǎn),不代表AIDD Pro平臺(tái),如您發(fā)現(xiàn)發(fā)布內(nèi)容有任何版權(quán)侵?jǐn)_或者其他信息錯(cuò)誤解讀,請(qǐng)及時(shí)聯(lián)系A(chǔ)IDD Pro (請(qǐng)?zhí)砑游⑿盘?hào)sixiali_fox59)進(jìn)行刪改處理。
原創(chuàng)內(nèi)容未經(jīng)授權(quán),禁止轉(zhuǎn)載至其他平臺(tái)。有問題可發(fā)郵件至sixiali@stonewise.cn