Nature Communications | 通過(guò)深度學(xué)習(xí)實(shí)現(xiàn)線性分子的大環(huán)化,促進(jìn)大環(huán)候選藥物的發(fā)現(xiàn)

今天給大家講一篇2023年7月在Nature Communications上發(fā)表的一篇關(guān)于片段連接的生成模型的文章,作者利用生成模型Macformer來(lái)學(xué)習(xí)無(wú)環(huán)和大環(huán)結(jié)構(gòu)之間的隱式關(guān)系,并通過(guò)向無(wú)環(huán)分子中添加連接片段的方式生成具有化學(xué)多樣性和結(jié)構(gòu)新穎性的大環(huán)類似物。在內(nèi)部CHEMBL和外部Zinc測(cè)試數(shù)據(jù)集中,Macformer表現(xiàn)出競(jìng)爭(zhēng)性的優(yōu)勢(shì)。此外,在大環(huán)JAK2抑制劑的設(shè)計(jì)中,以分子對(duì)接和相關(guān)實(shí)驗(yàn)驗(yàn)證了該方法的有效性。
大環(huán)分子設(shè)計(jì)研究背景
大環(huán)化合物在化學(xué)和藥理學(xué)領(lǐng)域具有獨(dú)特的特性和應(yīng)用潛力。大環(huán)傾向于采用預(yù)先組織的約束構(gòu)象,并且和目標(biāo)分子有更多的接觸面積。因此,該結(jié)構(gòu)可能改善結(jié)合親和力、選擇性和相較之前更優(yōu)的藥理學(xué)性質(zhì)。
此外,大環(huán)已被成功地應(yīng)用于多種藥物靶標(biāo)的研究和治療中,包括激酶、蛋白酶和G蛋白偶聯(lián)受體等。由于其獨(dú)特的特征,大環(huán)可以用于結(jié)合一些具有挑戰(zhàn)性的蛋白質(zhì)靶標(biāo),而傳統(tǒng)的小分子藥物往往難以完成該任務(wù)。
例如大環(huán)化合物通常暴露于溶劑中的凹槽,通過(guò)與丙型肝炎病毒NS3/4A相互作用,大環(huán)化合物能夠抑制病毒的活性,從而作為丙型肝炎的治療藥物。這些發(fā)現(xiàn)表明,大環(huán)化合物在藥物研究和開(kāi)發(fā)中具有廣闊的前景。它們能夠克服傳統(tǒng)小分子藥物所面臨的限制,并為治療一些復(fù)雜疾病提供新的可能性。
Macformer模型介紹
2.1 ?模型設(shè)計(jì)流程
圖1a展示了模型訓(xùn)練的大環(huán)化合物的數(shù)據(jù)預(yù)處理方法。其中亞原子標(biāo)記了環(huán)的切分位點(diǎn)。帶亞原子的序列為模型的輸入,模型的輸出為大環(huán)的SMILES字符串。為了擴(kuò)增數(shù)據(jù)集,如圖1b所示,作者采用了數(shù)據(jù)增強(qiáng)的策略,即首先通過(guò)隨機(jī)選擇起始原子和分子圖的遍歷方向,生成無(wú)環(huán)分子的遍歷路徑。然后,根據(jù)無(wú)環(huán)子結(jié)構(gòu)重新排列該結(jié)構(gòu)的原子順序。模型框架如圖1c所示,它是一種基于transformer的深度生成模型,該模型利用注意機(jī)制使其能夠捕捉任何位置的上下文信息,并且可以生成與給定的無(wú)環(huán)分子類似但具有多樣性和新穎性的大環(huán)類似物。

實(shí)驗(yàn)結(jié)果
3.1 ChEMBL測(cè)試集評(píng)估與比較
作者選用ChEMBL測(cè)試集進(jìn)行評(píng)估。如圖2所示,與沒(méi)有進(jìn)行數(shù)據(jù)增強(qiáng)的基線模型相比,將訓(xùn)練數(shù)據(jù)集擴(kuò)大兩倍,在所有指標(biāo)方面都體現(xiàn)了競(jìng)爭(zhēng)性的優(yōu)勢(shì)(包括新穎性、合法性、片段新穎性)??梢钥闯鲞\(yùn)用數(shù)據(jù)增強(qiáng)方法訓(xùn)練的模型不僅有助于重建復(fù)雜分子結(jié)構(gòu),還有助于學(xué)習(xí)化學(xué)語(yǔ)言的基本語(yǔ)法。然而,通過(guò)增加五倍或十倍的數(shù)據(jù)增強(qiáng)訓(xùn)練,并沒(méi)有進(jìn)一步改善在ChEMBL測(cè)試數(shù)據(jù)集上的性能。

3.2 JAK2抑制劑設(shè)計(jì)
如圖3所示,作者將Fedratinib(對(duì)JAK2有高選擇性)作為起始化合物,并將大環(huán)化連接點(diǎn)設(shè)置在兩個(gè)末端苯環(huán)上。為了提高產(chǎn)生大環(huán)的多樣性,作者對(duì)有亞原子的SMILES序列進(jìn)行10倍的隨機(jī)數(shù)據(jù)增強(qiáng)。最終獲得700個(gè)輸出的SMILES序列,其中包含281個(gè)新穎的大環(huán)分子。相較于非深度學(xué)習(xí)方法,Macformer考慮了與大環(huán)化學(xué)鍵相關(guān)的幾何參數(shù)來(lái)提升化合物的生物活性。通過(guò)自注意力機(jī)制,該模型可以在生成大環(huán)化合物的過(guò)程中考慮整體的結(jié)構(gòu),從而更準(zhǔn)確地推斷出活性大環(huán)抑制劑的結(jié)構(gòu)。這種自注意力機(jī)制的應(yīng)用使得Macformer在預(yù)測(cè)和生成大環(huán)化合物時(shí)更具準(zhǔn)確性和可行性。此外,作者還展示了三個(gè)篩選后對(duì)接分?jǐn)?shù)較低的化合物。

結(jié)論
作者基于Transformer架構(gòu)設(shè)計(jì)了Macformer模型,該方法的設(shè)計(jì)目標(biāo)是從一個(gè)以SMILES字符串表示的無(wú)環(huán)且標(biāo)有兩個(gè)附著點(diǎn)的結(jié)構(gòu)開(kāi)始自動(dòng)生成相應(yīng)的環(huán)狀類似物。此外,還引入了自注意力機(jī)制和多頭注意力機(jī)制,以捕捉輸入中的局部和全局依賴關(guān)系。
在JAK2抑制劑設(shè)計(jì)的過(guò)程中,通過(guò)將Fedratinib作為原始的無(wú)環(huán)骨架結(jié)構(gòu),并將Macformer生成的大環(huán)分子對(duì)接到JAK2的ATP結(jié)合位點(diǎn)中。通過(guò)對(duì)其中對(duì)接分?jǐn)?shù)較低的三個(gè)化合物進(jìn)行了驗(yàn)證。其中,化合物1和3在酶和細(xì)胞水平上都顯示出對(duì)JAK2的抑制活性,且比Fedratinib對(duì)激酶的選擇性更高,具有良好的藥代動(dòng)力學(xué)特性。此外,化合物3在較低劑量下展示了對(duì)DSS誘導(dǎo)的小鼠結(jié)腸炎的體內(nèi)抗炎作用。因此Macformer有望在大環(huán)候選藥物的設(shè)計(jì)中發(fā)揮重要作用。
參考文獻(xiàn)
Cummings, M. D. & Sekharan, S. Structure-based macrocycle design in small-molecule drug discovery and simple metrics to identify opportunities for macrocyclization of small-molecule ligands.?J. Med. Chem.?62, 6843–6853 (2019)
版權(quán)信息
本文系A(chǔ)IDD Pro接受的外部投稿,文中所述觀點(diǎn)僅代表作者本人觀點(diǎn),不代表AIDD Pro平臺(tái),如您發(fā)現(xiàn)發(fā)布內(nèi)容有任何版權(quán)侵?jǐn)_或者其他信息錯(cuò)誤解讀,請(qǐng)及時(shí)聯(lián)系A(chǔ)IDD Pro (請(qǐng)?zhí)砑游⑿盘?hào)sixiali_fox59)進(jìn)行刪改處理。
原創(chuàng)內(nèi)容未經(jīng)授權(quán),禁止轉(zhuǎn)載至其他平臺(tái)。有問(wèn)題可發(fā)郵件至sixiali@stonewise.cn