最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

基于片段的藥物發(fā)現(xiàn)——高質(zhì)量分子庫(kù)的重要性

2023-06-12 12:07 作者:東方科軟  | 我要投稿


本文翻譯自Marta Bon等人于2022年發(fā)表在Molecular Oncology上的一篇綜述,旨在幫助讀者初步了解基于片段的藥物發(fā)現(xiàn)/設(shè)計(jì)(有興趣的讀者可以閱讀原文,DOI:10.1002/1878-0261.13277)。

基于片段的藥物發(fā)現(xiàn)(FBDD)現(xiàn)在被確立為高通量篩選(HTS)的補(bǔ)充方法。HTS主要是篩選大的類藥分子庫(kù),與HTS相反,F(xiàn)BDD篩選涉及更小和更不復(fù)雜的分子,盡管對(duì)蛋白質(zhì)靶的親和力低,但顯示出比大分子更多的“原子效率”結(jié)合相互作用。因此,片段命中可以作為后續(xù)優(yōu)化的更有效的起點(diǎn),特別是對(duì)于難以給藥的靶點(diǎn)。由于可能分子的數(shù)量隨分子大小呈指數(shù)增長(zhǎng),與包含較大分子的較大HTS文庫(kù)相比,較小的片段文庫(kù)允許它們各自的“化學(xué)空間”按比例更大的覆蓋范圍。然而,良好的片段庫(kù)設(shè)計(jì)對(duì)于確保最佳的化學(xué)和藥效團(tuán)多樣性、分子復(fù)雜性和物理化學(xué)特性至關(guān)重要。在這篇綜述中,我們描述了我們對(duì)片段庫(kù)設(shè)計(jì)的看法,以及從醫(yī)學(xué)和計(jì)算化學(xué)的角度來(lái)看什么是好的片段。我們強(qiáng)調(diào)了FBDD新興的化學(xué)和計(jì)算技術(shù),并討論了優(yōu)化碎片命中的策略。新的FBDD方法的影響已經(jīng)被感受到,最近共價(jià)KRASG12C抑制劑Sotorasib(譯者按:sotorasib,索托拉西布,用于治療既往至少接受過(guò)一次系統(tǒng)治療的攜帶KRAS G12C突變局部晚期或轉(zhuǎn)移性非小細(xì)胞肺癌(NSCLC)的患者,由安進(jìn)公司研發(fā)并于2021年被FDA批準(zhǔn)上市,屬于KRAS抑制劑)的批準(zhǔn)突出了FBDD對(duì)長(zhǎng)期被認(rèn)為不可藥物治療的靶點(diǎn)的效用。


1?引言

在過(guò)去的二十年中,基于片段的藥物發(fā)現(xiàn)(FBDD)已經(jīng)證明了其作為高通量篩選(HTS)的補(bǔ)充且非常成功的方法的實(shí)用性,用于鑒定分子以進(jìn)行命中到鉛運(yùn)動(dòng),在此期間篩選活性物質(zhì)的特性和效力得到廣泛優(yōu)化。?迄今為止,使用FBDD方法已經(jīng)產(chǎn)生了六種上市藥物,培西達(dá)替尼(pexidartinib),維莫非尼(vemurafenib),厄達(dá)替尼(erdafitinib),維奈托克(venetoclax),索托拉西布(sotorasib)和阿西米尼(asciminib),以及許多臨床候選藥物(圖1)。

圖1?突出顯示影響FBDD進(jìn)程的關(guān)鍵論文的時(shí)間軸(藍(lán)色)和顯示其成功的重要日期(橙色)。在一篇早期的概念論文中,Jencks概述了大分子片段結(jié)合能的可加性。安德魯斯等人隨后估計(jì)了一系列官能團(tuán)對(duì)配體-受體相互作用的內(nèi)在結(jié)合能貢獻(xiàn)?;诨パa(bǔ)配體-受體特征的簡(jiǎn)單模型,Hann等提出復(fù)雜性較低的分子可能為藥物發(fā)現(xiàn)提供更好的起點(diǎn),并討論了對(duì)高靈敏度檢測(cè)的需求。隨著人們對(duì)基于片段的藥物發(fā)現(xiàn)的興趣日益增加,常用的指標(biāo)包括“三法則”和配體效率。

該方法已廣泛應(yīng)用于全球的制藥、生物技術(shù)和學(xué)術(shù)機(jī)構(gòu),在主要出版物中,2019年報(bào)告了20個(gè)片段到,2020則年報(bào)告了21個(gè)片段。片段庫(kù)能夠?qū)Ρ菻TS文庫(kù)更大的化學(xué)空間進(jìn)行采樣,但化合物數(shù)量要少得多。復(fù)雜分子與目標(biāo)形成次優(yōu)相互作用和/或沖突的機(jī)會(huì)更大,這與更有可能產(chǎn)生原子有效結(jié)合相互作用的片段不同。因此,只有一到兩千個(gè)小分子的文庫(kù)可以很容易地為藥物發(fā)現(xiàn)計(jì)劃提供高質(zhì)量的Hits(譯者按:藥物發(fā)現(xiàn)過(guò)程中主要涉及幾個(gè)名詞,分別為hits,lead,Candidate,drug,對(duì)應(yīng)不同的發(fā)現(xiàn)階段)。此外,片段命中率可用作評(píng)估靶標(biāo)的潛在成藥性,并可用于識(shí)別難以靶向的結(jié)合區(qū)域,例如變構(gòu)位點(diǎn)或通常與蛋白質(zhì)-蛋白質(zhì)相互作用有關(guān)的小“熱點(diǎn)”結(jié)合口袋。維奈托克是首批靶向蛋白質(zhì)-蛋白質(zhì)相互作用(PPI)界面的藥物之一,以及最近的sotorasib,其靶向以前被認(rèn)為不可成藥的KRAS G12C突變體。什么定義了片段?公認(rèn)的核心定義將片段描述為有機(jī)小分子,通常具有≤20個(gè)重原子(譯者按:一個(gè)化合物中的所有非氫原子個(gè)數(shù))。過(guò)去的片段庫(kù)設(shè)計(jì)傾向于廣泛遵循“三法則”(Ro3)的物理化學(xué)性質(zhì),這已成為片段世界中Lipinski規(guī)則的同義詞。它們是:分子量≤ 300 Da,氫鍵供體(HBD)≤3,氫鍵受體(HBA)≤3和計(jì)算的分配或分配系數(shù)的對(duì)數(shù)(cLogP / cLogD)≤3。此外,可自由旋轉(zhuǎn)的鍵≤3和極性表面積(PSA)≤60通常被認(rèn)為是Ro3標(biāo)準(zhǔn)。然而,這不是一套“硬性”的規(guī)則,選擇標(biāo)準(zhǔn)隨著時(shí)間的推移而發(fā)展。成功的片段通常會(huì)違反這些規(guī)則中的至少一條,最常見的是具有更高的HBA數(shù)(圖2)。

圖2?所選未過(guò)濾的大型商業(yè)片段集中的屬性分布。(A)一般片段集來(lái)自Maybridge(30,061種化合物),Life Chemicals(50,597種化合物),Enamine(172,689種化合物)和ChemDiv(11,269種化合物)。在vortex軟件中計(jì)算氫鍵供體(HBA)/受體(HBD),重原子計(jì)數(shù)(HBC)和包括N,O,P和S在內(nèi)的總極表面積(TPSA_NOPS),預(yù)測(cè)的logD(cLogD)和水溶性(logSw)是在admet預(yù)測(cè)軟件中計(jì)算的。黑線分別表示連續(xù)或離散屬性的平均值或中位數(shù)。(B)同一片段集中最大內(nèi)部相似性的分布。對(duì)于每種化合物,在RDKit針對(duì)使用摩根指紋的集合中的所有其他化合物,半徑 2。對(duì)于每種化合物,保留與任何其他化合物的相似度最大值。(C)相同庫(kù)中相同化合物的數(shù)量。例如,Maybridge和Life Chemicals系列中都存在633種化合物。

片段命中往往具有弱親和力,解離常數(shù)(kd)值在 μM–mM 范圍內(nèi),而 HTS 命中通常在nM–低μM范圍內(nèi)具有更強(qiáng)的親和力。因此,它們通常需要更廣泛的化學(xué)研究才能獲得類先導(dǎo)化合物,這在學(xué)術(shù)環(huán)境中可能特別困難。它們的親和力較弱也意味著通常用于HTS篩選的生化測(cè)定不能用作片段結(jié)合的準(zhǔn)確測(cè)量。相反,生物物理技術(shù),如核磁共振(NMR),表面等離子體共振(SPR),X射線晶體學(xué)和熱位移測(cè)定通常用于探測(cè)結(jié)合,通常使用兩種正交方法來(lái)驗(yàn)證任何命中。找到高質(zhì)量的點(diǎn)擊很大程度上是良好的庫(kù)設(shè)計(jì)的結(jié)果;篩選簡(jiǎn)單、極具吸引力的分子,跨越廣泛的化學(xué)空間。在這里,我們描述了我們對(duì)片段庫(kù)設(shè)計(jì)的看法以及什么是好的片段。


2 片段庫(kù)的要求

2.1 當(dāng)前可用的片段庫(kù)及其局限性

構(gòu)建片段庫(kù)是為了探索廣泛的化學(xué)空間,同時(shí)篩選有限數(shù)量的化合物。因此,多樣性通常是片段庫(kù)設(shè)計(jì)的主要驅(qū)動(dòng)力。然而,在某些情況下,考慮靶標(biāo)類也可能是有益的,例如,是否應(yīng)包括已知與功能相關(guān)蛋白質(zhì)靶標(biāo)結(jié)合的特定配體部分。許多片段庫(kù)現(xiàn)已上市,涵蓋一系列屬性和化學(xué)空間。這些是文庫(kù)開發(fā)的一個(gè)非常有用的起點(diǎn),通常經(jīng)過(guò)過(guò)濾以包含所需的藥效團(tuán)、化學(xué)和形狀多樣性。

盡管如此,僅使用一個(gè)商用片段庫(kù)仍存在一些限制。每個(gè)庫(kù)的大小和多樣性各不相同,因此,與設(shè)計(jì)定制套裝相比,可能不是最佳選擇。商業(yè)文庫(kù)通常也大于成功運(yùn)行命中識(shí)別活動(dòng)所需的片段數(shù)量,因此通常需要對(duì)每個(gè)文庫(kù)進(jìn)行過(guò)濾以給出合理的集大小。雖然市售化合物之間存在一些重疊,但通常每組化合物中都包含高度獨(dú)特的化學(xué)實(shí)體。因此,“混合搭配”以獲得所需的特性和最佳多樣性是有益的。此外,根據(jù)篩選方法,可能需要檢查可購(gòu)買片段的溶解度和穩(wěn)定性。在FBDD期間,低溶解度可能是一個(gè)特殊的問(wèn)題,因此一些供應(yīng)商現(xiàn)在尋求提供特定的“高溶解度”套件。傳統(tǒng)的有機(jī)片段集也往往具有高度的平面性,這可能導(dǎo)致溶解度問(wèn)題,富含sp2的芳香環(huán)在許多化合物中顯示為亞結(jié)構(gòu)。這部分導(dǎo)致已經(jīng)篩選片段的傳統(tǒng)靶標(biāo)(例如激酶)以及催化sp2-sp2偶聯(lián)反應(yīng)的使用增加。同樣,供應(yīng)商已經(jīng)通過(guò)提供具有更大 sp3 和 3D 特性的庫(kù)來(lái)解決這個(gè)問(wèn)題。無(wú)論有大量市售片段,重要的是嘗試用內(nèi)部化學(xué)工作等非商業(yè)上可獲得的片段來(lái)補(bǔ)充任何文庫(kù)。這樣的骨架可以為未來(lái)的優(yōu)化策略提供良好的基礎(chǔ)。


2.2 你如何設(shè)計(jì)一個(gè)庫(kù)?

2.2.1 藥物化學(xué)注意事項(xiàng)

片段集的設(shè)計(jì)和生長(zhǎng)通常從檢查和過(guò)濾市售集合開始,以排除含有已知有毒結(jié)構(gòu)(毒載體)的化合物并保持所需的藥代動(dòng)力學(xué)特性(表1)。雖然這些特性大致遵循Ro3,但還有其他幾個(gè)選擇標(biāo)準(zhǔn),應(yīng)該仔細(xì)考慮。核心上可合成的修改點(diǎn)對(duì)于實(shí)現(xiàn)潛在客戶優(yōu)化的增長(zhǎng)載體非常重要。溶解性和疏水性也是關(guān)鍵因素,它們會(huì)影響不必要的潛在聚集。HBA、HBD和其他結(jié)合基序的加入不僅對(duì)于幫助焓驅(qū)動(dòng)的結(jié)合相互作用至關(guān)重要,而且對(duì)于確保cLogD在所需范圍內(nèi)也至關(guān)重要。每個(gè)片段的大小和復(fù)雜性應(yīng)最小,以推動(dòng)有效的交互并避免與目標(biāo)發(fā)生沖突。因此,由于熵成本,具有高度靈活性的分子可能會(huì)導(dǎo)致較低的親和力命中。然而,必須在包含極性官能團(tuán)和理想藥效團(tuán)方面取得平衡,以便保持集合的復(fù)雜性和多樣性。

?

表1?Beatson Drug Discovery部門在過(guò)濾商業(yè)產(chǎn)品時(shí)使用的典型特性范圍,以及說(shuō)明我們的1H片段集在每個(gè)特性方面的組成的描述性統(tǒng)計(jì)數(shù)據(jù)。

針對(duì)已選擇的片段進(jìn)行相似性篩選,檢查2D指紋和/或3D相似性,促進(jìn)文庫(kù)多樣性。通過(guò)包含包含焓驅(qū)動(dòng)藥效團(tuán)的各種片段形狀,更有可能識(shí)別獨(dú)特的Hits,這將提高相關(guān)化學(xué)空間的采樣效率。此外,還必須考慮固有的化學(xué)穩(wěn)定性和反應(yīng)性,同時(shí)排除任何毒性責(zé)任。為此,片段庫(kù)的定期質(zhì)量控制(QC)對(duì)于確保僅篩選高質(zhì)量化合物非常重要。泛測(cè)定干涉化合物(PAINS)過(guò)濾器可用于去除與許多生物靶標(biāo)非特異性結(jié)合的分子。幾個(gè)幾乎沒(méi)有進(jìn)步潛力的頻繁命中者也被發(fā)現(xiàn),因此應(yīng)該避免。如下所述,幾種計(jì)算方法可用于屬性預(yù)測(cè)和過(guò)濾目的。近年來(lái),關(guān)于在篩選庫(kù)中包含更高程度的3D片段進(jìn)行了一些討論,有些人擔(dān)心這會(huì)導(dǎo)致較低的命中率。然而,命中率并不能定義文庫(kù)的成功,因?yàn)榇_定配體效率和化學(xué)可處理的起點(diǎn)更為重要。增加三維度(或Fsp3)的百分比有可能覆蓋更廣泛的生物學(xué)相關(guān)化學(xué)空間,改善潛在的藥物化學(xué)起點(diǎn),“頻繁命中者”(在許多不相關(guān)的篩選中顯示為活性物質(zhì)的化合物,因此可能缺乏特異性)通常落在低Fsp3范圍內(nèi)。已經(jīng)表明,增加sp3特性可以改善幾種化合物特性并有助于臨床成功。特別是,在3D結(jié)構(gòu)中摻入面外官能團(tuán)可以潛在地實(shí)現(xiàn)更強(qiáng)的受體/配體相互作用,從而提高對(duì)給定靶標(biāo)的效力和選擇性。

庫(kù)大小重要嗎?是也不是。大多數(shù)成功的FBDD活動(dòng)利用了1000到2000種化合物的庫(kù);然而,片段庫(kù)的多樣性比總數(shù)更重要。von Itzstein進(jìn)行的一項(xiàng)研究表明,只需要約2000個(gè)片段就可以代表與220,000>整體集相同水平的真實(shí)多樣性。因此,玩數(shù)字游戲不是必需的,相反,設(shè)計(jì)一個(gè)具有高度多樣性的較小庫(kù)更有益且更具成本效益(圖3). 最近,諸如“SpotXplorer”之類的小型文庫(kù)已被設(shè)計(jì)用于最大限度地提高實(shí)驗(yàn)證實(shí)的結(jié)合藥效團(tuán)在蛋白質(zhì)熱點(diǎn)處的覆蓋率。該方法的有效性通過(guò)僅包含?96 個(gè)片段的文庫(kù)得到驗(yàn)證,這些片段在流行的靶標(biāo)類別(例如GPCRs)以及新興靶標(biāo)(例如Su(var)3-9、Enhancer-of-zeste和SETD2)上得到了驗(yàn)證。

圖3?英國(guó)癌癥研究中心Beatson藥物發(fā)現(xiàn)單元1H片段集與選定的商業(yè)集的比較。(A)平均最大內(nèi)部相似度。對(duì)于任何一組化合物,使用RDKit中的Morgan指紋(半徑2)計(jì)算與所有其他化合物的谷本相似度。保留每個(gè)化合物的最大值,并在集合上取平均值。(B)每組獨(dú)特的Bemis-Murcko支架的比例。使用vortex軟件提取每組化合物的Scaffold SMILES,并保留唯一的規(guī)范SMILES。每個(gè)文庫(kù)中獨(dú)特支架的數(shù)量相對(duì)于化合物的數(shù)量表示。商業(yè)集合:Enamine有1,920化合物;Life Chemicals有50,607個(gè)化合物;ChemDiv有?11,269個(gè)化合物;Bionet有1,166個(gè)化合物。

2.2.2 計(jì)算庫(kù)設(shè)計(jì)

片段庫(kù)設(shè)計(jì)的一種方法是從已知的生物活性分子開始。因此,可以根據(jù)一些“切割規(guī)則”和為有前途的候選化合物確定的商業(yè)可用性,從解構(gòu)較大分子中獲得片段。例如,可以通過(guò)在?BindingDB中搜索來(lái)確定對(duì)結(jié)合已知靶標(biāo)做出貢獻(xiàn)的片段。分解現(xiàn)有分子的最著名方法是RECAP和BRICS。RECAP通過(guò)破壞常見化學(xué)反應(yīng)產(chǎn)生的鍵來(lái)識(shí)別現(xiàn)有分子中的片段。裂解僅涉及11種化學(xué)鍵類型,并且所有鍵都在一步中斷裂。戒指圖案保持不變。從早期階段開始,RECAP開發(fā)人員就允許用戶選擇替代鍵類型,并且多年來(lái)對(duì)代碼進(jìn)行了多次修改。在RECAP修改中,BRICS是最受歡迎的修改之一,涉及包含一套用于化學(xué)空間重組的補(bǔ)充規(guī)則(例如環(huán)置換和硫基裂解的建模),導(dǎo)致16個(gè)片段原型的定義。已經(jīng)表明,這些修飾通常會(huì)導(dǎo)致產(chǎn)生比使用RECAP規(guī)則獲得的片段更小的片段數(shù)量更多的片段。此外,BRICS產(chǎn)生了更多具有多個(gè)連接點(diǎn)的片段,這意味著在獲得的子集中有更多的分支可能性。然而,由于FBDD的一個(gè)關(guān)鍵優(yōu)勢(shì)是其對(duì)化學(xué)空間的有效采樣,因此僅基于已知生物活性化合物的可用片段的文庫(kù)可能不是可取的,因此需要進(jìn)行增強(qiáng)。例如,Selcia Ltd 通過(guò)對(duì)符合 RO3的 RECAP 生成的生物活性片段的管理和計(jì)算的溶解度閾值進(jìn)行初步選擇,開發(fā)了包含 3 個(gè)片段的商業(yè)文庫(kù)。這些輔以代表性不足的片段類別和針對(duì)非商業(yè)可用片段的定制合成程序,以提高新穎性(https://www.selcia.com/sites/default/files/SelciaFragmentLibrary.pdf)。

商業(yè)片段集通常大致符合?RO3 標(biāo)準(zhǔn)(圖2)。但是,如下所述,特定類型的片段也可能具有獨(dú)特的屬性分布,并且可以根據(jù)不斷變化的需求執(zhí)行進(jìn)一步的屬性過(guò)濾,以增強(qiáng)庫(kù)的背景組成。重要的是,人們不應(yīng)該假設(shè)商業(yè)集中沒(méi)有不需要的功能,尤其是對(duì)于較大的集合。因此,執(zhí)行子結(jié)構(gòu)搜索以識(shí)別片段,通常使用以Daylight SMARTS格式表示的過(guò)濾器(SMILES任意目標(biāo)規(guī)格格式,其中SMILES是指基于字符串的簡(jiǎn)化分子輸入線輸入系統(tǒng)分子表示https://www.daylight.com/dayhtml/doc/theory/theory.smarts.html)。保持多樣性也至關(guān)重要。簡(jiǎn)單的第一步是相似性篩選,利用2D指紋的谷本相似性的適當(dāng)截止值來(lái)排除供應(yīng)商集中與現(xiàn)有文庫(kù)片段高度相似的化合物。關(guān)于最常用的分子指紋圖譜的詳細(xì)討論超出了本綜述的范圍,感興趣的讀者可以參考這篇文章(Fragment descriptors in SAR/QSAR/QSPR studies, molecular similarity analysis and in virtual screening)。對(duì)于一對(duì)二進(jìn)制指紋,谷本相似性是組成每個(gè)指紋中位的交集/并集的集合的大小之比。因此,如果所有元素在兩個(gè)指紋中共享,則相似性為一。如果未共享任何元素,則相似度為零。為了測(cè)量潛在化合物添加對(duì)文庫(kù)的影響,可以對(duì)有或沒(méi)有新候選化合物的文庫(kù)的集合內(nèi)相似性進(jìn)行分析。過(guò)濾也可以用藥效團(tuán)指紋圖譜完成。藥效團(tuán)被定義為確保最佳配體/受體相互作用所必需的最佳空間位阻和電子特征。藥效團(tuán)建模將分子表示為2D或3D級(jí)別的特征集合,該信息被二進(jìn)制編碼為藥效團(tuán)指紋,指示是否存在藥效團(tuán)特征以及配體拓?fù)湫畔?。因此,藥效團(tuán)指紋圖譜對(duì)于分析相似性和消除冗余特別有用。

對(duì)最佳分子復(fù)雜性的需求是FBDD的基本概念,并且已經(jīng)開發(fā)了各種合成可追蹤性和結(jié)構(gòu)復(fù)雜性的指標(biāo),可用于過(guò)濾片段。近年來(lái),提高片段庫(kù)的形狀多樣性也越來(lái)越受到關(guān)注,如果對(duì)庫(kù)的 3D 特性特別感興趣,還可以執(zhí)行計(jì)算成本低于 3D 藥效團(tuán)形狀相似性的分析。sp3雜化碳(Fsp3)的分?jǐn)?shù)是一種簡(jiǎn)單的計(jì)算特性,如上所述,它與改善的藥代動(dòng)力學(xué)特性和臨床成功有關(guān)。主慣性矩(PMI) 表示引起剛體圍繞正交旋轉(zhuǎn)軸的角加速度變化所需的扭矩。當(dāng)適當(dāng)歸一化時(shí),三角形PMI圖表示分子呈桿狀、圓盤狀或球狀的程度。最佳擬合平面(PBF)是另一個(gè)3D形狀度量,它計(jì)算單個(gè)計(jì)算構(gòu)象中所有重原子的平均距離,遠(yuǎn)離最佳擬合平面,使該平均值最小化。最近報(bào)道了一種利用化學(xué)圖理論結(jié)合SMILES符號(hào)進(jìn)行定量結(jié)構(gòu)-活性或結(jié)構(gòu)-屬性關(guān)系建模(QSAR / QSPR)的有趣方法。在這種方法中,使用輸入分子的連接信息構(gòu)建圖(一組節(jié)點(diǎn),代表原子,邊代表鍵),并從可能的子圖中獲得分子片段。在結(jié)構(gòu)數(shù)據(jù)集中獲得的所有獨(dú)特片段都可以整理,單個(gè)分子中每個(gè)片段的計(jì)數(shù)可以用作QSAR / QSPR模型中的描述符。有趣的是,可以檢索到與訓(xùn)練模型中的活動(dòng)相關(guān)的片段,這表明這也可以用作另一種合理的片段選擇方法,盡管我們不知道這種用途在庫(kù)構(gòu)建中的例子。雷蒙德小組此前還報(bào)道了“化學(xué)宇宙”數(shù)據(jù)庫(kù)GDB-17,其中包括由C,N,O,S和鹵素組成的所有化學(xué)圖的枚舉,最多17個(gè)重原子,隨后,同一小組發(fā)布了其中10萬(wàn)個(gè)低復(fù)雜度子集,用于QSAR方法等虛擬篩選。除了過(guò)濾商業(yè)集以選擇新片段的標(biāo)準(zhǔn)技術(shù)之外,由人工智能進(jìn)步驅(qū)動(dòng)的從頭計(jì)算機(jī)分子設(shè)計(jì)的新方法可以通過(guò)自動(dòng)設(shè)計(jì)具有最佳感興趣特性的新型片段在文庫(kù)生成中得到應(yīng)用。從頭設(shè)計(jì)是指虛擬生成滿足可能靶標(biāo)結(jié)合等標(biāo)準(zhǔn)的新型化合物,并且已經(jīng)研究了數(shù)十年。從頭設(shè)計(jì)方法大致分為基于受體(靶標(biāo)結(jié)合位點(diǎn)的結(jié)構(gòu)已知)或基于配體(例如,使用沒(méi)有任何蛋白質(zhì)結(jié)構(gòu)信息的已知粘合劑的3D藥效團(tuán)),最近,該領(lǐng)域的大量努力集中在生成神經(jīng)網(wǎng)絡(luò)上,這些神經(jīng)網(wǎng)絡(luò)通過(guò)學(xué)習(xí)大型和多樣化化合物集的特征來(lái)訓(xùn)練產(chǎn)生新分子。簡(jiǎn)而言之,迄今為止報(bào)告的大多數(shù)生成化學(xué)框架都廣泛基于自動(dòng)編碼器(AE),生成對(duì)抗網(wǎng)絡(luò)(GAN)或最近的變壓器模型。自動(dòng)編碼器由編碼器和解碼器部分組成。編碼器生成其輸入的尺寸縮小的“潛在變量”表示。解碼器接收此作為輸入,并學(xué)習(xí)在輸出處重建每個(gè)輸入訓(xùn)練示例。變分自動(dòng)編碼器(VAE)的結(jié)構(gòu)類似,盡管在這種情況下,訓(xùn)練目標(biāo)包括一個(gè)項(xiàng),該項(xiàng)強(qiáng)制潛在變量分布接近所需的預(yù)選先驗(yàn)分布(通常是高斯分布)。這種添加在學(xué)習(xí)的潛在空間上強(qiáng)制執(zhí)行正則化。相比之下,GAN由生成器和鑒別器網(wǎng)絡(luò)組成。生成器從多元先驗(yàn)分布中提取隨機(jī)樣本,并將其轉(zhuǎn)換為感興趣數(shù)據(jù)的候選示例。鑒別器對(duì)所提供的示例進(jìn)行評(píng)分,并嘗試將其分類為真假。兩種模型同時(shí)在逆境中訓(xùn)練,導(dǎo)致 2 人零和博弈,其中一個(gè)模型的改進(jìn)導(dǎo)致另一個(gè)模型的性能下降。因此,生成器的改進(jìn)對(duì)應(yīng)于通過(guò)從隨機(jī)噪聲中采樣來(lái)產(chǎn)生與鑒別器感知到的真實(shí)數(shù)據(jù)分布更匹配的樣本。對(duì)于這兩種模型類型,通過(guò)從學(xué)習(xí)的潛在表示或?qū)W習(xí)的分布中采樣和解碼,可以生成訓(xùn)練中看不到的新分子。通常,這些模型已被訓(xùn)練為直接輸出新分子的SMILES表示。在AE/VAE框架中,這是一個(gè)適合遞歸神經(jīng)網(wǎng)絡(luò)(RNN)的“序列到序列”學(xué)習(xí)任務(wù),然而,在較長(zhǎng)的序列中有效學(xué)習(xí)長(zhǎng)程依賴性和上下文對(duì)RNN來(lái)說(shuō)可能是有問(wèn)題的??梢酝ㄟ^(guò)引入“注意力”機(jī)制進(jìn)行改進(jìn),該機(jī)制對(duì)位置上下文的信息進(jìn)行編碼。轉(zhuǎn)換器通過(guò)使用“僅注意”框架擴(kuò)展了這一概念,該框架消除了基于序列的任務(wù)中對(duì)RNN的需求。最近,這種較新的方法也被研究用于分子優(yōu)化和反應(yīng)預(yù)測(cè)。除了SMILES之外,還利用了一系列其他分子表示。Deep-SMILES和自引用嵌入式字符串(SELFIES)是專門為生成建模開發(fā)的替代字符串表示形式,它解決了語(yǔ)法不正確(無(wú)效)字符串通常由基于SMILES的生成器返回的問(wèn)題,有趣的是,最近報(bào)道了一種快速生成算法(使用SELFIES),該算法消除了對(duì)機(jī)器學(xué)習(xí)模型的需求,使用分子圖的生成模型也有報(bào)道。

從頭分子設(shè)計(jì)在藥物發(fā)現(xiàn)中的大多數(shù)應(yīng)用自然都是針對(duì)生產(chǎn)類藥物分子,盡管上面的模型框架同樣適用于片段生成。我們最近報(bào)告了一個(gè)片段自動(dòng)編碼器模型,該模型經(jīng)過(guò)訓(xùn)練可以重現(xiàn)SMILES和化學(xué)指紋。使用來(lái)自先前屏幕的內(nèi)部數(shù)據(jù),我們將遷移學(xué)習(xí)應(yīng)用于指紋解碼器層,以開發(fā)一個(gè)模型,該模型對(duì)新生成的分子成為“特權(quán)”片段(能夠與多個(gè)蛋白質(zhì)靶標(biāo)結(jié)合)的可能性進(jìn)行評(píng)分。我們的采樣方法使用粒子群優(yōu)化來(lái)同時(shí)優(yōu)化特權(quán)片段分?jǐn)?shù),合成可及性和Fsp3等標(biāo)準(zhǔn)。Winter等人也報(bào)告了類似的采樣方法,以鑒定潛在的表皮生長(zhǎng)因子受體(EGFR)和β位點(diǎn)淀粉樣蛋白前體蛋白裂解酶1(BACE1)抑制劑,同時(shí)針對(duì)具有多種吸收,分布,代謝,排泄和毒性(ADMET)特性的支持載體模型進(jìn)行優(yōu)化。在另一種基于片段的方法中,Arus-Pous等人開發(fā)了一個(gè)“腳手架裝飾器”模型。這包括一個(gè)腳手架生成器模型,該模型輸出具有定義連接點(diǎn)的片段。這些隨后由裝飾器模型修改,該模型將符合 Ro3 標(biāo)準(zhǔn)的組添加到每個(gè)連接點(diǎn)。在一項(xiàng)實(shí)驗(yàn)中,作者使用一組通過(guò)碎片化已知的多巴胺受體D2(DRD2)調(diào)節(jié)劑獲得的支架和裝飾來(lái)訓(xùn)練模型。然后,該模型能夠生成新的分子,當(dāng)使用不同的新支架時(shí),計(jì)算機(jī)預(yù)測(cè)活動(dòng)。這種方法有可能被用來(lái)針對(duì)給定目標(biāo)提出碎片化命中增長(zhǎng)戰(zhàn)略。我們將在下面進(jìn)一步討論生成建模在片段闡述中的潛在應(yīng)用。

2.3 不同類型的片段庫(kù)和一些注意事項(xiàng)

2.3.1 19F

核磁共振是用于檢測(cè)弱結(jié)合劑的最古老和最可靠的技術(shù),Shuker等人最初在1996年報(bào)道了“核磁共振SAR”。?從那時(shí)起,該領(lǐng)域得到了大幅發(fā)展,異核波譜方法(檢測(cè)源自1H以外的原子核的化學(xué)位移,例如19F)現(xiàn)在與1H NMR波譜一起廣泛用于鑒定新型粘合劑??紤]到這一點(diǎn),設(shè)計(jì)用于19F NMR篩選的含氟原子的片段庫(kù)現(xiàn)在是片段篩選過(guò)程中的關(guān)鍵組成部分。上述一般文庫(kù)設(shè)計(jì)考慮因素應(yīng)應(yīng)用于19F片段文庫(kù),但需要注意的是,分子必須至少包含一個(gè)氟原子。

1H篩選依賴于片段雞尾酒(fragment cocktails),需要仔細(xì)設(shè)計(jì)以限制信號(hào)重疊。相比之下,使用含19F的片段可以簡(jiǎn)化光譜分析,因?yàn)榛瘜W(xué)位移分散更寬,與背景信號(hào)的重疊最小。因此,可以在大約19種化合物的混合物中篩選20F片段文庫(kù),而標(biāo)準(zhǔn)混合物僅包含5-6個(gè)分子實(shí)體。有趣的是,已經(jīng)表明,~1200個(gè)氟化化合物的文庫(kù)大小可以實(shí)現(xiàn)與一組~2000個(gè)標(biāo)準(zhǔn)片段相似的多樣性水平。由于改善了物理化學(xué)和代謝特性,與將其用作生物等排體有關(guān),因此包含氟可能是一個(gè)額外的優(yōu)勢(shì)。因此,如果它增強(qiáng)先導(dǎo)化合物的相互作用和/或改善ADME特性,則在細(xì)化過(guò)程中不需要將其去除。

2.3.2 共價(jià)

雖然標(biāo)準(zhǔn)的1H和19F NMR庫(kù)占FBDD篩選的大多數(shù),但最近一些新技術(shù)已經(jīng)取得成果。隨著人們對(duì)共價(jià)抑制劑的興趣重新拾起,共價(jià)片段領(lǐng)域引起了人們的關(guān)注。所有共價(jià)片段都含有反應(yīng)性親電官能團(tuán),通常能夠與氨基酸殘基形成不可逆鍵。除了標(biāo)準(zhǔn)的FBDD考慮因素外,在設(shè)計(jì)共價(jià)片段時(shí),還必須考慮親電官能團(tuán)的穩(wěn)定性(固有和生理?xiàng)l件)、反應(yīng)性和大小。與傳統(tǒng)的片段篩選不同,所需的參數(shù)可能會(huì)根據(jù)目標(biāo)蛋白質(zhì)而變化。因此,文庫(kù)設(shè)計(jì)可能受到氨基酸殘基的性質(zhì)[[81]]及其在活性位點(diǎn)內(nèi)的位置的影響。氨基酸側(cè)鏈的親核性和pKa可以根據(jù)蛋白質(zhì)環(huán)境而變化,因此,反應(yīng)性較低的氨基酸殘基可能需要反應(yīng)性更強(qiáng)的彈頭才能有效反應(yīng)。因此,希望維持一個(gè)包含一系列反應(yīng)性以及不同親電官能團(tuán)的文庫(kù)。值得注意的是,將高反應(yīng)性彈頭納入篩網(wǎng)可能導(dǎo)致識(shí)別較低親和力的結(jié)合物,其失活率恒定(kinact)由于共價(jià)鍵的形成,在結(jié)合事件中起比抑制常數(shù)(ki) 由可逆綁定產(chǎn)生。

除了考慮彈頭的反應(yīng)性外,親電功能最好由最小的接頭附加,而不是嵌入碎片支架中。這主要是因?yàn)閺楊^的幾何形狀和迎角在形成所需的共價(jià)鍵方面起著重要作用,因此,易于接近彈頭更有可能允許命中識(shí)別。共價(jià)命中可以使用傳統(tǒng)的片段策略生長(zhǎng)和合并,以通過(guò)非共價(jià)相互作用增強(qiáng)結(jié)合親和力。一旦支架得到優(yōu)化,甚至可以拆除彈頭并保持親和力。為此,可能傾向于采用共價(jià)方法來(lái)幫助識(shí)別親和力較低的變構(gòu)位點(diǎn)。然而,這種方法僅在存在合適的親核殘基時(shí)才適用。還應(yīng)謹(jǐn)慎行事,以確保結(jié)合發(fā)生在“真實(shí)”位點(diǎn)內(nèi),就像任何片段命中一樣,并且不是片段親電性升高的結(jié)果。

共價(jià)片段的篩選可以通過(guò)NMR進(jìn)行,就像傳統(tǒng)的片段組一樣。事實(shí)上,在多維異核實(shí)驗(yàn)中,隨著化學(xué)位移擾動(dòng)明顯增加,峰通常更明顯,從而更容易分析。以這種方式篩選了含溴結(jié)構(gòu)域蛋白4(BRD4)和KRas等備受矚目的靶標(biāo)。盡管如此,核磁共振通常未得到充分利用,通常采用更簡(jiǎn)單的MS研究進(jìn)行篩選。液相色譜-串聯(lián)質(zhì)譜(LC–MS/MS)可以準(zhǔn)確檢測(cè)共價(jià)結(jié)合是否以高通量方式發(fā)生。非變性MS通常與飛行時(shí)間(TOF)儀器結(jié)合使用,以實(shí)現(xiàn)對(duì)靶標(biāo)和片段的高靈敏度檢測(cè)。消化方案也可用于準(zhǔn)確確定哪個(gè)氨基酸發(fā)生了反應(yīng)。以這種方式篩選了100-1400種化合物(主要是丙烯酰胺和氯乙酰胺)的共價(jià)片段庫(kù),以鑒定Janus Kinase(JAK)和KRas)等已知靶標(biāo)的粘合劑。

最近引入了共價(jià)片段對(duì)接算法作為計(jì)算機(jī)方法發(fā)現(xiàn)可逆和不可逆片段抑制劑。還報(bào)道了使用其他檢測(cè)類型的篩查。利用核苷酸交換測(cè)定法鑒定KRASG12C通過(guò)Carmot Therapeutics Chemotype Evolution技術(shù)制備突變結(jié)合劑,需要基于現(xiàn)有片段樣分子快速合成和測(cè)試文庫(kù)。這通過(guò)藥效團(tuán)鏈接生成了一個(gè)“超越 3 規(guī)則”片段的自定義庫(kù)。丙烯酰胺化合物在篩選前未純化,最終導(dǎo)致發(fā)現(xiàn)了AMG-510(sotorasib),該藥物于2021年獲得FDA批準(zhǔn)用于治療非小細(xì)胞肺癌(NSCLC),直到2018年才進(jìn)入臨床。值得注意的是,從Shokat集團(tuán)在2013年首次發(fā)表證明KRASG12C突變體的可藥用性到治療現(xiàn)實(shí)生活中的患者,僅用了8年時(shí)間。

2.3.3 碎片和小碎片

2019年,Waring等人和Jhoti等人獨(dú)立報(bào)告了使用“Fraglites”和“Minifrags”鑒定配體-蛋白質(zhì)相互作用。Waring等人假設(shè)可以使用具有最小分子量(≤13個(gè)重原子)和復(fù)雜性的小型分子庫(kù)來(lái)識(shí)別相互作用位點(diǎn)。因此,他們利用了一組含有“藥效團(tuán)雙聯(lián)體”的化合物,能夠形成兩個(gè)極性鍵,但具有不同的空間取向。鹵素與這些成對(duì)的氫鍵基序一起包含在內(nèi),以允許在X射線晶體學(xué)中明確識(shí)別,利用鹵素取代基的異常散射。選擇了一組 31 種“FragLites”,以包含用于 X 射線晶體學(xué)篩選的高水溶性的所有藥效團(tuán)雙聯(lián)體組合。通過(guò)繪制細(xì)胞周期蛋白依賴性激酶2(CDK2)的圖譜證明了該方法的實(shí)用性,可識(shí)別直位位點(diǎn)和變構(gòu)位點(diǎn),命中迅速發(fā)展為先導(dǎo)化合物。同樣,Astex的“Minifrags”方法也利用高溶解性,超低分子量化合物(平均HAC<7),旨在對(duì)化學(xué)空間進(jìn)行采樣[[95]]。最少的81種化合物允許鑒定熱和熱配體結(jié)合點(diǎn),以潛在靶向蛋白質(zhì),例如ERK2。發(fā)現(xiàn)Minifrag組具有更高的命中率,并且比更傳統(tǒng)的440種化合物的X射線組具有更高的命中率,并且可以識(shí)別更多理論上可成藥的位點(diǎn)。這些方法在未來(lái)可能具有優(yōu)勢(shì),允許以最少的復(fù)合篩選確定新的靶位點(diǎn)。MiniFrag篩選套件的一個(gè)版本已被用于鑒定針對(duì)SARS-CoV-2主要蛋白酶的命中。

2.3.4 PhABit

最近,F(xiàn)BDD領(lǐng)域已經(jīng)擴(kuò)展到包括基于光親和力的篩選方法,Bush等人報(bào)道了使用“PhABit”通過(guò)共價(jià)捕獲鑒定蛋白質(zhì) - 配體相互作用。該方法利用光反應(yīng)性片段,在用光照射時(shí),在生化環(huán)境中與近端蛋白質(zhì)殘基交聯(lián)。然后可以通過(guò)完整的蛋白質(zhì)LC-MS鑒定命中,并進(jìn)行后續(xù)研究以確定結(jié)合親和力和交聯(lián)位點(diǎn)。這是在Cravatt及其同事報(bào)告的早期工作之后,其中光反應(yīng)性片段用于鑒定活細(xì)胞中的片段 - 蛋白質(zhì)相互作用。Phabits利用純化的蛋白質(zhì)來(lái)實(shí)現(xiàn)對(duì)目標(biāo)蛋白質(zhì)的高通量和靶向篩選,這在論文中通過(guò)鑒定KRAS的粘合劑得到了證明G12DBRD4-Protacs僅使用556個(gè)片段。識(shí)別出的命中可以立即用作置換測(cè)定中的報(bào)告,以特定地點(diǎn)的方式篩選更有效的粘合劑。盡管未來(lái)具有潛在的優(yōu)勢(shì),但獲得市售光反應(yīng)性片段的機(jī)會(huì)仍然很差。此外,一些靶標(biāo)類別,如膜結(jié)合蛋白,不太可能對(duì)該方法有反應(yīng),因?yàn)樗鼈兺ǔP枰€(wěn)定在脂質(zhì)雙層中。此外,交聯(lián)產(chǎn)率通常較低,并不總是與親和力相關(guān)。


3 片段生長(zhǎng)

與任何篩查活動(dòng)一樣,需要優(yōu)先考慮命中以集中資源。但是,是什么讓一個(gè)好的片段命中?需要考慮多個(gè)參數(shù)。生物活性顯然是最重要的之一,因此靶標(biāo)結(jié)合驗(yàn)證和配體效率(LE)或親脂效率(LiPE)等參數(shù)的生成有助于促進(jìn)適當(dāng)?shù)谋容^。概括地說(shuō),生長(zhǎng)分子會(huì)增加親脂性,因此親水性更強(qiáng)的撞擊可能是有利的。除此之外,重要的是要考慮許多其他因素:溶解度、商業(yè)類似物和起始材料的可用性、整體合成可處理性,也許最重要的是結(jié)合模式結(jié)構(gòu)信息的可用性。用于驗(yàn)證和即時(shí)SAR的緊密類似物的可用性非常重要,因?yàn)樗鼘Q定項(xiàng)目的進(jìn)展速度。此時(shí),應(yīng)該忽略頻繁的hitter和不需要的功能。雖然,使用設(shè)計(jì)合理的篩選庫(kù),這種類型的命中率應(yīng)該是最小的。增加命中以增加分子的大小并包含額外的功能是從片段到類似藥物的分子的最直接方法。確定生長(zhǎng)載體和與靶標(biāo)的潛在相互作用點(diǎn)對(duì)于合理設(shè)計(jì)非常重要,如果沒(méi)有晶體結(jié)構(gòu)的幫助,可能會(huì)很困難。為此,X射線晶體學(xué)已成為一種越來(lái)越流行的快速命中勘探篩選方法,XChem和FragMAX等平臺(tái)現(xiàn)已廣泛使用,一些小組還探索了通過(guò)這種方法篩選粗反應(yīng)混合物。然而,生長(zhǎng)晶體可能具有挑戰(zhàn)性,分辨率可能很差,并且仍然需要二級(jí)技術(shù)來(lái)確定結(jié)合親和力。在無(wú)法獲得結(jié)構(gòu)信息的情況下,可以從核磁共振實(shí)驗(yàn)中獲得證據(jù),或者從對(duì)接計(jì)算中獲得的片段/受體復(fù)合物可以用作有根據(jù)的猜測(cè),對(duì)接計(jì)算允許預(yù)測(cè)受體/配體結(jié)合基序并為獲得的結(jié)合姿勢(shì)分配排名分?jǐn)?shù)。在最幸運(yùn)的情況下,對(duì)接評(píng)分可以直接與實(shí)驗(yàn)結(jié)合親和力相關(guān)。使用具有已知實(shí)驗(yàn)結(jié)合親和力的現(xiàn)有受體/配體晶體學(xué)數(shù)據(jù)評(píng)估結(jié)果始終是一種很好的做法,特別是對(duì)于受體表現(xiàn)出高度靈活性的情況。對(duì)接既可用于篩選片段庫(kù),也可用于協(xié)助片段制作。通常,使用柔性配體和剛性受體進(jìn)行對(duì)接,將片段核心視為固定。然而,大多數(shù)時(shí)候這個(gè)假設(shè)是不正確的,因?yàn)槭荏w構(gòu)象變化發(fā)生在結(jié)合時(shí)。因此,誘導(dǎo)契合對(duì)接和分子動(dòng)力學(xué)(MD)等技術(shù)也用于通過(guò)對(duì)接評(píng)估預(yù)測(cè)的結(jié)合基序。由于該方法的計(jì)算成本較高,導(dǎo)契合通常保留用于細(xì)化目的,而不是在非常早期的篩選階段使用。在篩選數(shù)千種化合物量級(jí)的文庫(kù)時(shí),考慮蛋白質(zhì)構(gòu)象自由度的一種更快、更便宜的方法是對(duì)不同的受體構(gòu)象進(jìn)行剛性受體對(duì)接計(jì)算,這些計(jì)算要么來(lái)自實(shí)驗(yàn)數(shù)據(jù),要么來(lái)自使用MD模擬事先獲得。這些可以與增強(qiáng)的采樣技術(shù)相結(jié)合,例如加速M(fèi)D和元?jiǎng)恿W(xué),以加速載脂受體空間探索并為蛋白質(zhì)構(gòu)象分配收斂概率估計(jì)。這可以被視為構(gòu)象受體概率評(píng)分,并用于平均和重新權(quán)衡對(duì)接評(píng)分。在這種情況下,當(dāng)受體結(jié)構(gòu)未結(jié)晶并且通過(guò)Discovery Studio的moddler進(jìn)行同源建?;驈腁lphaFold預(yù)測(cè)中獲得時(shí),載脂蛋白受體模擬可能非常有用。大多數(shù)對(duì)接計(jì)算的一個(gè)常見問(wèn)題是,典型的評(píng)分函數(shù)無(wú)法準(zhǔn)確預(yù)測(cè)遠(yuǎn)離已知生物活性配體的姿勢(shì)。結(jié)合姿勢(shì)總是可以通過(guò)加強(qiáng)對(duì)配體構(gòu)象空間的探索來(lái)改善。例如,這可以使用分子動(dòng)力學(xué)模擬或增強(qiáng)的采樣技術(shù)(例如元?jiǎng)恿W(xué))來(lái)完成。這些算法的計(jì)算成本更高,因此不建議用于初始篩選階段,而是用于選定片段子集的細(xì)化階段。對(duì)接分?jǐn)?shù)也可以通過(guò)使用分子力學(xué)泊松-玻爾茲曼表面積(MM / PBSA)更準(zhǔn)確的結(jié)合親和力估計(jì)來(lái)補(bǔ)充,這在速度和準(zhǔn)確性之間提供了合理的權(quán)衡。盡管對(duì)接是?HTS 的一項(xiàng)既定技術(shù),但它直到最近才開始系統(tǒng)地用于片段庫(kù)。片段的小尺寸以及其弱親和力和動(dòng)態(tài)結(jié)合基序使得基于計(jì)算結(jié)構(gòu)的片段虛擬屏幕具有挑戰(zhàn)性。此外,缺乏完整的蛋白質(zhì)-片段復(fù)合物數(shù)據(jù)集使驗(yàn)證和對(duì)接結(jié)果評(píng)估變得復(fù)雜。然而,一些研究表明,最常用的小分子對(duì)接程序性能可以接受。一旦已知配體-靶標(biāo)復(fù)合物的結(jié)構(gòu)信息已知,就可以使用支架跳躍等技術(shù)用新的分子片段替換分子支架的中心元件。在理想情況下,兩個(gè)初始構(gòu)建塊的特征應(yīng)累加地促進(jìn)親和力。但是,幾何形狀是關(guān)鍵,因此可能需要考慮幾個(gè)鏈接/合并選項(xiàng)。從計(jì)算的角度來(lái)看,可以使用幾種技術(shù)來(lái)估計(jì)結(jié)合親和力。其中,我們命名為MM / PBSA和自由能擾動(dòng)(FEP),后者被證明對(duì)配體優(yōu)化特別有效,特別是當(dāng)配體設(shè)計(jì)中的微小變化被引入時(shí)。

最近基于機(jī)器學(xué)習(xí)的從頭設(shè)計(jì)方法的爆炸式增長(zhǎng)也提供了許多方法,有可能幫助片段闡述。除了前面討論的支架裝飾器模型之外,Lim等人使用分子的雙重輸入及其Bemis-Murcko支架訓(xùn)練了基于圖的VAE。然后,該模型可以通過(guò)依次向提供的支架添加原子和鍵來(lái)生成新的分子圖。此外,生成可能以分子特性為條件。Green等人最近還報(bào)告了一種卷積神經(jīng)網(wǎng)絡(luò),該網(wǎng)絡(luò)經(jīng)過(guò)訓(xùn)練,可以預(yù)測(cè)對(duì)應(yīng)于片段的獨(dú)特指紋,該片段可以添加到已知的受體/配體結(jié)構(gòu)中,以提高已知輸入“親本”配體的結(jié)合親和力。然后可以將預(yù)測(cè)的指紋與已知片段的指紋庫(kù)進(jìn)行匹配。Olivecrona等人使用強(qiáng)化學(xué)習(xí)(RL)訓(xùn)練了一個(gè)遞歸神經(jīng)網(wǎng)絡(luò)SMILES生成器,并說(shuō)明了它在幾個(gè)任務(wù)中的使用,包括相似性和目標(biāo)活動(dòng)引導(dǎo)的生成,RL將發(fā)電機(jī)與“批評(píng)者”相結(jié)合,“批評(píng)家”為發(fā)電機(jī)輸出分配獎(jiǎng)勵(lì)。生成器經(jīng)過(guò)訓(xùn)練以最大化此預(yù)期獎(jiǎng)勵(lì)。靶點(diǎn)-活性任務(wù)需要針對(duì)所選靶標(biāo)(DRD2受體)的活性/非活性化合物的訓(xùn)練數(shù)據(jù)集,這在針對(duì)新靶標(biāo)的早期命中闡述中可能缺乏。但是,RL 也可用于屬性引導(dǎo)生成。Stahl等人在他們的RL模型中使用了基于片段的顯式分子編碼。另一種可用于生成結(jié)構(gòu)與片段命中相似但具有目標(biāo)范圍特性的分子的方法是mol-cycleGAN,cycleGAN 方法旨在提供兩個(gè)未配對(duì)數(shù)據(jù)域?X 和 Y 之間的映射(最初用于圖像翻譯的一個(gè)例子是未直接配對(duì)的馬和斑馬的照片)。它由兩個(gè)耦合的GAN模型組成。一個(gè)模型旨在學(xué)習(xí)翻譯X的元素以類似于Y的元素(例如,馬→斑馬)。另一個(gè)模型旨在學(xué)習(xí)逆映射。這些模型與“周期一致”目標(biāo)一起訓(xùn)練,使得由第一個(gè)網(wǎng)絡(luò)翻譯成域Y的X元素應(yīng)該通過(guò)第二個(gè)GAN映射回自身。在使用中,使用一個(gè)網(wǎng)絡(luò)。例如,馬的圖像可能會(huì)被賦予斑馬狀條紋,在mol-cycleGAN中,訓(xùn)練集可以是無(wú)活性/活性化合物,也可以是發(fā)散于另一個(gè)感興趣屬性的集合。該方法用于多項(xiàng)任務(wù),包括優(yōu)化cLogP,同時(shí)保持結(jié)構(gòu)相似性,以及預(yù)測(cè)的DRD2活性優(yōu)化任務(wù)。

上述研究只是一個(gè)快速增長(zhǎng)領(lǐng)域的一小部分樣本,徹底的審查超出了這項(xiàng)工作的范圍。然而,我們注意到,圍繞藥物發(fā)現(xiàn)中新型人工智能驅(qū)動(dòng)的從頭方法的興奮源于這些方法可用于或多或少直接到達(dá)臨床候選藥物的建議(或至少大大減少在設(shè)計(jì)-制造-測(cè)試-分析周期中花費(fèi)的時(shí)間)。迄今為止,該領(lǐng)域最成功的公司之一Exscientia及其合作伙伴已使用其設(shè)計(jì)平臺(tái)將加速計(jì)劃中發(fā)現(xiàn)的三種分子推進(jìn)到I期[DSP-0038,一種雙5-羥色胺(5-HT)1A / 2A拮抗劑;EXS-21546,腺苷A2A受體拮抗劑;和DSP-1181,一種5-HT1A拮抗劑]。。在這種情況下,人們可能會(huì)問(wèn),從頭設(shè)計(jì)是否會(huì)取代FBDD。然而,許多將基于人工智能的設(shè)計(jì)應(yīng)用于特定靶標(biāo)的出版物都專注于眾所周知和以前被藥物化的靶標(biāo),這些靶標(biāo)具有相對(duì)較大的生物活性數(shù)據(jù)集,例如DRD2。因此,基于人工智能的從頭設(shè)計(jì)將對(duì)非常困難的目標(biāo)(FBDD擅長(zhǎng)的領(lǐng)域)產(chǎn)生的影響還有待觀察。然而,這是一個(gè)快速發(fā)展的領(lǐng)域,整合基于結(jié)構(gòu)的信息以推動(dòng)發(fā)電改進(jìn)的策略特別令人感興趣。


4 結(jié)論

在這篇綜述中,除了概述可能加速FBDD的化學(xué)和計(jì)算新興技術(shù)之外,我們還旨在讓讀者了解設(shè)計(jì)片段庫(kù)的關(guān)鍵考慮因素。正如我們?cè)陂_始時(shí)提到的,F(xiàn)BDD方法的使用迄今為止已經(jīng)產(chǎn)生了六種上市藥物和許多額外的臨床候選藥物。盡管這些藥物中的許多是使用“經(jīng)典的”FBDD方法發(fā)現(xiàn)的,但患者已經(jīng)感受到了更新的FBDD技術(shù)的影響。我們?cè)谏厦嫣岬搅薙otorasib的快速發(fā)展,它在首次證明KRASG12C突變體的成藥性僅8年后,于2021年獲得FDA批準(zhǔn)。與通過(guò)更傳統(tǒng)的FBDD方法發(fā)現(xiàn)的最新批準(zhǔn)藥物asciminib相比,該藥物于2014年進(jìn)入臨床試驗(yàn)。當(dāng)人們考慮到KRAS在這之前被認(rèn)為是“不可治愈的”時(shí),這就更加令人印象深刻了。我們相信這個(gè)例子說(shuō)明了新的FBDD技術(shù)和智能文庫(kù)設(shè)計(jì)的新興武庫(kù)如何最終導(dǎo)致針對(duì)藥物發(fā)現(xiàn)中一些最困難的目標(biāo)的進(jìn)展,這些目標(biāo)迄今為止已被證明是棘手的。


基于片段的藥物發(fā)現(xiàn)——高質(zhì)量分子庫(kù)的重要性的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
天等县| 岐山县| 绥宁县| 宣城市| 奉化市| 闸北区| 岚皋县| 略阳县| 西乡县| 江孜县| 巴南区| 卢龙县| 夹江县| 阿瓦提县| 梓潼县| 会宁县| 陵川县| 古浪县| 南投市| 勃利县| 栾川县| 文登市| 焦作市| 凤冈县| 同仁县| 普兰店市| 三原县| 民乐县| 巢湖市| 寿宁县| 双牌县| 赤水市| 安顺市| 武冈市| 汨罗市| 信阳市| 长海县| 锦州市| 姜堰市| 鄂托克前旗| 安平县|