人工智能在藥物設(shè)計(jì)中的應(yīng)用(二)
虛擬篩選
藥物發(fā)現(xiàn)首先需要從大型化學(xué)庫(kù)中識(shí)別活性化合物,這一步通常通過(guò)高通量篩選(HTS)來(lái)完成。然而,HTS可能成本高且覆蓋化學(xué)空間有限。虛擬篩選(VS)是一種替代方法,它在計(jì)算機(jī)中篩選化合物,可以實(shí)現(xiàn)有效物質(zhì)的富集,但是其準(zhǔn)確率不夠,可能會(huì)產(chǎn)生假陽(yáng)性。虛擬篩選(VS)可分為兩種類型:基于配體和基于結(jié)構(gòu)的?;谂潴w的VS使用一組已知活性化合物來(lái)識(shí)別其他活性分子。由于它不需要關(guān)于生物系統(tǒng)的機(jī)理信息,因此適用于在目標(biāo)生物分子的結(jié)構(gòu)未知或存在多個(gè)可能的靶點(diǎn)的情況。基于結(jié)構(gòu)的VS評(píng)估一個(gè)配體與目標(biāo)結(jié)合口袋的三維結(jié)構(gòu)互補(bǔ)性。這種機(jī)理研究對(duì)于藥物設(shè)計(jì)過(guò)程非常有價(jià)值,但是獲取3D信息很困難,而且并不是每個(gè)目標(biāo)的結(jié)構(gòu)都是可用的。此外,基于結(jié)構(gòu)的VS所使用的軟件(如Autodock Vina 或Glide 等對(duì)接應(yīng)用程序)常常無(wú)法新的或特定的靶點(diǎn)進(jìn)行定制。機(jī)器學(xué)習(xí)(ML)為虛擬篩選提供了新的可能性。
近年來(lái)隨著ML模型容量的提高,分子表征的范圍也變得更大了。例如,基因表達(dá)譜和細(xì)胞畫(huà)像譜可用于虛擬篩選(VS),以預(yù)測(cè)能夠恢復(fù)健康轉(zhuǎn)錄組特征或具有治療潛力的分子。ML模型也可以從數(shù)據(jù)集中學(xué)習(xí)自己的表征,使數(shù)據(jù)表征可以根據(jù)感興趣的任務(wù)進(jìn)行定制。變異自動(dòng)編碼器(VAEs)可以產(chǎn)生高度復(fù)雜的表征,可以對(duì)其進(jìn)行操作,以提高基于配體的VS的預(yù)測(cè)性能。
機(jī)器學(xué)習(xí)(ML)算法可以通過(guò)聚合不同來(lái)源的數(shù)據(jù)來(lái)改善藥物發(fā)現(xiàn)中的虛擬篩選(VS),以促進(jìn)在低數(shù)據(jù)體制下的學(xué)習(xí)。實(shí)現(xiàn)數(shù)據(jù)聚合的兩個(gè)有前途的框架是轉(zhuǎn)移學(xué)習(xí)和多任務(wù)學(xué)習(xí)。無(wú)標(biāo)簽的數(shù)據(jù)也可以通過(guò)自我監(jiān)督的學(xué)習(xí)來(lái)利用。從新的數(shù)據(jù)類型學(xué)習(xí),如轉(zhuǎn)錄組特征或細(xì)胞畫(huà)像,可以給VS帶來(lái)實(shí)質(zhì)性的改進(jìn)。只要進(jìn)行足夠的相關(guān)數(shù)據(jù)的訓(xùn)練,ML方法就可以在一系列的應(yīng)用中,包括基于配體和結(jié)構(gòu)的應(yīng)用,都顯示出優(yōu)于傳統(tǒng)的VS的性能。
計(jì)算機(jī)輔助合成路線
化學(xué)合成是藥物設(shè)計(jì)中很重要的一部分。合成路線的成功取決于幾個(gè)因素,包括產(chǎn)品的產(chǎn)量,找到最佳的試劑和條件,以及逆向合成斷開(kāi)的最佳策略。計(jì)算機(jī)輔助合成計(jì)劃(CASP),利用人工智能,可以考慮這些因素,并根據(jù)成本和材料可用性等變化動(dòng)態(tài)調(diào)整。有兩種基于人工智能的CASP方法:基于規(guī)則和基于ML。我們將討論了這些方法之間的差異。

基于規(guī)則的計(jì)算機(jī)輔助合成計(jì)劃(CASP)程序的發(fā)展已有超過(guò)50年的歷史了。早期的程序使用手工編碼的轉(zhuǎn)化規(guī)則,而目前的程序則從反應(yīng)數(shù)據(jù)庫(kù)中自動(dòng)提取轉(zhuǎn)化規(guī)則。雖然目前基于規(guī)則的CASP程序提供了更廣泛的反應(yīng)化學(xué)覆蓋面,但它們犧牲了轉(zhuǎn)化規(guī)則的細(xì)節(jié),而且可能沒(méi)有考慮到完整的反應(yīng)機(jī)制。盡管有這樣的局限性,基于規(guī)則的CASP程序已經(jīng)經(jīng)歷了徹底的前瞻性驗(yàn)證,并已成功應(yīng)用于藥物發(fā)現(xiàn)。
機(jī)器學(xué)習(xí)(ML)與計(jì)算機(jī)輔助合成計(jì)劃(CASP)的整合受到反應(yīng)數(shù)據(jù)的可用性和質(zhì)量的限制。ML算法需要大量的數(shù)據(jù)集,這些數(shù)據(jù)集通常來(lái)自商業(yè)策劃的數(shù)據(jù)庫(kù)和專利。這些數(shù)據(jù)庫(kù)很昂貴,而且學(xué)術(shù)機(jī)構(gòu)不容易得到。由于異質(zhì)性和許可問(wèn)題,從原始文獻(xiàn)中進(jìn)行文本挖掘十分困難。電子實(shí)驗(yàn)室筆記本(ELN)包含無(wú)偏見(jiàn)的反應(yīng)數(shù)據(jù),但由于商業(yè)上的敏感度,訪問(wèn)受到限制??朔@些數(shù)據(jù)獲取困難的障礙將提高M(jìn)L在CASP中的表現(xiàn)。

AI在輔助藥物合成路線上有很多機(jī)會(huì)。一個(gè)機(jī)會(huì)是使用 "digital glassware "等新技術(shù)來(lái)提高反應(yīng)數(shù)據(jù)的質(zhì)量和數(shù)量,這可以加強(qiáng)預(yù)測(cè)反應(yīng)產(chǎn)量和條件的模型。另一個(gè)機(jī)會(huì)是開(kāi)發(fā)用于生物催化的CASP工具,以擴(kuò)大藥物化學(xué)家的工具箱。最后,需要有普遍接受的retro和正向合成預(yù)測(cè)的基準(zhǔn),以便對(duì)該領(lǐng)域的進(jìn)展進(jìn)行更客觀的衡量。盡管機(jī)器學(xué)習(xí)在計(jì)算機(jī)輔助合成計(jì)劃領(lǐng)域取得了重大進(jìn)展,而且許多實(shí)施方案是開(kāi)源的或免費(fèi)的,但反應(yīng)數(shù)據(jù)的獲取和質(zhì)量往往是有限的和有偏見(jiàn)的,這限制了CASP中新的人工智能方法的進(jìn)展。CASP不太可能取代實(shí)驗(yàn)化學(xué)家,但使用AI的化學(xué)家可能會(huì)取代那些不使用AI的化學(xué)家。
從頭分子生成
為了尋找能達(dá)到預(yù)期藥效的分子結(jié)構(gòu),現(xiàn)在我們需要討論一下藥物設(shè)計(jì)中的生成模型。傳統(tǒng)方法是一個(gè)由設(shè)計(jì)-制造-測(cè)試-分析循環(huán)等過(guò)程構(gòu)成的的迭代過(guò)程,它既耗時(shí)又費(fèi)錢。生成模型已經(jīng)研究了三十年,并且一直在努力地搜索廣闊的化學(xué)空間。然而,最近人工神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)的進(jìn)展促進(jìn)了深度生成模型的發(fā)展,它可以從大量的數(shù)據(jù)中學(xué)習(xí),生成新的分子結(jié)構(gòu)。

用于分子生成的兩類生成模型:基于規(guī)則的模型和基于分布的模型。無(wú)論哪種模型類型,生成的分子都必須遵守化學(xué)原理,即獨(dú)特的、新穎的、多樣的,并且在合成上是可行的。然而,衡量這些特性十分困難,目前的衡量標(biāo)準(zhǔn)可能沒(méi)有捕捉到有意義的特性或區(qū)分復(fù)雜和簡(jiǎn)單模型。找到一個(gè)更好的衡量標(biāo)準(zhǔn)將促進(jìn)從頭開(kāi)始的分子生成領(lǐng)域的發(fā)展。參考資料:
Thomas M, Boardman A, Garcia-Ortegon M, et al. Applications of artificial intelligence in drug design: opportunities and challenges[J]. Artificial Intelligence in Drug Design, 2022: 1-59.
版權(quán)信息
本文系A(chǔ)IDD Pro接受的外部投稿,文中所述觀點(diǎn)僅代表作者本人觀點(diǎn),不代表AIDD Pro平臺(tái),如您發(fā)現(xiàn)發(fā)布內(nèi)容有任何版權(quán)侵?jǐn)_或者其他信息錯(cuò)誤解讀,請(qǐng)及時(shí)聯(lián)系A(chǔ)IDD Pro (請(qǐng)?zhí)砑游⑿盘?hào)sixiali_fox59)進(jìn)行刪改處理。
原創(chuàng)內(nèi)容未經(jīng)授權(quán),禁止轉(zhuǎn)載至其他平臺(tái)。有問(wèn)題可發(fā)郵件至sixiali@stonewise.cn