端到端藥物發(fā)現(xiàn)過程中 AI/ML 的產(chǎn)業(yè)化
幾十年來,藥物發(fā)現(xiàn)一直是用于成功鑒定候選藥物的最困難和最復雜的過程之一,然而還不存在藥物發(fā)現(xiàn)成功的通用途徑。早期階段的藥物發(fā)現(xiàn)需要重復構(gòu)建和證實假設(shè),并且由于缺乏關(guān)于靶標和藥物的結(jié)論性信息而存在風險。人工智能和機器學習 (AI/ML)?已經(jīng)被應用于通過使用基于可用數(shù)據(jù)訓練的模型來提高過程的效率。AI/ML 方法的最新進展,如生物和分子圖學習、幾何學習、分子生成模型等,使藥物發(fā)現(xiàn)過程的多個階段得到了擴展應用。
AI/ML 的應用范圍已經(jīng)擴展到早期藥物發(fā)現(xiàn)的整個過程,這通常被稱為端到端藥物發(fā)現(xiàn)過程,其中臨床未滿足的需求和候選藥物分子是兩個終點(圖1)。該過程從確定有效、安全和可藥物的適當靶標開始。AI/ML?為系統(tǒng)、大規(guī)模分析復雜和異質(zhì)性的生物數(shù)據(jù)提供了強大的工具,包括確定和優(yōu)先考慮有希望的靶標。靶標鑒定和驗證之后是藥物分子的發(fā)現(xiàn),這一過程一般從高通量或虛擬篩選大化學空間篩選大化學空間獲得的打擊分子的鑒定和優(yōu)先排序開始。隨后的分子設(shè)計需要在多性質(zhì)優(yōu)化的背景下對命中化合物進行修飾。最近,幾家公司試圖構(gòu)建跨越整個端到端藥物發(fā)現(xiàn)過程的基于 AI/ML 的平臺。



從命中識別到先導優(yōu)化
目標臨床前候選藥物應具有良好的效力和選擇性;理化性質(zhì)應支持適當?shù)奈?、分布、代謝和排泄行為;以及一般安全性。典型的藥物發(fā)現(xiàn)過程由幾個階段組成,以確保存在這些特征。命中識別是識別與靶標主動相互作用的化合物的第一步,通常用高通量或虛擬篩選進行。在確定了有希望的命中系列后,下一階段涉及一系列分子結(jié)構(gòu)的修飾以優(yōu)化性質(zhì),這對應于多輪設(shè)計-制造-測試-分析循環(huán)。AI/ML 提供了有效的數(shù)據(jù)驅(qū)動生成和預測模型,以提高這些過程的效率。盡管通過這些可購買的化合物進行搜索被認為可以提高早期打擊識別活動的成功率,但即使對于高效的計算篩選方法,對數(shù)十億種化合物的評估仍然是一項具有挑戰(zhàn)性的任務。主動學習用于通過構(gòu)建替代 ML 模型來降低計算負擔,該模型僅模擬化合物池一小部分的對接模擬結(jié)果。
通過關(guān)注更有前景和信息更豐富的分子,優(yōu)先考慮具有預測特性的設(shè)計化合物大大降低了合成和測試步驟的成本。數(shù)據(jù)驅(qū)動模型可作為這些情況下有前景的預測方法。由于每一輪優(yōu)化中獲得的數(shù)據(jù)量并不豐富,因此在這種情況下構(gòu)建準確的預測模型具有挑戰(zhàn)性。少拍學習是應對這一挑戰(zhàn)的新興方法。將 Meta 學習應用于藥物-靶標相互作用預測,以少量初始樣本快速構(gòu)建準確的預測模型。
AI/ML 算法生成分子結(jié)構(gòu)的能力被認為是藥物發(fā)現(xiàn)中最有前途的應用之一。各種生成模型積極適應生成化學結(jié)構(gòu),以支持從頭藥物設(shè)計,包括遞歸神經(jīng)網(wǎng)絡、編碼器-解碼器模型、強化學習、生成對抗網(wǎng)絡和最近基于流的模型。盡管這些生成模型為設(shè)計優(yōu)化結(jié)構(gòu)提供了一個通用框架,但在實踐中,應仔細調(diào)整這些模型,以滿足部分揭示的構(gòu)效關(guān)系的細微結(jié)構(gòu)約束。
趨勢和前景
藥物發(fā)現(xiàn)是一個漫長而復雜的過程,用于鑒定特定疾病的有希望的候選分子。針對藥物發(fā)現(xiàn)過程中的各個階段開發(fā)了 AI/ML 模型,出現(xiàn)了基于 AI/ML 的藥物發(fā)現(xiàn)公司,應用這些新工具來推進漫長而昂貴的藥物發(fā)現(xiàn)過程。盡管公司的首要焦點一直是生產(chǎn)新型候選藥物,但一些領(lǐng)先公司已經(jīng)成功實現(xiàn)了端到端藥物發(fā)現(xiàn)能力,從靶標發(fā)現(xiàn)到候選藥物鑒定(表1)。這些嘗試重組了藥物發(fā)現(xiàn)和開發(fā)過程,并利用了重新定義的價值鏈的運營效益,從而證明 AI/ML的最新進展已經(jīng)以難以想象的方式影響了藥物發(fā)現(xiàn)。Exscientia 已經(jīng)建立了端到端 AI/ML 功能,包括精準靶向、候選藥物的產(chǎn)生和優(yōu)化以及臨床試驗優(yōu)化。該公司具有內(nèi)部實驗能力,并生成數(shù)據(jù)以支持其 AI/ML 模型。計算機模擬醫(yī)學還構(gòu)建了包括多組學靶標鑒定、化學平臺和臨床試驗預測工具在內(nèi)的一組特征。該公司聲稱,與通過傳統(tǒng)工藝所需的3-5年相比,這些工具將識別臨床前候選藥物所需的時間縮短到12-18個月。
盡管如此,基于 AI/ML 的藥物發(fā)現(xiàn)公司尋求開發(fā)完全基于 AI/ML 的端到端藥物發(fā)現(xiàn)平臺仍然存在挑戰(zhàn)。對于靶標發(fā)現(xiàn),主要問題是數(shù)據(jù)偏向于眾所周知的靶標。許多研究不足的靶標仍然存在,從而阻止了目前的生物數(shù)據(jù)網(wǎng)絡擴展到所有可能的靶標。人們試圖建立高度自動化的系統(tǒng),通過使用 AI/ML 生成和優(yōu)先考慮分子。然而,開發(fā)這類系統(tǒng)帶來了許多挑戰(zhàn),如綜合預測和不確定性量化。
盡管面臨許多挑戰(zhàn),這些端到端藥物發(fā)現(xiàn)技術(shù)一直在推動從傳統(tǒng)服務和軟件模式向資產(chǎn)開發(fā)伙伴關(guān)系和管線開發(fā)的轉(zhuǎn)變,從而導致投資激增。制藥公司也在關(guān)注這一趨勢,以便能夠?qū)⒆约号c競爭對手區(qū)分開來。因此我們強調(diào)了在包括生物學和化學在內(nèi)的領(lǐng)域開發(fā)廣泛的 AI/ML 模型的潛在價值,以創(chuàng)造制藥行業(yè)的主要競爭優(yōu)勢。
參考文獻:Yoo J, Kim TY, Joung I, Song SO. Industrializing AI/ML during the end-to-end drug discovery process. Curr Opin Struct Biol. 2023 Apr;79:102528. doi: 10.1016/j.sbi.2023.102528. Epub 2023 Feb 1. PMID: 36736243.
版權(quán)信息
本文系A(chǔ)IDD Pro接受的外部投稿,文中所述觀點僅代表作者本人觀點,不代表AIDD Pro平臺,如您發(fā)現(xiàn)發(fā)布內(nèi)容有任何版權(quán)侵擾或者其他信息錯誤解讀,請及時聯(lián)系A(chǔ)IDD Pro (請?zhí)砑游⑿盘杝ixiali_fox59)進行刪改處理。
原創(chuàng)內(nèi)容未經(jīng)授權(quán),禁止轉(zhuǎn)載至其他平臺。有問題可發(fā)郵件至sixiali@stonewise.cn