為世界第一大癌癥高效研發(fā)首創(chuàng)新藥,AI大模型助力藥物研發(fā)叩開未來之門
近日,三位高中生引爆了醫(yī)藥圈,他們使用人工智能(AI)引擎進(jìn)行靶點(diǎn)發(fā)現(xiàn),確定了多形性膠質(zhì)母細(xì)胞瘤(GBM)的新治療靶點(diǎn),多形性膠質(zhì)母細(xì)胞瘤(GBM)是最具侵襲性和最常見的惡性腦腫瘤類型,占所有原發(fā)性腦腫瘤的16%。他們合作撰寫的論文于4月26日發(fā)表在國際科學(xué)期刊《衰老》(aging)上,顯示了人工智能系統(tǒng)輔助新藥研發(fā)的廣闊前景。?
?人工智能(AI)技術(shù)正在從成本、效率等方面重塑制藥行業(yè)。近年來,相關(guān)專家認(rèn)為,AI制藥將成國內(nèi)醫(yī)藥產(chǎn)業(yè)彎道超車機(jī)遇,應(yīng)以AI制藥為切入點(diǎn),對這一新興領(lǐng)域加強(qiáng)前瞻性政策扶持,推動整個中國創(chuàng)新藥行業(yè)的原始、自主創(chuàng)新,或許在制藥領(lǐng)域,真正走向中國“智”造就在于人工智能技術(shù)的成熟應(yīng)用。

目前在制藥領(lǐng)域,AI制藥主要由三大類公司進(jìn)行相互協(xié)作共同推進(jìn)藥品研發(fā)進(jìn)程,IT技術(shù)公司、藥物研發(fā)CRO公司以及大型藥企。IT公司利用自身的互聯(lián)網(wǎng)基礎(chǔ)與平臺優(yōu)勢賦能行業(yè)應(yīng)用,大型藥企則擁有藥物研發(fā)的相關(guān)數(shù)據(jù)、成熟的研發(fā)管線以及資深的藥物專家,在優(yōu)勢互補(bǔ)的情況下,目前已經(jīng)可以看到AI制藥的很多成熟案例。

我國AI制藥起步較歐美起步稍晚,但發(fā)展迅速,更具數(shù)據(jù)、算法等優(yōu)勢,在剛剛結(jié)束的百度飛槳中國行(上海站)活動中,杭州立德百克生物醫(yī)藥總經(jīng)理王紫壹博士講述了他如何針對乳腺癌開展CDK4/6抑制劑的AI制藥之路。?
根據(jù)世衛(wèi)組織發(fā)布的數(shù)據(jù),早在2020年,乳腺癌就在全球新發(fā)病例上超過肺癌,成為世界第一大癌癥。我國則是全球乳腺癌發(fā)病人數(shù)最多的國家,每年新發(fā)病例數(shù)接近42萬。?
而CDK4/6抑制劑是目前全球范圍內(nèi)治療乳腺癌最為暢銷的藥物,用于治療HR陽性/HER2陰性的乳腺癌患者。比如,恒瑞醫(yī)藥的達(dá)爾西利、美國輝瑞的哌柏西利和美國禮來的阿貝西利等三款藥已在中國獲批上市,其中阿貝西利還進(jìn)入了國家醫(yī)保目錄。
?但CDK4/6抑制劑在給廣大患者帶來福音的同時,也存在著“瑕疵”,比如難以避免的產(chǎn)生了不同程度的耐藥性以及臨床副作用,而且同質(zhì)化競爭異常激烈。這就要求獨(dú)辟蹊徑,開發(fā)全新機(jī)制的CDK4/6抑制劑乳腺癌藥物。

對此,王紫壹團(tuán)隊(duì)提出利用CDK4/6的激酶活性必須依賴于自身同CCND(細(xì)胞周期素D)形成復(fù)合物這一關(guān)鍵特性,開發(fā)出能阻斷CDK4/6-CCND蛋白-蛋白相互作用的小分子化合物,同樣能夠使CDK4/6激酶失去活性,進(jìn)而達(dá)到抑制乳腺癌細(xì)胞生長的目的。?
新藥研發(fā)思路確定后,一個老大難問題再次浮現(xiàn),即需要找到對應(yīng)的目標(biāo)分子。這一過程的快慢,在過去只能取決于運(yùn)氣。而王紫壹團(tuán)隊(duì)拒絕墨守成規(guī),選擇了一條新路徑,采用百度飛槳螺旋槳生物計算平臺提供的文心生物計算大模型能力來進(jìn)行藥物發(fā)現(xiàn)的工作,成效令他頗為驚艷,僅僅幾個小時內(nèi),就在780萬個化合物的虛擬篩選庫中篩選出了110個打分較高的潛在候選分子。?
立德百克構(gòu)建了特異性的檢測方法對篩選出的化合物進(jìn)行活性檢測,從110個分子中采購了40個進(jìn)行濕實(shí)驗(yàn)檢測,最后發(fā)現(xiàn)有6個高潛力分子,其中3個化合物能同時打斷CDK4/6-CCND蛋白-蛋白相互作用,還有3個化合物能打斷CDK4-CCND蛋白-蛋白相互作用。目前,雙方團(tuán)隊(duì)正對這些化合物做更進(jìn)一步的研究,有望在不久的將來將這種新型抑制劑推向臨床。

據(jù)介紹,相比于現(xiàn)有CDK4/6抑制劑,新型藥物屬于機(jī)制創(chuàng)新的首創(chuàng)新藥,具備更優(yōu)的特異性,并在耐藥性與潛在副作用上更有優(yōu)勢,這將為廣大乳腺癌患者帶來福音。得益于這些優(yōu)勢,新型藥物有望打開可觀的市場空間。?
王紫壹博士介紹道,“百度擁有國內(nèi)領(lǐng)先的AI+藥物研發(fā)的技術(shù)能力,特別是文心生物計算大模型在國內(nèi)是非常領(lǐng)先的,運(yùn)用這些技術(shù)能力,飛槳螺旋槳幫助我們更高效的找到苗頭化合物分子,這大大提升了我們藥物發(fā)現(xiàn)的效率?!?
百度飛槳螺旋槳(PaddleHelix)是基于飛槳深度學(xué)習(xí)框架打造的“AI+生物”計算平臺,提供文心大模型-生物計算大模型能力,已開放多個算法模型,覆蓋小分子藥物篩選、多肽/蛋白藥物設(shè)計、mRNA疫苗/藥物設(shè)計等技術(shù),面向新藥研發(fā)、疫苗設(shè)計、精準(zhǔn)醫(yī)療等場景,為生物醫(yī)藥領(lǐng)域的創(chuàng)新藥企、醫(yī)藥技術(shù)提供商、科研機(jī)構(gòu)、生物科技公司等提供全面的算法工具和技術(shù)方案。

目前在華東區(qū)域,已有不少企業(yè)采用飛槳螺旋槳平臺開展了相關(guān)藥品研發(fā)。除杭州立德百克聯(lián)合百度飛槳螺旋槳開發(fā)乳腺癌創(chuàng)新藥之外,索智生物也在多個領(lǐng)域與飛槳螺旋槳合作,其中ADMET性質(zhì)預(yù)測大模型HelixADMET,已經(jīng)整合到索智自身的AI藥物發(fā)現(xiàn)平臺(AIxMol?),并成功應(yīng)用于其在研管線項(xiàng)目,有效地幫助索智提升合成測試濕實(shí)驗(yàn)成功率,進(jìn)而提高整體研發(fā)效率,在短短的18個月中成功確定了3個PCC分子。?
數(shù)據(jù)顯示,40-45%臨床試驗(yàn)的失敗歸結(jié)于藥物的高毒性和低類藥性。如果能夠在藥物研發(fā)的早期就排除性質(zhì)不佳的分子,就可以省下大量的時間和資金投入。因此,化合物的成藥性預(yù)測(簡稱ADMET)對新藥研發(fā)的成功至關(guān)重要。ADMET是藥物代謝動力學(xué)所關(guān)注的化合物在體內(nèi)的吸收、分布、代謝和排泄行為 (簡稱ADME) 與毒性 (Toxicity) 的合稱,是衡量化合物成藥性最重要的參考指標(biāo)。
針對該問題,業(yè)界已經(jīng)提出了很多解決方案,比如admetSAR、ADMETlab、swissADME等,但這些方法訓(xùn)練所使用的數(shù)據(jù)集量級普遍較小,故在對未知骨架結(jié)構(gòu)的化合物進(jìn)行性質(zhì)預(yù)測時效果較差,同時無法基于用戶需求做指標(biāo)拓展。未知骨架結(jié)構(gòu)的化合物進(jìn)行性質(zhì)預(yù)測泛化能力較差,藥物設(shè)計成本較高,可拓展性存在一定阻力。?
而飛槳螺旋槳的HelixADMET大模型可在60秒內(nèi)計算1000個分子的ADMET相關(guān)指標(biāo)。對比國內(nèi)外多個知名的ADMET預(yù)測軟件,在功能的完整度(預(yù)測52項(xiàng)指標(biāo))和指標(biāo)上的精度上(超過其他對比平臺4個百分點(diǎn)以上),都大大超過競品。相應(yīng)的研究已被收錄在生物信息學(xué)領(lǐng)域的頂級期刊Bioinformatics上。?
可以預(yù)見,在生物制藥領(lǐng)域,HelixADMET大模型可以應(yīng)用于化合物優(yōu)化/篩選階段,輔助決策優(yōu)先進(jìn)入臨床的化合物,規(guī)避后期的可能風(fēng)險;還能指導(dǎo)學(xué)術(shù)/項(xiàng)目的研究計劃制定,減少盲目實(shí)驗(yàn)的概率;同時模型可以用于驗(yàn)證新藥/仿制藥的成藥性,評估新藥/仿制藥的風(fēng)險,大大提高藥效研究的效率,更快地評估和驗(yàn)證新藥/仿制藥的效果。?
此外,在5月2日,國際頂級學(xué)術(shù)期刊《Nature》正刊發(fā)表了百度與合作單位在生物計算領(lǐng)域的突破性成果 ——《Algorithm for Optimized mRNA Design Improves Stability and Immunogenicity》,提出 mRNA 序列優(yōu)化算法 LinearDesign,百度赫然以第一完成單位署名該研究。以新冠病毒Spike蛋白為例,該算法能在短短11分鐘之內(nèi)找到最穩(wěn)定的mRNA候選序列。?
實(shí)驗(yàn)數(shù)據(jù)證明,LinearDesign算法設(shè)計序列將有助于生物醫(yī)藥公司快速研發(fā)更有效的 mRNA 疫苗,縮短研發(fā)周期,降低研發(fā)成本。這一算法的有效性已經(jīng)在新冠 mRNA 疫苗和帶狀皰疹 mRNA 疫苗兩種疫苗中得到驗(yàn)證。與傳統(tǒng)基準(zhǔn)相比,百度的設(shè)計顯著改善了體外 mRNA 半衰期和蛋白質(zhì)表達(dá),使體內(nèi)抗體反應(yīng)增強(qiáng)了高達(dá)128倍。
結(jié)語
人工智能最廣泛應(yīng)用領(lǐng)域或在藥物研究,一項(xiàng)新藥物的研發(fā),研究人員常需要通過設(shè)計、合成和評估多種化合物來創(chuàng)造潛在新型藥物,將具有發(fā)展前景的化合物精制為候選藥物的過程常常既昂貴又耗時。假如將人工智能與藥物研究相結(jié)合,不僅投入資本將大大減少,效率也會大幅度提高。 但是,就目前而言,我們?nèi)匀幻媾R發(fā)展中的瓶頸,AI制藥未來是否能夠快速發(fā)展應(yīng)從體制上全面激發(fā)我國AI制藥產(chǎn)業(yè)活力,在人才培養(yǎng)、監(jiān)管審批、園區(qū)建設(shè)、數(shù)據(jù)管理多角度予以扶持,推動AI制藥實(shí)現(xiàn)我國的創(chuàng)新藥研發(fā)“革命”,最后讓我們期待人工智能技術(shù)的“第四次科技革命”。