為世界第一大癌癥高效研發(fā)首創(chuàng)新藥,AI大模型助力藥物研發(fā)叩開未來之門
此前,三位高中生引爆了醫(yī)藥圈,他們使用人工智能(AI)引擎進行靶點發(fā)現(xiàn),確定了多形性膠質母細胞瘤(GBM)的新治療靶點,多形性膠質母細胞瘤(GBM)是最具侵襲性和最常見的惡性腦腫瘤類型,占所有原發(fā)性腦腫瘤的16%。他們合作撰寫的論文于4月26日發(fā)表在國際科學期刊《衰老》(aging)上,顯示了人工智能系統(tǒng)輔助新藥研發(fā)的廣闊前景。
人工智能技術正在從成本、效率等方面重塑制藥行業(yè)。近年來,相關專家認為,AI 制藥將成國內(nèi)醫(yī)藥產(chǎn)業(yè)彎道超車機遇,應以 AI 制藥為切入點,對這一新興領域加強前瞻性政策扶持,推動整個中國創(chuàng)新藥行業(yè)的原始、自主創(chuàng)新,或許在制藥領域,真正走向中國“智”造就在于人工智能技術的成熟應用。

目前在制藥領域,AI 制藥主要由三大類公司進行相互協(xié)作共同推進藥品研發(fā)進程,IT 技術公司、藥物研發(fā) CRO 公司以及大型藥企。IT 公司利用自身的互聯(lián)網(wǎng)基礎與平臺優(yōu)勢賦能行業(yè)應用,大型藥企則擁有藥物研發(fā)的相關數(shù)據(jù)、成熟的研發(fā)管線以及資深的藥物專家,在優(yōu)勢互補的情況下,目前已經(jīng)可以看到AI制藥的很多成熟案例。


我國 AI 制藥起步較歐美起步稍晚,但發(fā)展迅速,更具數(shù)據(jù)、算法等優(yōu)勢,在前段時間結束的百度飛槳中國行·上海站活動中,杭州立德百克生物醫(yī)藥總經(jīng)理王紫壹博士講述了他如何針對乳腺癌開展 CDK4/6 抑制劑的 AI 制藥之路。
根據(jù)世衛(wèi)組織發(fā)布的數(shù)據(jù),早在2020年,乳腺癌就在全球新發(fā)病例上超過肺癌,成為世界第一大癌癥。我國則是全球乳腺癌發(fā)病人數(shù)最多的國家,每年新發(fā)病例數(shù)接近42萬。
而 CDK4/6 抑制劑是目前全球范圍內(nèi)治療乳腺癌最為暢銷的藥物,用于治療HR陽性/HER2陰性的乳腺癌患者。比如,恒瑞醫(yī)藥的達爾西利、美國輝瑞的哌柏西利和美國禮來的阿貝西利等三款藥已在中國獲批上市,其中阿貝西利還進入了國家醫(yī)保目錄。
但 CDK4/6 抑制劑在給廣大患者帶來福音的同時,也存在著“瑕疵”,比如難以避免的產(chǎn)生了不同程度的耐藥性以及臨床副作用,而且同質化競爭異常激烈。這就要求獨辟蹊徑,開發(fā)全新機制的 CDK4/6 抑制劑乳腺癌藥物。

對此,王紫壹團隊提出利用 CDK4/6 的激酶活性必須依賴于自身同 CCND(細胞周期素D)形成復合物這一關鍵特性,開發(fā)出能阻斷 CDK4/6-CCND 蛋白-蛋白相互作用的小分子化合物,同樣能夠使 CDK4/6 激酶失去活性,進而達到抑制乳腺癌細胞生長的目的。
新藥研發(fā)思路確定后,一個老大難問題再次浮現(xiàn),即需要找到對應的目標分子。這一過程的快慢,在過去只能取決于運氣。而王紫壹團隊拒絕墨守成規(guī),選擇了一條新路徑,采用百度飛槳螺旋槳生物計算平臺提供的文心生物計算大模型能力來進行藥物發(fā)現(xiàn)的工作,成效令他頗為驚艷,僅僅幾個小時內(nèi),就在780萬個化合物的虛擬篩選庫中篩選出了110個打分較高的潛在候選分子。
立德百克構建了特異性的檢測方法對篩選出的化合物進行活性檢測,從110個分子中采購了40個進行濕實驗檢測,最后發(fā)現(xiàn)有6個高潛力分子,其中3個化合物能同時打斷 CDK4/6-CCND 蛋白-蛋白相互作用,還有3個化合物能打斷 CDK4-CCND 蛋白-蛋白相互作用。目前,雙方團隊正對這些化合物做更進一步的研究,有望在不久的將來將這種新型抑制劑推向臨床。
據(jù)介紹,相比于現(xiàn)有 CDK4/6 抑制劑,新型藥物屬于機制創(chuàng)新的首創(chuàng)新藥,具備更優(yōu)的特異性,并在耐藥性與潛在副作用上更有優(yōu)勢,這將為廣大乳腺癌患者帶來福音。得益于這些優(yōu)勢,新型藥物有望打開可觀的市場空間。
王紫壹博士介紹道,“百度擁有國內(nèi)領先的AI+藥物研發(fā)的技術能力,特別是文心生物計算大模型在國內(nèi)是非常領先的,運用這些技術能力,飛槳螺旋槳幫助我們更高效的找到苗頭化合物分子,這大大提升了我們藥物發(fā)現(xiàn)的效率?!?/p>
百度飛槳螺旋槳(PaddleHelix)是基于飛槳深度學習框架打造的“AI+生物”計算平臺,提供文心大模型-生物計算大模型能力,已開放多個算法模型,覆蓋小分子藥物篩選、多肽/蛋白藥物設計、mRNA 疫苗/藥物設計等技術,面向新藥研發(fā)、疫苗設計、精準醫(yī)療等場景,為生物醫(yī)藥領域的創(chuàng)新藥企、醫(yī)藥技術提供商、科研機構、生物科技公司等提供全面的算法工具和技術方案。

目前在華東區(qū)域,已有不少企業(yè)采用飛槳螺旋槳平臺開展了相關藥品研發(fā)。除杭州立德百克聯(lián)合百度飛槳螺旋槳開發(fā)乳腺癌創(chuàng)新藥之外,索智生物也在多個領域與飛槳螺旋槳合作,其中 ADMET 性質預測大模型 HelixADMET,已經(jīng)整合到索智自身的AI藥物發(fā)現(xiàn)平臺(AIxMol?),并成功應用于其在研管線項目,有效地幫助索智提升合成測試濕實驗成功率,進而提高整體研發(fā)效率,在短短的18個月中成功確定了3個 PCC 分子。
數(shù)據(jù)顯示,40-45%臨床試驗的失敗歸結于藥物的高毒性和低類藥性。如果能夠在藥物研發(fā)的早期就排除性質不佳的分子,就可以省下大量的時間和資金投入。因此,化合物的成藥性預測(簡稱ADMET)對新藥研發(fā)的成功至關重要。ADMET 是藥物代謝動力學所關注的化合物在體內(nèi)的吸收、分布、代謝和排泄行為 (簡稱ADME) 與毒性 (Toxicity) 的合稱,是衡量化合物成藥性最重要的參考指標。
針對該問題,業(yè)界已經(jīng)提出了很多解決方案,比如 admetSAR、ADMETlab、swissADME 等,但這些方法訓練所使用的數(shù)據(jù)集量級普遍較小,故在對未知骨架結構的化合物進行性質預測時效果較差,同時無法基于用戶需求做指標拓展。未知骨架結構的化合物進行性質預測泛化能力較差,藥物設計成本較高,可拓展性存在一定阻力。
而飛槳螺旋槳的 HelixADMET 大模型可在60秒內(nèi)計算1000個分子的 ADMET 相關指標。對比國內(nèi)外多個知名的 ADMET 預測軟件,在功能的完整度(預測52項指標)和指標上的精度上(超過其他對比平臺4個百分點以上),都大大超過競品。相應的研究已被收錄在生物信息學領域的頂級期刊 Bioinformatics 上。
可以預見,在生物制藥領域,HelixADMET 大模型可以應用于化合物優(yōu)化/篩選階段,輔助決策優(yōu)先進入臨床的化合物,規(guī)避后期的可能風險;還能指導學術/項目的研究計劃制定,減少盲目實驗的概率;同時模型可以用于驗證新藥/仿制藥的成藥性,評估新藥/仿制藥的風險,大大提高藥效研究的效率,更快地評估和驗證新藥/仿制藥的效果。
此外,在5月2日,國際頂級學術期刊《Nature》正刊發(fā)表了百度與合作單位在生物計算領域的突破性成果 ——《Algorithm for Optimized mRNA Design Improves Stability and Immunogenicity》,提出 mRNA 序列優(yōu)化算法 LinearDesign,百度赫然以第一完成單位署名該研究。以新冠病毒Spike蛋白為例,該算法能在短短11分鐘之內(nèi)找到最穩(wěn)定的 mRNA 候選序列。
實驗數(shù)據(jù)證明,LinearDesign 算法設計序列將有助于生物醫(yī)藥公司快速研發(fā)更有效的 mRNA 疫苗,縮短研發(fā)周期,降低研發(fā)成本。這一算法的有效性已經(jīng)在新冠 mRNA 疫苗和帶狀皰疹 mRNA 疫苗兩種疫苗中得到驗證。與傳統(tǒng)基準相比,百度的設計顯著改善了體外 mRNA 半衰期和蛋白質表達,使體內(nèi)抗體反應增強了高達128倍。
結語
人工智能最廣泛應用領域或在藥物研究,一項新藥物的研發(fā),研究人員常需要通過設計、合成和評估多種化合物來創(chuàng)造潛在新型藥物,將具有發(fā)展前景的化合物精制為候選藥物的過程常常既昂貴又耗時。假如將人工智能與藥物研究相結合,不僅投入資本將大大減少,效率也會大幅度提高。
但是,就目前而言,我們?nèi)匀幻媾R發(fā)展中的瓶頸,AI 制藥未來是否能夠快速發(fā)展應從體制上全面激發(fā)我國 AI 制藥產(chǎn)業(yè)活力,在人才培養(yǎng)、監(jiān)管審批、園區(qū)建設、數(shù)據(jù)管理多角度予以扶持,推動 AI 制藥實現(xiàn)我國的創(chuàng)新藥研發(fā)“革命”,最后讓我們期待人工智能技術的“第四次科技革命”。
文章轉載自公眾號【生物谷】