AI正在構(gòu)想“前所未有”的藥物 | 水木視界iss.42


Copyright@Will Douglas Heaven, MIT Tech Review
82歲的Paul患有一種侵襲性的血液癌癥,經(jīng)過六次化療仍無法消除。在每一輪長而不愉快的治療中,他的醫(yī)生都按照常規(guī)的癌癥藥物清單逐個(gè)嘗試,希望能夠找到有效的藥物,并在確認(rèn)無效后將清單上的藥物逐一劃掉。事實(shí)是,常規(guī)的殺癌藥物并沒有起到作用。
絕望之下,Paul的醫(yī)生讓他參加了由奧地利維也納醫(yī)科大學(xué)設(shè)立的一項(xiàng)試驗(yàn)。該大學(xué)正在測試一種新的患者匹配技術(shù):該技術(shù)由英國公司Exscientia開發(fā),在考慮到人與人之間的微妙生物學(xué)差異的基礎(chǔ)上,能夠?qū)€(gè)體患者與他們需要的精確藥物配對。
研究人員從Paul的組織中取了一個(gè)小樣本,并將這個(gè)包括正常細(xì)胞和癌細(xì)胞的樣本分成100多個(gè)部分,進(jìn)而將它們暴露于各種藥物的混合物中。然后,使用AI和計(jì)算機(jī)視覺識(shí)別技術(shù),觀察會(huì)發(fā)生什么。
實(shí)際上,研究人員所做的事情和醫(yī)生相似:嘗試不同的藥物來看看哪種有效。但是,他們并沒有讓患者接受多個(gè)長達(dá)數(shù)月的化療療程,而是用生物樣本對數(shù)十種治療方法進(jìn)行同時(shí)測試。
這種方法使研究團(tuán)隊(duì)能夠進(jìn)行詳盡的藥物搜尋。有些藥物沒有殺死Paul的癌細(xì)胞,而其他的藥物傷害了他的健康細(xì)胞。Paul太虛弱了,無法服用在匹配過程中排名第一的藥物。因此,他服用了匹配過程中排名第二的一種由制藥巨頭強(qiáng)生公司推出的癌癥藥物:令人意外的是,在以前的試驗(yàn)中,這種藥物并不能治療他的癌癥類型。
這種方法對于癌癥的治療來說是一個(gè)巨大的改變,Exscientia的首席執(zhí)行官Andrew·Hopkins表示:“我們在臨床上測試藥物的技術(shù)確實(shí)可以進(jìn)行轉(zhuǎn)化,并在將來服務(wù)真正的患者?!?/p>
選對藥物只是Exscientia想要解決的問題之一。該公司旨在徹底改造整個(gè)藥物開發(fā)流程。除了將患者與現(xiàn)有藥物配對外,Exscientia還使用機(jī)器學(xué)習(xí)技術(shù)設(shè)計(jì)新藥物。這反過來又可能產(chǎn)生更多的選項(xiàng),從而在尋找匹配時(shí)進(jìn)行篩選。
首批借助AI設(shè)計(jì)的藥物正在對人類志愿者進(jìn)行臨床試驗(yàn),以確定一種治療方法是否安全有效,然后監(jiān)管機(jī)構(gòu)才能夠批準(zhǔn)其廣泛使用。自2021年以來,Exscientia開發(fā)的兩種藥物(或與其他制藥公司合作開發(fā))已開始這一過程。該公司正在向監(jiān)管機(jī)構(gòu)遞交另外兩種藥物。Hopkins說:“如果使用傳統(tǒng)的制藥方法,我們的科研進(jìn)展將不會(huì)這么迅速?!?/strong>
Exscientia并非獨(dú)此一家。現(xiàn)在已有數(shù)百家初創(chuàng)公司在探索在制藥業(yè)中使用機(jī)器學(xué)習(xí)的方法,Air Street Capital的Nathan Benaich說:“這些早期的研究成果足以吸引大筆資金。”
如今,開發(fā)一種新藥物平均需要10余年和數(shù)十億美元。不過,如果能夠使用AI加速研發(fā)速度并降低藥物發(fā)現(xiàn)的成本,即通過預(yù)測潛在藥物在體內(nèi)的行為并通過計(jì)算的方式舍棄不理想的化合物,機(jī)器學(xué)習(xí)模型將可以大幅減少艱苦的實(shí)驗(yàn)室工作需求。一家位于加利福尼亞的制藥公司Verseon的CEO Adityo Prakash表示,總會(huì)需要新藥物:“仍然有太多我們無法治療或只能用長達(dá)三英里的副作用清單來治療的疾病?!?/strong>
現(xiàn)在,世界各地正在建造新實(shí)驗(yàn)室。去年,Exscientia在維也納開設(shè)了一個(gè)新的研究中心;在2月,總部位于香港的藥物發(fā)現(xiàn)公司Insilico Medicine在阿布扎比開設(shè)了一個(gè)大型新實(shí)驗(yàn)室??偣?,約有二十余個(gè)(甚至更多)借助AI開發(fā)的藥物正在進(jìn)入臨床試驗(yàn)。
Absci的創(chuàng)始人兼CEO Sean McClain解釋說:“隨著AI技術(shù)在制藥業(yè)中的應(yīng)用,我們獲得了源源不斷的化學(xué)和生物數(shù)據(jù),從而能夠訓(xùn)練更好的機(jī)器學(xué)習(xí)模型。”總部位于華盛頓州溫哥華的Absci使用AI技術(shù)對數(shù)十億個(gè)潛在的藥物設(shè)計(jì)進(jìn)行搜索。McClain認(rèn)為,“在未來五年中,我們將看到這個(gè)行業(yè)的巨大變革?!?/strong>
然而,AI藥物研發(fā)仍處于早期階段。Prakash表示,有很多AI公司的研究成果并不能被證明:“如果有人聲稱他們可以完美預(yù)測哪種藥物分子能夠通過腸道或不被肝臟分解的話,他們可能也會(huì)嘗試賣給你火星上的土地?!?strong>此外,該技術(shù)并非萬能良藥:在實(shí)驗(yàn)室中進(jìn)行的細(xì)胞和組織實(shí)驗(yàn)以及在人類身上進(jìn)行的測試是開發(fā)過程中最耗時(shí)、最昂貴的部分,無法完全被省略。Luisa Salter-Cid是位于馬薩諸塞州劍橋市的初創(chuàng)企業(yè)孵化器Flagship Pioneering的創(chuàng)新藥物部門的首席科學(xué)官,她說:“AI已經(jīng)幫我們節(jié)省了很多時(shí)間。它已經(jīng)完成了我們以前需要手工完成的許多步驟。但最終的驗(yàn)證還是需要在實(shí)驗(yàn)室中完成?!?盡管如此,AI已經(jīng)改變了藥物的制造方式。可能還需要幾年時(shí)間,才能看到第一批在AI的幫助下設(shè)計(jì)的藥物進(jìn)入市場,但從AI設(shè)計(jì)藥物的早期階段到最終獲批的過程中,該技術(shù)已經(jīng)引起了藥品行業(yè)的巨大變革。
從頭開始研發(fā)新藥的基本步驟并沒有改變多少:首先,選擇身體中與藥物相互作用的目標(biāo),比如蛋白質(zhì)。然后,設(shè)計(jì)一種分子,使其對靶點(diǎn)產(chǎn)生作用,比如改變其工作方式或關(guān)閉它。接下來,需要在實(shí)驗(yàn)室中制造該分子,并檢查它是否確實(shí)能夠完成預(yù)期的任務(wù)(而且沒有其他副作用)。最后,在人體中進(jìn)行測試,以確定它既安全又有效。
幾十年來,化學(xué)家們在對靶點(diǎn)樣品添加不同的分子,并觀察反應(yīng)來篩選候選藥物。然后,他們反復(fù)進(jìn)行此過程,例如調(diào)整候選藥物分子的結(jié)構(gòu)——替換這個(gè)原子,那個(gè)原子等等。AI加快了速度,但試錯(cuò)的核心過程是不可避免的。
但試管并不是身體。許多看起來在實(shí)驗(yàn)室中有效的藥物分子最終在人體測試中失敗了。“現(xiàn)有的整個(gè)藥物發(fā)現(xiàn)的過程都是失敗的,”Exscientia首席商務(wù)官、生物學(xué)家Richard Law說。“藥物研發(fā)成本如此之高的原因在于,你需要設(shè)計(jì)和測試20多種藥物之后,才能得到一個(gè)有效的。”
新型人工智能制藥公司專注于藥物開發(fā)流程中的三個(gè)關(guān)鍵失敗點(diǎn):選擇正確的靶點(diǎn)、設(shè)計(jì)與之相互作用的正確分子,以及確定哪些患者最有可能從這種分子中獲益。
在數(shù)十年間,計(jì)算技術(shù)如分子建模等正不斷地改變著藥物開發(fā)流程。但即使是最強(qiáng)大的方法,也涉及到手工建模的過程:這是一種緩慢、困難且容易產(chǎn)生與現(xiàn)實(shí)世界條件不符的模擬過程。通過機(jī)器學(xué)習(xí),包括藥物和分子數(shù)據(jù)在內(nèi)的大量數(shù)據(jù)可以被利用來自動(dòng)構(gòu)建復(fù)雜模型。這使得預(yù)測藥物在體內(nèi)的行為變得更加容易和快捷,從而可以在計(jì)算機(jī)模擬中進(jìn)行許多早期實(shí)驗(yàn)。機(jī)器學(xué)習(xí)模型還可以以前所未有的方式篩選潛在藥物分子的巨大未開發(fā)資源。其結(jié)果是實(shí)驗(yàn)室(以及后來的臨床試驗(yàn))中必須進(jìn)行的艱苦但必要的工作只需要在最有成功機(jī)會(huì)的分子上進(jìn)行。
許多公司在模擬藥物行為之前甚至將機(jī)器學(xué)習(xí)應(yīng)用于識(shí)別靶點(diǎn)的問題上。Exscientia和其他公司使用自然語言處理技術(shù),從數(shù)十年來的大量科學(xué)報(bào)告檔案中挖掘數(shù)據(jù),包括數(shù)十萬個(gè)發(fā)表的基因序列和數(shù)百萬篇學(xué)術(shù)論文。從這些文件中提取的信息被編碼成知識(shí)圖,這是一種組織數(shù)據(jù)的方式,可以捕捉諸如“A導(dǎo)致B”等因果關(guān)系的鏈接。然后,機(jī)器學(xué)習(xí)模型可以預(yù)測哪些靶點(diǎn)可能是在治療特定疾病時(shí)最有前途的。
雖然將自然語言處理應(yīng)用于數(shù)據(jù)挖掘并不新鮮,但制藥公司,包括大型制藥公司,現(xiàn)在正在將其作為其制藥過程的關(guān)鍵部分,并希望它能幫助他們找到人類科學(xué)家們可能忽略的潛在藥靶聯(lián)系。
AstraZeneca的數(shù)據(jù)科學(xué)和人工智能副總裁Jim Weatherall表示,讓人工智能爬取大量生物醫(yī)學(xué)數(shù)據(jù)幫助他和他的團(tuán)隊(duì)找到了一些他們本來不會(huì)考慮的藥物靶點(diǎn)。“這真的很有幫助,沒有人會(huì)讀幾百萬篇生物學(xué)論文,我們的生物學(xué)家會(huì)去查看AI給出的建議,并確定其是否有意義。”Weatherall說,這種技術(shù)揭示了看似無關(guān)的事物之間的聯(lián)系,例如最近的發(fā)現(xiàn)和10年前被遺忘的結(jié)果。然而,這種靶點(diǎn)識(shí)別技術(shù)仍處于早期階段。他說,要等“幾年”才能將其結(jié)果轉(zhuǎn)化為AstraZeneca的藥物,并要更久才能進(jìn)入臨床試驗(yàn)階段。
但選擇靶點(diǎn)只是開始。更大的挑戰(zhàn)是設(shè)計(jì)一種藥物分子來與之產(chǎn)生作用——這正是大多數(shù)創(chuàng)新藥努力的方向。人體內(nèi)分子之間的相互作用非常復(fù)雜。許多藥物必須通過敵對的環(huán)境,如腸道,才能發(fā)揮作用。而且一切都受到在原子尺度上運(yùn)行的物理和化學(xué)法則的支配。大多數(shù)基于人工智能的藥物設(shè)計(jì)方法的目的是在廣闊的可能性中探索,并迅速鎖定盡可能多的新分子。總部位于馬薩諸塞州劍橋市的創(chuàng)業(yè)公司Generate Biomedicines由Flagship Pioneering創(chuàng)立,旨在使用與文本到圖像軟件DALL-E相同類型的生成式人工智能。不過,Generate Biomedicine的軟件并非操縱像素這么簡單,而是使用隨機(jī)的氨基酸鏈,并找到將它們扭曲成具有特定屬性的蛋白質(zhì)結(jié)構(gòu)的方法。由于蛋白質(zhì)的功能是由其三維折疊結(jié)構(gòu)所決定的,這實(shí)際上使得有可能設(shè)計(jì)出一個(gè)能夠執(zhí)行特定工作的蛋白質(zhì)。?(包括華盛頓大學(xué)David Baker實(shí)驗(yàn)室在內(nèi)的其他團(tuán)隊(duì)正在開發(fā)類似的技術(shù)。)
Absci也在嘗試使用機(jī)器學(xué)習(xí)創(chuàng)建新的基于蛋白質(zhì)的藥物,但是采用了不同的方法。該公司利用模型,使用實(shí)驗(yàn)室實(shí)驗(yàn)數(shù)據(jù)進(jìn)行訓(xùn)練,以改造現(xiàn)有的抗體,即免疫系統(tǒng)用來清除細(xì)菌、病毒和其他不需要的攻擊者的蛋白質(zhì),以產(chǎn)生許多新設(shè)計(jì),以改善這些抗體與外來物質(zhì)結(jié)合的部分。其想法是重新設(shè)計(jì)現(xiàn)有抗體,使其更好地結(jié)合目標(biāo)。在模擬中進(jìn)行調(diào)整后,研究人員會(huì)合成并測試效果最佳的設(shè)計(jì)。
今年1月,Absci與默克等大型制藥公司合作,宣布利用其方法重新設(shè)計(jì)了多種現(xiàn)有抗體,包括針對SARS-CoV-2病毒尖刺蛋白的抗體和阻止癌細(xì)胞生長的一種蛋白質(zhì)的抗體。
Apriori Bio是Flagship Pioneering位于劍橋的另一家創(chuàng)業(yè)公司,也關(guān)注Covid-19:他們特別希望能夠開發(fā)出保護(hù)人們免受各種病毒變體侵害的疫苗。該公司在實(shí)驗(yàn)室中構(gòu)建了數(shù)百萬種新冠變體,并使用機(jī)器學(xué)習(xí)技術(shù)測試了它們與抗體互相作用的效果,進(jìn)而預(yù)測出最佳抗體的效果如何:這些抗體可以抵抗1000億億(10的20次方)種變體。他們的目標(biāo)是使用最有前途的抗體(即似乎能夠應(yīng)對大范圍的變體或可能處理特定變體),并使用它們設(shè)計(jì)抗變異的疫苗。
“在之前,這種實(shí)驗(yàn)是不可能的,”Flagship Pioneering合伙人、Apriori Bio首席執(zhí)行官Lovisa Afzelius表示。“僅憑人腦,不可能把所有那些零碎的東西都放在一起,理解整個(gè)系統(tǒng)。”
對于Prakash來說,人工智能的真正潛力在于開發(fā)出一種巨大而未被開發(fā)的生物和化學(xué)結(jié)構(gòu),這些結(jié)構(gòu)可以成為未來藥物的成分。Prakash說,一旦你剔除非常相似的分子,所有大型制藥公司——如默克,諾華,阿斯利康等——的成分清單最多只有1000萬種分子可以用于制藥,其中一些是專有的,一些是公共的?!斑@是我們正在全球范圍內(nèi)測試的——化學(xué)家在過去一百年的勞動(dòng)成果的總產(chǎn)品,”他說。然而,根據(jù)有機(jī)化學(xué)規(guī)則,可能用于制藥的分子數(shù)量是10的33次方(其他估計(jì)將藥物類似分子的數(shù)量甚至高達(dá)10的60次方)。“將這個(gè)數(shù)字與1000萬相比較,您會(huì)發(fā)現(xiàn)我們甚至沒有在海洋旁邊的沙灘積水中釣魚,”Prakash說。“我們只是在一滴水中垂釣。”?像其他公司一樣,Prakash的公司Verseon使用舊的和新的計(jì)算技術(shù)來調(diào)查這個(gè)海洋,產(chǎn)生數(shù)百萬個(gè)可能的分子并測試它們的性質(zhì)。Verseon將藥物與體內(nèi)蛋白質(zhì)之間的相互作用視為物理問題,模擬原子之間的推拉,這影響分子如何相互適配。這種分子模擬并不新鮮,但Verseon使用人工智能來更準(zhǔn)確地模擬分子之間的相互作用。到目前為止,該公司已經(jīng)為一系列疾病,包括心血管疾病,傳染病和癌癥,生產(chǎn)出了16種候選藥物。其中一種藥物正在臨床試驗(yàn)中,而另外幾種藥物的試驗(yàn)也將很快開始。
關(guān)鍵是,模擬使研究人員能夠越過通常特征化藥物設(shè)計(jì)過程的混亂。公司傳統(tǒng)上會(huì)創(chuàng)建一批希望具有某些特性的分子,然后依次測試每個(gè)分子。通過機(jī)器學(xué)習(xí),他們列舉一些具有基本特性的分子愿望清單,并在按下按鈕時(shí)生成具有這些特性的分子設(shè)計(jì)。Salter-Cid說,這顛覆了開發(fā)的早期階段:“這不是我們過去能夠做到的事情?!?strong>在開發(fā)新藥物時(shí),公司通常會(huì)在五年內(nèi)制造2,500到5,000種化合物。而Exscientia僅在一年內(nèi)就為其一種新的癌癥藥物生產(chǎn)了136種分子。
Weatherall表示:“這是關(guān)于加快探索周期的,我們現(xiàn)在可以在不必真正制造分子的情況下做出更多決策?!?然而,無論如何制造,藥物仍然必須在人體中進(jìn)行測試。這些藥物開發(fā)的最后階段需要招募大量志愿者,難以運(yùn)作,通常需要很長時(shí)間,平均約需10年,有時(shí)甚至需要20年。許多藥物花費(fèi)多年才能達(dá)到這個(gè)階段,但到最后仍然面臨失敗。
AI無法加速臨床試驗(yàn)過程,但可以幫助制藥公司降低尋找新藥候選的時(shí)間和成本,以更有利的方式加快藥物候選者的進(jìn)展。在實(shí)驗(yàn)室中測試走入死胡同的藥物分子所需的時(shí)間較短,這意味著有前途的候選者將更快地進(jìn)入臨床試驗(yàn)。而且由于資金投入較少,公司并不會(huì)感到壓力,也不會(huì)堅(jiān)持使用效果不佳的藥物。
更好地針對患者也有助于改進(jìn)這個(gè)過程。大多數(shù)臨床試驗(yàn)衡量的是藥物的平均效果,統(tǒng)計(jì)出多少人從中受益,多少人沒有受益。如果足夠多的人在試驗(yàn)中看到病情有所改善,那么藥物就被認(rèn)為是成功的。如果藥物的效果不夠好,那么它就是失敗的。但這可能意味著忽略了藥物對一小部分人有效的情況。Weatherall表示:“這是一個(gè)非常粗糙的方法。我們實(shí)際上想做的是找到最大受益于藥物的患者子集?!?/strong>這就是Exscientia的匹配技術(shù)發(fā)揮作用的地方。“如果我們能夠選擇正確的患者,它確實(shí)會(huì)從根本上改變制藥行業(yè)的經(jīng)濟(jì)模式?!?/strong>Hopkins補(bǔ)充道。這也將大大改善像Paul這樣對常見藥物沒有反應(yīng)的患者的生活。對此結(jié)論,Laws表示:“患者可能會(huì)經(jīng)歷可怕的經(jīng)歷,不斷地進(jìn)出醫(yī)院,有時(shí)持續(xù)數(shù)年,接受無效的藥物治療,直到要么沒有藥物了,要么最終找到了對他們有效的藥物?!?/strong>?在 Exscientia 找到適合Paul的藥物后,該公司進(jìn)行了一項(xiàng)科學(xué)研究。它從接受過至少兩個(gè)失敗的化療療程的數(shù)十名癌癥患者中取得了組織樣本,并評(píng)估了139種現(xiàn)有藥物對它們的細(xì)胞的影響。Exscientia 能夠確定一種適用于超過一半患者的藥物?,F(xiàn)在,該公司希望利用這項(xiàng)技術(shù)來塑造其藥物開發(fā)方法,將患者數(shù)據(jù)納入流程的最早階段以訓(xùn)練更好的人工智能。Hopkins說:“我們可以從患者的組織開始,而不是從一種疾病的模型開始?;颊呤亲詈玫哪P汀!?目前,第一批由人工智能設(shè)計(jì)的藥物仍在通過臨床試驗(yàn)關(guān)卡。在它們通過并進(jìn)入市場之前,可能需要幾個(gè)月,甚至幾年。有些藥物可能不會(huì)通過審批。但即使這個(gè)初始的批次失敗了,還會(huì)有其他藥物。藥物設(shè)計(jì)已經(jīng)永遠(yuǎn)改變了。Benaich 認(rèn)為:“這些公司正在嘗試的僅僅是第一批藥物,而接下來的藥物可能會(huì)超出我們的想象?!?/strong>
水木未來丨視界iss.42
Credit@Will Douglas Heaven, MIT Tech Review
"AI is dreaming up drugs that no one has ever seen. Now we've got to see if they work."