最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

水木未來·視界iss.14丨AlphaFold和AI蛋白質(zhì)折疊革命的下一步是什么?

2022-04-14 13:13 作者:水木未來科技  | 我要投稿


十多年來,分子生物學(xué)家Martin Beck和他的同事一直在努力拼湊世界上最難的拼圖之一:人類細(xì)胞中最大的分子機器的詳細(xì)模型。

這個龐然大物被稱為核孔復(fù)合體,控制著分子進(jìn)出細(xì)胞核的流動,而基因組就在細(xì)胞核中。每個細(xì)胞中都存在數(shù)百個這樣的復(fù)合體。每一個復(fù)合體都由1000多個蛋白質(zhì)組成,它們共同形成環(huán)狀,圍繞著穿過核膜的一個洞。

這1000塊拼圖來自于30多個蛋白質(zhì)構(gòu)件,它們以無數(shù)種方式交錯排列。讓這塊拼圖更難完成的是,實驗確定的這些構(gòu)件的三維形狀是來自許多物種的結(jié)構(gòu)的大雜燴,所以并不總是能很好地拼在一起。而且,拼圖盒上的終極目標(biāo),即核孔復(fù)合體的三維視圖,缺乏足夠的細(xì)節(jié),我們無法知道其中究竟有多少塊拼圖能精確地拼在一起。

2016年,位于德國法蘭克福的馬克斯·普朗克生物物理研究所(MPIB)的Beck團(tuán)隊報告了一個模型,該模型涵蓋了核孔復(fù)合體的約30%,和30個功能模塊的約一半,稱為Nup蛋白。

自2021年7月發(fā)布AlphaFold2人工智能軟件的源代碼以來,引用該軟件的研究論文和預(yù)印本的數(shù)量激增。

在2021年7月,總部位于倫敦的DeepMind公司(隸屬于谷歌母公司Alphabet)公開了一個名為AlphaFold2的人工智能(AI)工具。該軟件可以從蛋白質(zhì)的基因序列中預(yù)測其三維結(jié)構(gòu),其結(jié)果在大多數(shù)情況下都是精確的。這一技術(shù)直接改變了Beck及其他成千上萬的生物學(xué)家的研究。

Beck說:"AlphaFold改變了整個行業(yè),就像一場地震,關(guān)于它的新聞簡直無處不在"?來自耶路撒冷希伯來大學(xué)的計算結(jié)構(gòu)生物學(xué)家Ora Schueler-Furman說,他正在使用AlphaFold為蛋白質(zhì)相互作用建模。"有七月之前和之后"。

通過使用AlphaFold,Beck和MPIB的其他科學(xué)家:分子生物學(xué)家Agnieszka Obarska-Kosinska和生物化學(xué)家Gerhard Hummer,以及歐洲分子生物學(xué)實驗室(EMBL)的結(jié)構(gòu)建模師Jan Kosinski領(lǐng)導(dǎo)的研究小組可以更準(zhǔn)確地預(yù)測人類版本Nup蛋白的三維結(jié)構(gòu)。他們在去年10月成功地發(fā)表了一個模型,該模型涵蓋了該復(fù)合物的60%。揭示了復(fù)合物是如何穩(wěn)定細(xì)胞核中的孔的,同時也闡釋了復(fù)合物以何種方式控制物質(zhì)的進(jìn)入和離開。

在過去的半年里,AlphaFold的狂熱已經(jīng)籠罩了整個生命科學(xué)界。"倫敦大學(xué)學(xué)院的計算生物學(xué)家Christine Orengo說:"我參加的每個會議,人們都在說'為什么不使用AlphaFold?"

在某些情況下,人工智能為科學(xué)家們節(jié)省了時間;在其他情況下,它使以前無法想象或極不現(xiàn)實的研究成為可能。盡管它有局限性,一些科學(xué)家發(fā)現(xiàn)它的預(yù)測對他們的工作來說太不可靠。但是,它的崛起和實驗的進(jìn)展已不可阻擋。

甚至那些開發(fā)該軟件的人也在努力跟上它在從藥物發(fā)現(xiàn)和蛋白質(zhì)設(shè)計到復(fù)雜生命起源等領(lǐng)域的應(yīng)用。DeepMind的AlphaFold團(tuán)隊負(fù)責(zé)人John Jumper說:"我一覺醒來就在Twitter上輸入AlphaFold,當(dāng)我看到撲面而來的那些溢美之詞,這感覺太棒了!"


AlphaFold的驚人成功


AlphaFold在2020年12月引起了轟動,當(dāng)時它在一個名為 "蛋白質(zhì)結(jié)構(gòu)預(yù)測關(guān)鍵評估"(CASP)的競賽中亮相,并占了上風(fēng)。該競賽每兩年舉行一次,內(nèi)容為生物學(xué)最偉大的挑戰(zhàn)之一:僅從氨基酸序列確定蛋白質(zhì)的三維形狀。這些參賽的計算機軟件與X射線晶體學(xué)或冷凍電鏡(cryo-EM)等實驗方法同臺競技,對已確定的相同蛋白質(zhì)結(jié)構(gòu)進(jìn)行預(yù)測,以建立其三維結(jié)構(gòu)圖。

2020年版本的AlphaFold是該軟件的第二版。Jumper說,它還贏得了2018年的CASP,但其早期的表現(xiàn)大多不夠好,其結(jié)果無法匹配實驗所確定的結(jié)構(gòu)。然而,AlphaFold2現(xiàn)在的預(yù)測結(jié)果已與大部分的實驗數(shù)據(jù)持平。

目前還不清楚DeepMind何時會廣泛提供該軟件或其預(yù)測結(jié)果,因此研究人員利用Jumper公開演講中的信息以及他們自己的見解,開發(fā)了自己的人工智能工具,稱為RoseTTAFold。

在2021年7月15日,描述RoseTTAFold和AlphaFold2的論文出現(xiàn)了,并免費提供了開源代碼和運行所需的其他信息。一周后,DeepMind宣布它已經(jīng)用AlphaFold預(yù)測了人類的幾乎所有蛋白質(zhì)的結(jié)構(gòu),以及其他20種被廣泛研究的生物體的整個 "蛋白質(zhì)組",如小鼠和大腸桿菌??偣灿谐^365,000個結(jié)構(gòu)。DeepMind還將這些數(shù)據(jù)公開發(fā)布到歐洲生物信息學(xué)研究所(EMBL-EBI)維護(hù)的數(shù)據(jù)庫中。這個數(shù)據(jù)庫后來已經(jīng)擴展到了近一百萬個結(jié)構(gòu)。

AlphaFold的預(yù)測大大增加了人類蛋白質(zhì)組,即所有人類蛋白質(zhì)的集合中可靠的已知結(jié)構(gòu)的比例。該軟件對其他物種甚至更加有用

今年,DeepMind計劃發(fā)布總數(shù)超過1億的結(jié)構(gòu)預(yù)測。這幾乎是所有已知蛋白質(zhì)的一半數(shù)量:比蛋白質(zhì)數(shù)據(jù)庫(PDB)結(jié)構(gòu)庫中實驗確定的蛋白質(zhì)數(shù)量多出數(shù)百倍。

AlphaFold部署了深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò):計算架構(gòu)的靈感來自于大腦的神經(jīng)線路,以辨別數(shù)據(jù)的種類。它已經(jīng)在PDB和其他數(shù)據(jù)庫中的數(shù)十萬個實驗確定的蛋白質(zhì)結(jié)構(gòu)和序列上進(jìn)行了訓(xùn)練。面對一個新的序列,它首先尋找數(shù)據(jù)庫中的相關(guān)序列,這可以識別傾向于一起進(jìn)化的氨基酸,表明它們在三維空間中很接近?,F(xiàn)有數(shù)據(jù)庫中相關(guān)蛋白質(zhì)的結(jié)構(gòu)提供了另一種方法來預(yù)測新序列中氨基酸對之間的距離。

AlphaFold在試圖對氨基酸的三維結(jié)構(gòu)進(jìn)行建模時,從不同的計算渠道間來回迭代線索,以不斷地更新優(yōu)化其預(yù)測。專家們說,該軟件對機器學(xué)習(xí)研究的良好應(yīng)用似乎是AlphaFold如此出色的原因,特別是它使用了一種被稱為?"Attention"的人工智能機制來確定哪些氨基酸是其工作的重點目標(biāo)。

對相關(guān)蛋白質(zhì)序列信息的嚴(yán)重依賴也意味著AlphaFold有一些缺陷。它無法預(yù)測突變所帶來的影響,例如那些在蛋白質(zhì)結(jié)構(gòu)上導(dǎo)致疾病的突變。它也無法確定蛋白質(zhì)在存在其他相互作用的蛋白質(zhì)或分子(如藥物)的情況下如何改變結(jié)構(gòu)。但是它擁有一個模型打分機制,可以用來衡量在預(yù)測蛋白質(zhì)的每個氨基酸單元時的可靠程度。同時,研究人員正在調(diào)整AlphaFold的代碼以增強其能力。

據(jù)DeepMind稱,到目前為止,已經(jīng)有40多萬人使用了EMBL-EBI的AlphaFold數(shù)據(jù)庫。還有一些AlphaFold的 "超級用戶":研究人員在自己的服務(wù)器上設(shè)置了該軟件,或者轉(zhuǎn)向基于云的AlphaFold版本,以預(yù)測EMBL-EBI數(shù)據(jù)庫中沒有的結(jié)構(gòu),或者為該工具設(shè)想新的用途。


AlphaFold如何解決結(jié)構(gòu)問題


生物學(xué)家們已經(jīng)對AlphaFold解決結(jié)構(gòu)的能力留下了深刻印象。"丹麥奧胡斯大學(xué)的結(jié)構(gòu)生物學(xué)家Thomas Boesen說:"根據(jù)我目前看到的情況,我非常信任AlphaFold。該軟件已經(jīng)成功地預(yù)測了我們小組已經(jīng)確定但尚未公布的蛋白質(zhì)結(jié)構(gòu)。這對我來說是一個很大的驗證。他和奧胡斯微生物生態(tài)學(xué)家Tina ?antl-Temkiv正在使用AlphaFold對一些促進(jìn)冰的形成的細(xì)菌蛋白質(zhì)的結(jié)構(gòu)進(jìn)行建模。目前,生物學(xué)家還不能通過實驗完全確定這些結(jié)構(gòu)。

斯德哥爾摩大學(xué)的蛋白質(zhì)生物信息學(xué)家Arne Elofsson認(rèn)為,AlphaFold非常清楚什么時候它將不起作用。在這種情況下,預(yù)測的結(jié)構(gòu)可能類似于漂浮的意大利面條。這通常對應(yīng)于蛋白質(zhì)中缺乏確定形狀的區(qū)域,至少在單一蛋白的情況下是如此。這種本質(zhì)上無序的區(qū)域約占人類蛋白質(zhì)組的三分之一,可能只有在另一個分子出現(xiàn)時才會變得很明確。

AlphaFold對折疊蛋白質(zhì)結(jié)構(gòu)的預(yù)測帶有可信度打分。將每個模型疊加在實驗確定的結(jié)構(gòu)上(如果有的話),可以顯示預(yù)測的準(zhǔn)確性。

倫敦癌癥研究所的計算生物學(xué)家Norman Davey說,AlphaFold識別無序狀態(tài)的能力對他關(guān)于某些區(qū)域的作用機制研究提供了大量幫助。Norman的預(yù)測質(zhì)量立即有了巨大的提高,這簡直輕而易舉。

AlphaFold將蛋白質(zhì)結(jié)構(gòu)轉(zhuǎn)儲到EMBL-EBI數(shù)據(jù)庫中的做法也立即被投入使用。Orengo的團(tuán)隊正在搜索它,以確定新的蛋白質(zhì)種類(不需要通過實驗驗證),并且已經(jīng)發(fā)現(xiàn)了數(shù)百個,甚至數(shù)千個潛在的新蛋白質(zhì)家族,擴大了科學(xué)家對蛋白質(zhì)外觀和功能的了解。在另一項工作中,該團(tuán)隊正在搜索從海洋和廢水中獲取的DNA序列數(shù)據(jù)庫,以嘗試發(fā)現(xiàn)新的酶,用于塑料降解。研究人員利用AlphaFold快速估算出數(shù)千種蛋白質(zhì)的結(jié)構(gòu),希望能更好地了解酶是如何進(jìn)化到分解塑料的,并將在后續(xù)對這些酶進(jìn)行改良。

哈佛大學(xué)的進(jìn)化生物學(xué)家Sergey Ovchinnikov認(rèn)為,對進(jìn)化生物學(xué)的研究來說,將任何蛋白質(zhì)編碼基因序列轉(zhuǎn)化為結(jié)構(gòu)的能力是極為可貴的。研究人員通過比較基因序列來確定生物體及其基因在不同物種間的關(guān)系。對于遠(yuǎn)距離相關(guān)的基因,僅通過比較可能無法找到進(jìn)化的親屬,因為序列已經(jīng)發(fā)生了極大的變化。但是通過比較蛋白質(zhì)結(jié)構(gòu),其變化往往沒有基因序列那么快,我們也許能夠發(fā)現(xiàn)被忽視的古老關(guān)系。這為研究蛋白質(zhì)的進(jìn)化和生命的起源提供了一個驚人的機遇。

為了測試這個想法,由首爾國立大學(xué)計算生物學(xué)家Martin Steinegger領(lǐng)導(dǎo)的一個團(tuán)隊和他的同事使用他們開發(fā)的一個工具,稱為Foldseek,在EMBL-EBI的AlphaFold數(shù)據(jù)庫中尋找SARS-CoV-2(即導(dǎo)致COVID-19的病毒)的RNA復(fù)制酶的親屬。這次搜索發(fā)現(xiàn)了以前未被發(fā)現(xiàn)的可能的古代親屬:包括粘菌在內(nèi)的所有真核生物的蛋白質(zhì),這些蛋白質(zhì)在其三維結(jié)構(gòu)上類似于逆轉(zhuǎn)錄酶,艾滋病毒等病毒利用這些酶將RNA復(fù)制到DNA中,盡管在遺傳序列的維度上它們幾乎沒有相似之處。


AlphaFold對實驗的幫助


對于想要確定一個特定蛋白質(zhì)的全長結(jié)構(gòu)的科學(xué)家來說,AlphaFold預(yù)測不一定是一個直接的解決方案。相反,它提供了一個初步的近似值,并可以在之后通過實驗來驗證或完善,這個過程反過來也可以幫助科學(xué)家理解實驗數(shù)據(jù)。例如,來自X射線晶體學(xué)的原始數(shù)據(jù)以X射線衍射圖案的形式出現(xiàn)。通常情況下,科學(xué)家需要對蛋白質(zhì)的結(jié)構(gòu)有一個初步的猜測,以解釋這些圖案。英國劍橋大學(xué)的結(jié)構(gòu)生物學(xué)家Randy Read說,以前,他們經(jīng)常從PDB中的相關(guān)蛋白質(zhì)中拼湊信息,或者使用X射線晶體學(xué)及冷凍電鏡等實驗方法。不過現(xiàn)在,AlphaFold的預(yù)測已經(jīng)大幅降低了大多數(shù)X射線晶體學(xué)方法的必要性。Read的實驗室正在努力在實驗?zāi)P椭懈玫乩肁lphaFold,并完全調(diào)整了研究重點。

Read和其他研究人員已經(jīng)使用AlphaFold從數(shù)據(jù)中驗證了大量此前無法解釋的晶體結(jié)構(gòu)。Read實驗室的前博士后Claudia Millán Nebot認(rèn)為,人們正在解決那些多年來沒有被解決的結(jié)構(gòu)。她預(yù)計會有大量的新蛋白質(zhì)結(jié)構(gòu)提交給PDB,這在很大程度上是AlphaFold的結(jié)果。

專門從事冷凍電鏡的實驗室也是如此,冷凍電鏡可以捕捉到蛋白質(zhì)在冷凍狀態(tài)下的照片。北卡羅來納大學(xué)的結(jié)構(gòu)生物學(xué)家和藥理學(xué)家Bryan Roth認(rèn)為,在某些情況下,AlphaFold的模型準(zhǔn)確地預(yù)測了G蛋白偶聯(lián)受體(GPCRs)的獨特特征,而其他的計算工具則搞錯了。AlphaFold極為適合生成初始模型,并在后續(xù)的實驗中獲取數(shù)據(jù),對模型進(jìn)行完善,從而節(jié)省大量時間。

但是Roth又補充說,AlphaFold并不總是那么準(zhǔn)確。在Roth的實驗室已經(jīng)解析但尚未發(fā)表的幾十個GPCR結(jié)構(gòu)中,AlphaFold能對其中約50%結(jié)構(gòu)進(jìn)行良好預(yù)測,而剩下預(yù)測結(jié)果則沒有太多參考價值。在某些情況下,AlphaFold會對預(yù)測的結(jié)果給出極高的可信度分?jǐn)?shù),但實驗數(shù)據(jù)會顯示該結(jié)果是錯誤的。即使預(yù)測的結(jié)構(gòu)正確,AlphaFold也不能模擬一個蛋白質(zhì)與藥物或其他小分子(配體)結(jié)合時的樣子,而結(jié)合過程可能會導(dǎo)致結(jié)構(gòu)的大幅改變。這一結(jié)論使Roth懷疑AlphaFold在藥物發(fā)現(xiàn)的過程中不會起到很大作用。

在藥物發(fā)現(xiàn)研究中,科學(xué)家們越來越多地使用計算對接(docking)軟件來對數(shù)十億個小分子進(jìn)行篩選,以找到一些可能與蛋白質(zhì)結(jié)合的小分子。Roth現(xiàn)在正與加州大學(xué)舊金山分校的藥物化學(xué)家Brian Shoichet合作,已驗證AlphaFold所預(yù)測的結(jié)構(gòu)在藥物發(fā)現(xiàn)中的準(zhǔn)確性。

Shoichet說,他們的研究集中在那些AlphaFold預(yù)測數(shù)據(jù)與實驗數(shù)據(jù)相吻合的蛋白質(zhì)。但即使在這些情況下,對接軟件也會對實驗數(shù)據(jù)和AlphaFold的預(yù)測數(shù)據(jù)給出不同的藥物結(jié)果,這表明微小的差異可能很重要。然而,這并不意味著我們不會找到新的配體,我們只是會找到不同的配體。我們的團(tuán)隊現(xiàn)在正在合成那些經(jīng)過AlphaFold確定結(jié)構(gòu)的潛在藥物,并在實驗室中測試其活性。


謹(jǐn)慎的樂觀態(tài)度


制藥公司和生物技術(shù)公司的研究人員對AlphaFold在推進(jìn)藥物發(fā)現(xiàn)方面的潛力感到興奮,不過在抱有樂觀態(tài)度的同時,謹(jǐn)慎一些是必要的。?2021年11月,DeepMind推出了自己的子公司IsoMorphic Labs,旨在將AlphaFold和其他AI工具應(yīng)用于藥物發(fā)現(xiàn)。但該公司并未披露其他計劃。

Karen Akinsanya在總部位于紐約的藥物發(fā)現(xiàn)公司Schr?dinger領(lǐng)導(dǎo)藥物的開發(fā),該公司還發(fā)布了化學(xué)模擬軟件,Karen和她的同事已經(jīng)在使用包括GPCRs的AlphaFold結(jié)構(gòu)進(jìn)行虛擬篩選和候選藥物的化合物設(shè)計,并取得了一些成功。她發(fā)現(xiàn),就像實驗數(shù)據(jù)一樣,AlphaFold的預(yù)測數(shù)據(jù)需要額外的軟件,用于了解氨基酸側(cè)鏈的細(xì)節(jié)或單個氫原子可能所在的位置。一旦能做到這一點,AlphaFold所預(yù)測的結(jié)構(gòu)足以在某些情況下對藥物發(fā)現(xiàn)進(jìn)行指導(dǎo)。

Karen認(rèn)為,AlphaFold很難被稱為是萬能的,因為對一個結(jié)構(gòu)的完全解析并不意味著結(jié)構(gòu)數(shù)據(jù)能適用于所有結(jié)構(gòu)。她和她的同事們發(fā)現(xiàn),AlphaFold的準(zhǔn)確預(yù)測并不能表明一個結(jié)構(gòu)是否對以后的藥物篩選有用。因此,AlphaFold的結(jié)構(gòu)預(yù)測將永遠(yuǎn)不會完全取代藥物發(fā)現(xiàn)中的實驗數(shù)據(jù)。但它們可能會通過冷凍電鏡等方式對AlphaFold預(yù)測的結(jié)果進(jìn)行驗證,以加速藥物研發(fā)的過程。

對AlphaFold抱有興趣的的藥物開發(fā)者在2022年的1月份收到了好消息,即DeepMind解除了將AlphaFold用于商業(yè)應(yīng)用的一個關(guān)鍵限制。當(dāng)該公司在2021年7月發(fā)布AlphaFold的代碼時,它曾規(guī)定,運行AlphaFold神經(jīng)網(wǎng)絡(luò)所需的參數(shù)或權(quán)重,也就是在數(shù)十萬個蛋白質(zhì)結(jié)構(gòu)和序列上訓(xùn)練網(wǎng)絡(luò)的最終結(jié)果,只能用于非商業(yè)用途。Karen認(rèn)為,這一限制對工業(yè)界的一些人來說是一個瓶頸,當(dāng)DeepMind改變立場時,引爆了整個工業(yè)界。(RoseTTAFold也有類似的限制,但其開發(fā)者表示,下一個版本將是完全開源的)。

人工智能不僅改變了科學(xué)家確定蛋白質(zhì)結(jié)構(gòu)的方式。一些研究人員正在使用它們來制造全新的蛋白質(zhì)。西雅圖華盛頓大學(xué)的生物化學(xué)家David Baker是設(shè)計蛋白質(zhì)以及預(yù)測其結(jié)構(gòu)領(lǐng)域的領(lǐng)導(dǎo)者。他的團(tuán)隊和計算化學(xué)家Minkyung Baek領(lǐng)導(dǎo)了開發(fā)RoseTTAFold的工作。深度學(xué)習(xí)正在完全地改變他的小組進(jìn)行蛋白質(zhì)設(shè)計的方式。

Baker的團(tuán)隊讓AlphaFold和RoseTTAFold "想象"出新的蛋白質(zhì)。研究人員已經(jīng)改變了人工智能代碼,以便在給定隨機的氨基酸序列時,軟件將對其進(jìn)行優(yōu)化,直到它們類似于神經(jīng)網(wǎng)絡(luò)所識別的蛋白質(zhì)。


研究人員利用深度神經(jīng)網(wǎng)絡(luò)發(fā)明或 "想象 "出可以折疊成蛋白質(zhì)的氨基酸序列;在某些情況下,他們合成了這些蛋白質(zhì),以比較其實際結(jié)構(gòu)和預(yù)測值

2021年12月,Baker和他的同事報告說,在細(xì)菌中表達(dá)了129個這些想象的蛋白質(zhì),并發(fā)現(xiàn)其中大約五分之一的蛋白質(zhì)折疊成類似于其預(yù)測的形狀。Baker認(rèn)為,這證明了我們可以使用AlphaFold網(wǎng)絡(luò)來設(shè)計蛋白質(zhì)。他的團(tuán)隊現(xiàn)在正在使用這種方法來設(shè)計有實用價值的蛋白質(zhì),例如催化一個特定的化學(xué)反應(yīng),僅需指定負(fù)責(zé)所需功能的氨基酸,AI將設(shè)計其余部分。

蛋白質(zhì) "想象 "的四個例子。在每一個例子中,AlphaFold都會出現(xiàn)一個隨機的氨基酸序列,預(yù)測結(jié)構(gòu),并改變序列,直到軟件有把握地預(yù)測它將折疊成一個具有明確的三維形狀的蛋白質(zhì)。顏色表示預(yù)測的可信度(從紅色表示非常低的可信度,通過黃色和淺藍(lán)色到深藍(lán)色表示非常高的可信度)。

刮骨療毒,AlphaFold的訓(xùn)練方式


當(dāng)DeepMind發(fā)布其AlphaFold代碼時,開發(fā)者Ovchinnikov想更好地了解該工具是如何工作的。在幾天之內(nèi),他和包括Steinegger在內(nèi)的計算生物學(xué)同事建立了一個名為ColabFold的網(wǎng)站,允許任何人向AlphaFold或RoseTTAFold提交蛋白質(zhì)序列并獲得結(jié)構(gòu)預(yù)測。Ovchinnikov想象他和其他科學(xué)家將使用ColabFold的假數(shù)據(jù)來攻擊AlphaFold,例如,通過提供關(guān)于目標(biāo)蛋白質(zhì)序列進(jìn)化親屬的虛假信息。這樣做使得他能確定該軟件是如何學(xué)會預(yù)測結(jié)構(gòu)的。

到目前為止,最好的一次攻擊是在由多條相互作用的肽鏈組成的蛋白質(zhì)復(fù)合物上使用AlphaFold,這些交織在一起的肽鏈就像核孔復(fù)合體一樣,細(xì)胞中的許多蛋白質(zhì)在與多個蛋白質(zhì)亞單元形成復(fù)合體時獲得了它們的功能。

AlphaFold被設(shè)計用來預(yù)測單個肽鏈的形狀,它的訓(xùn)練完全由這類蛋白質(zhì)組成。但是AlphaFold的神經(jīng)網(wǎng)絡(luò)似乎已經(jīng)學(xué)習(xí)了一些關(guān)于復(fù)合物如何折疊在一起的情況。在AlphaFold的代碼發(fā)布幾天后,東京大學(xué)的蛋白質(zhì)生物信息學(xué)家Yoshitaka Moriwaki在推特上說,如果兩個蛋白質(zhì)序列用一個長的連接序列縫合起來,AlphaFold可以準(zhǔn)確地預(yù)測它們之間的相互作用。Baek很快分享了另一個預(yù)測出的復(fù)合體,該數(shù)據(jù)是在RoseTTAFold的開發(fā)過程中收集到的。

最終,ColabFold成功學(xué)會了預(yù)測復(fù)合體的能力。而在2021年10月,DeepMind發(fā)布了一個名為AlphaFold-Multimer的更新,與之前的版本不同,它是專門針對蛋白質(zhì)復(fù)合體進(jìn)行訓(xùn)練的。Jumper的團(tuán)隊將其應(yīng)用于PDB中的數(shù)千個復(fù)合物,并發(fā)現(xiàn)它預(yù)測了大約70%的已知蛋白質(zhì)間的相互作用。

這些工具已經(jīng)在幫助研究人員發(fā)現(xiàn)潛在的新蛋白質(zhì)。Elofsson的團(tuán)隊使用AlphaFold預(yù)測了65000個人類蛋白質(zhì)對的結(jié)構(gòu):根據(jù)實驗數(shù)據(jù),這些蛋白質(zhì)對被懷疑有相互作用。Baker領(lǐng)導(dǎo)的一個團(tuán)隊使用AlphaFold和RoseTTAFold來模擬幾乎每一對由酵母編碼的蛋白質(zhì)之間的相互作用,并發(fā)現(xiàn)了100多個以前未知的復(fù)合體。Elofsson認(rèn)為,這樣的篩選只是一個起點。它們在預(yù)測一些蛋白質(zhì)配對方面做得很好,特別是那些穩(wěn)定的蛋白質(zhì)配對,但在識別更多的瞬時相互作用方面卻很困難??此普_的結(jié)果并不意味著它是正確的,一些基于冷凍電鏡等驗證方式的實驗數(shù)據(jù)必不可少。"

Kosinski說,核孔復(fù)合體的工作是一個很好的例子,說明預(yù)測和實驗數(shù)據(jù)可以一起工作。把所有的30個蛋白質(zhì)扔進(jìn)AlphaFold,然后得到結(jié)構(gòu)出來是絕對不可取的。為了把預(yù)測的蛋白質(zhì)結(jié)構(gòu)放在一起,該團(tuán)隊通過冷凍斷層掃描技術(shù),確定了核孔復(fù)合體的冷凍電鏡三維結(jié)構(gòu)。隨后,在一個能夠確定蛋白質(zhì)接近程度的實驗中,研究小組發(fā)現(xiàn)了該復(fù)合體的兩個組成部分之間存在令人驚訝的相互作用,AlphaFold的模型隨后證實了這一點。


人類核孔復(fù)合體的兩個視圖顯示了這個巨大的組件如何嵌入到核膜中(白色)


AlphaFold的局限性


科學(xué)家們說,盡管AlphaFold取得了所有的進(jìn)展,但重要的是要清楚它的局限性,因為有很多不擅長預(yù)測蛋白質(zhì)結(jié)構(gòu)的研究人員在使用它。

一些將AlphaFold應(yīng)用于破壞蛋白質(zhì)自然結(jié)構(gòu)的各種突變的嘗試表明,該軟件不具備預(yù)測蛋白質(zhì)新突變后果的能力,因為沒有與進(jìn)化有關(guān)的序列可供研究。

AlphaFold團(tuán)隊現(xiàn)在正在考慮如何設(shè)計一個神經(jīng)網(wǎng)絡(luò)來處理新的突變。Jumper預(yù)計,這將需要更好地預(yù)測一個蛋白質(zhì)如何從其未折疊狀態(tài)轉(zhuǎn)為折疊狀態(tài)。紐約市哥倫比亞大學(xué)的計算生物學(xué)家Mohammed AlQuraishi認(rèn)為,這一優(yōu)化將基于蛋白質(zhì)物理學(xué)知識,目前學(xué)界感興趣的研究方向是如何在不使用進(jìn)化信息的情況下從單一序列進(jìn)行預(yù)測,這是一個關(guān)鍵的問題,而它確實仍未被解決。"

AlphaFold也被設(shè)計為預(yù)測單一結(jié)構(gòu),盡管它已經(jīng)被黑掉了,以吐出不止一個結(jié)構(gòu)。但是許多蛋白質(zhì)具有多種構(gòu)象,這可能對它們的功能很重要。"Schueler-Furman說:"AlphaFold無法處理那些可以在不同構(gòu)象中采用不同結(jié)構(gòu)的蛋白質(zhì)。其給出的預(yù)測只能針對獨立的結(jié)構(gòu),而許多蛋白質(zhì)與配體如DNA、RNA、脂肪分子和礦物質(zhì)一起發(fā)揮作用。"Elofsson說:"我們?nèi)匀粺o法預(yù)測配體,并缺少關(guān)于蛋白質(zhì)的其他一切。"

AlQuraishi表示,開發(fā)下一代的神經(jīng)網(wǎng)絡(luò)將是一個巨大的挑戰(zhàn)。AlphaFold依賴于幾十年的研究,這些研究產(chǎn)生了蛋白質(zhì)的實驗數(shù)據(jù),而神經(jīng)網(wǎng)絡(luò)可以從中學(xué)習(xí)。這種數(shù)據(jù)量目前還不能用來捕捉蛋白質(zhì)的動態(tài),或蛋白質(zhì)可能與之相互作用的數(shù)萬億個小分子的形狀。Jumper補充說,PDB中包括一些蛋白質(zhì)如何與其他分子相互作用的結(jié)構(gòu),但這僅僅是浩瀚生物學(xué)一小部分。

研究人員認(rèn)為,他們需要時間來確定如何最大化AlphaFold和相關(guān)的AI工具的產(chǎn)能。AlQuraishi認(rèn)為這些軟件與早期的電視有相似之處,當(dāng)時一些節(jié)目是由電臺廣播員簡單地閱讀新聞。而我們很快就能開發(fā)出基于AI的其他節(jié)目。

AlphaFold革命的結(jié)局是什么,誰也說不準(zhǔn)。Baker說:"事情變化得太快了,這些AI工具在不斷產(chǎn)生重大突破。" EMBL-EBI的計算生物學(xué)家Janet Thornton認(rèn)為AlphaFold最大的影響之一可能只是說服生物學(xué)家對來自計算和理論方法的見解更加開放。對她來說,革命即是思維方式的改變。

AlphaFold革命激發(fā)了Kosinski的夢想。他想象著AlphaFold啟發(fā)的工具不僅可以用來為單個蛋白質(zhì)和復(fù)合體建模,而且可以為整個細(xì)胞器甚至細(xì)胞建模,直至完整的蛋白質(zhì)分子。這也許是我們在未來幾十年里要追尋的夢想。


轉(zhuǎn)載自Nature

"What's next for AlphaFold and the AI protein-folding revolution"

https://doi.org/10.1038/d41586-022-00997-5


---------------

水木未來·視界丨iss. 14

---------------


更多關(guān)于AlphaFold2


基于AI預(yù)測蛋白質(zhì)折疊的三維空間結(jié)構(gòu)——AlphaFold2原理及安裝使用


基于AI預(yù)測蛋白質(zhì)復(fù)合體的三維空間結(jié)構(gòu)---AlphaFold-Multimer原理及使用





水木未來·視界iss.14丨AlphaFold和AI蛋白質(zhì)折疊革命的下一步是什么?的評論 (共 條)

分享到微博請遵守國家法律
寿光市| 吉隆县| 广宗县| 大石桥市| 阜康市| 页游| 鄂尔多斯市| 保康县| 遵化市| 连州市| 襄垣县| 栾城县| 桃园县| 二连浩特市| 长春市| 淳化县| 象山县| 南开区| 瓦房店市| 巩留县| 田阳县| 乌兰浩特市| 手游| 乌兰察布市| 江西省| 洞头县| 缙云县| 睢宁县| 静乐县| 南召县| 温宿县| 全椒县| 正阳县| 常德市| 喀什市| 通化县| 保靖县| 阿拉善右旗| 车致| 鄯善县| 库尔勒市|