DeepMind的蛋白質(zhì)折疊人工智能破解了生物學(xué)的最大問題
我是斜杠青年,一個(gè)熱愛前沿科學(xué)的“雜食性”學(xué)者!
人工智能公司DeepMind在短短18個(gè)月內(nèi)預(yù)測了幾乎所有科學(xué)已知蛋白質(zhì)的結(jié)構(gòu),從而改變了生物學(xué),這一突破將加快藥物開發(fā)并徹底改變基礎(chǔ)科學(xué)

DeepMind預(yù)測了迄今為止科學(xué)編目的幾乎所有蛋白質(zhì)的結(jié)構(gòu),由于一種名為AlphaFold的人工智能,在短短18個(gè)月內(nèi)就打破了生物學(xué)的巨大挑戰(zhàn)之一。研究人員表示,這項(xiàng)工作已經(jīng)導(dǎo)致了進(jìn)展的抗擊瘧疾、抗生素耐藥性和塑料廢物,并可能加快新藥的發(fā)現(xiàn)。
幾十年來,根據(jù)蛋白質(zhì)的成分氨基酸序列確定蛋白質(zhì)的皺巴巴的形狀一直是生物學(xué)中一個(gè)持續(xù)存在的問題。其中一些氨基酸被另一些氨基酸吸引,一些被水排斥,鏈條形成復(fù)雜的形狀,很難準(zhǔn)確確定。
總部位于英國的人工智能公司DeepMind于2020年底首次宣布,它已經(jīng)開發(fā)了一種準(zhǔn)確預(yù)測折疊蛋白質(zhì)結(jié)構(gòu)的方法,到中期,它顯示,它已經(jīng)繪制了人體使用98.5%的蛋白質(zhì)。
今天,公司宣布,它正在發(fā)布超過2億種蛋白質(zhì)結(jié)構(gòu)——幾乎所有被編入全球公認(rèn)的蛋白質(zhì)研究庫UniProt的蛋白質(zhì)結(jié)構(gòu)。
DeepMind與歐洲生物信息學(xué)研究所(EMBL-EBI)的歐洲分子生物學(xué)實(shí)驗(yàn)室合作,創(chuàng)建了所有這些信息的可搜索存儲庫,可供世界各地的研究人員輕松免費(fèi)訪問。EMBL-EBI的Ewan Birney稱AlphaFold蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫是“給人類的禮物”。
Ewan Birney是“一個(gè)自20世紀(jì)90年代以來一直從事基因組學(xué)和計(jì)算生物學(xué)的人。
已經(jīng)交付了結(jié)果
DeepMind首席執(zhí)行官Demis Hassabis表示,數(shù)據(jù)庫使查找蛋白質(zhì)結(jié)構(gòu)(以前通常需要數(shù)年時(shí)間)“幾乎與谷歌搜索一樣容易”。DeepMind由谷歌的母公司Alphabet擁有。
科學(xué)家已經(jīng)使用該檔案來推進(jìn)一些領(lǐng)域的研究。牛津大學(xué)的Matt Higgins和他的同事正在研究一種蛋白質(zhì),他們認(rèn)為這種蛋白質(zhì)是中斷瘧疾寄生蟲生命周期的關(guān)鍵,但正在努力繪制其結(jié)構(gòu)圖。
Higgins表示:“他們使用的實(shí)驗(yàn)方法之一是X射線晶體學(xué)?!彼麄冏尩鞍踪|(zhì)形成晶格,發(fā)射X射線,并從這些X射線衍射模式中獲得信息,看看分子是什么樣子。但是,盡管進(jìn)行了多年的工作,他們一直無法足夠詳細(xì)地看到這種分子的樣子?!?/p>
但當(dāng)AlphaFold發(fā)布時(shí),它清楚地預(yù)測了蛋白質(zhì)的結(jié)構(gòu),與研究人員能夠收集的信息相匹配。他們現(xiàn)在能夠設(shè)計(jì)出新的蛋白質(zhì),他們希望這些蛋白質(zhì)可以作為有效的瘧疾疫苗。
使用X射線晶體學(xué)繪制蛋白質(zhì)結(jié)構(gòu)圖既昂貴又耗時(shí)?!斑@意味著實(shí)驗(yàn)者必須對他們做什么做出選擇,而AlphaFold不必做出選擇?!蔽覀兺耆梢韵嘈?,由于AlphaFold,將產(chǎn)生新的實(shí)驗(yàn)和新的見解,例如,這將影響“這種特定寄生蟲的工作原理”或“為什么這種特定疾病發(fā)生在人類身上”。
研究人員還使用AlphaFold來設(shè)計(jì)新的酶來分解塑料廢物,并了解更多關(guān)于使細(xì)菌對抗生素產(chǎn)生抗藥性的蛋白質(zhì)。
工作仍有待完成
倫敦帝國理工學(xué)院的Keith Willison表示,AlphaFold無疑“改變了”生物研究的世界,但在蛋白質(zhì)折疊方面仍有問題需要解決。
“AlphaFold出來后,你現(xiàn)在只需服用你最喜歡的蛋白質(zhì)并查找它們,而不必制作晶體?!盞eith Willison做了蛋白質(zhì)復(fù)合物的晶體結(jié)構(gòu),花了他大約八年的時(shí)間。很多人開玩笑說晶體學(xué)家會失業(yè)?!?/p>
但Willison指出,AlphaFold無法接受任意的氨基酸串,并精確模擬它們的折疊方式。相反,它只能使用經(jīng)過實(shí)驗(yàn)確定的的部分蛋白質(zhì)及其結(jié)構(gòu)來預(yù)測新蛋白質(zhì)將如何折疊。
雖然該工具通常都非常準(zhǔn)確,但其結(jié)構(gòu)總是預(yù)測,而不是明確計(jì)算的結(jié)果。AlphaFold也沒有解決復(fù)雜相互作用的蛋白質(zhì),甚至留下了凹痕的一小部分結(jié)構(gòu),這些結(jié)構(gòu)被稱為本質(zhì)無序的蛋白質(zhì),這些結(jié)構(gòu)似乎具有不穩(wěn)定和不可預(yù)測的折疊模式。
一旦你發(fā)現(xiàn)了一件事,就會有更多的問題。事實(shí)上,生物學(xué)很復(fù)雜,這相當(dāng)可怕。
倫敦大學(xué)學(xué)院的Tomek Wlodarski表示,AlphaFold對生物學(xué)的許多領(lǐng)域產(chǎn)生了巨大影響,但在準(zhǔn)確性方面還有改進(jìn),開發(fā)蛋白質(zhì)如何折疊模型——而不僅僅是預(yù)測其最終結(jié)構(gòu)——是DeepMind尚未解決的問題。
AlphaFold并不完美,盡管它確實(shí)表明預(yù)測哪些部分具有很高的準(zhǔn)確性,哪些部分缺乏信心。
“當(dāng)你引入了一種突變,你知道它在實(shí)驗(yàn)上完全展開了蛋白質(zhì),但AlphaFold給了你相同的結(jié)構(gòu),沒有這種突變?!盬lodarski做了另一個(gè)測試:他正在從蛋白質(zhì)的一端去除殘留物,因?yàn)槲覀冎溃梦覀兊牡鞍踪|(zhì),如果你從其中一端切下九個(gè)殘留物,它將完全展開蛋白質(zhì)。Wlodarski設(shè)法砍掉了一半的蛋白質(zhì)序列,算法仍然預(yù)測為完全相同結(jié)構(gòu)的完全折疊的蛋白質(zhì)。所以有這些問題?!?/p>
DeepMind科學(xué)團(tuán)隊(duì)負(fù)責(zé)人Pushmeet Kohli表示,公司尚未使用蛋白質(zhì),并正在努力提高AlphaFold的準(zhǔn)確性和功能。
“我們知道蛋白質(zhì)的靜態(tài)結(jié)構(gòu),但這不是游戲的結(jié)束。”我們希望了解這些蛋白質(zhì)的行為方式,它們的動力學(xué)是什么,它們?nèi)绾蜗嗷プ饔谩H缓笫腔蚪M學(xué)的另一個(gè)領(lǐng)域,我們想了解生命的配方如何轉(zhuǎn)化為蛋白質(zhì)的產(chǎn)生,它們何時(shí)被創(chuàng)造出來,以及細(xì)胞的工作原理?!?/p>
如果你喜歡前沿科學(xué),關(guān)注我就是你最好的選擇!
拓展閱讀:
谷歌地球、谷歌地圖和谷歌天空之后,也許有一天我們會有一個(gè)谷歌身體搜索的工具!
谷歌的蛋白質(zhì)折疊AI AlphaFold幾乎把它們都破解了
計(jì)算機(jī)解決了一個(gè)主要的時(shí)間旅行問題
一種受維基百科啟發(fā)的,用于建立高質(zhì)量的醫(yī)療指南的新方法