里程碑事件:AlphaFold揭示了蛋白質宇宙的結構
我是斜杠青年,一個熱愛前沿科技的“雜食性”學者!
自從字母表公司發(fā)布和開源AlphaFold以來,已經一年了,他們的人工智能系統(tǒng)僅從其1D氨基酸序列中預測蛋白質的3D結構,并創(chuàng)建了AlphaFold蛋白質結構數據庫(AlphaFold DB),與世界自由分享這些科學知識。蛋白質是生命的基石,它們支撐著每個生物中的每個生物過程。而且,由于蛋白質的形狀與其功能密切相關,了解蛋白質的結構可以解鎖對其功能和工作方式的更大了解。
希望這一突破性資源將有助于加快全球科學研究和發(fā)現,并希望其他團隊可以學習和借鑒AlphaFold,與AlphaFold一起取得的進步,以取得進一步的突破。這種希望已經成為現實的速度比我們敢于夢想的速度要快得多。僅僅12個月后,50多萬研究人員訪問了AlphaFold,并用于加快從塑料污染到抗生素耐藥性等重要現實問題的進展。
這兩天,我非常興奮地分享這一里程碑式的進展,雖然作為局外人,但在得知這一消息后,沒有什么比這個更能讓人興奮的,它是推進解決人類災難性問題的助推器。
字母表公司與EMBL的歐洲生物信息學研究所(EMBL-EBI)合作,現在正在發(fā)布幾乎所有科學已知的編目蛋白質的預測結構,這將使AlphaFold DB擴展200倍以上——從近100萬個結構擴展到2億多個結構——并有可能大幅提高我們對生物學的理解。
這一更新包括植物、細菌、動物和其他生物的預測結構,為研究人員使用AlphaFold推進他們在可持續(xù)性、糧食不安全和被忽視疾病等重要問題上的工作提供了許多新的機會。
今天的更新意味著主蛋白質數據庫UniProt上的大多數頁面都將具有預測結構。所有2億多個結構也可以通過谷歌云公共數據集批量下載,使世界各地的科學家更容易訪問AlphaFold。
AlphaFold是生命科學中獨特而重大的進步,展示了人工智能的力量。確定蛋白質的3D結構過去需要幾個月或幾年的時間,現在需要幾秒鐘。AlphaFold已經加速并促成了大規(guī)模發(fā)現,包括裂開核孔復合體的結構。隨著這種照亮幾乎整個蛋白質宇宙的結構的新添加,我們可以期待每天有更多的生物謎團得到解決?!?/p>
到目前為止,AlphaFold的影響
自AlphaFold首次發(fā)布以來的12個月后,反思AlphaFold已經產生了令人難以置信的影響,以及達到今天里程碑的漫長旅程,真是令人驚嘆。
對于字母表的團隊來說,AlphaFold的成功特別有回報,因為它是團隊構建過的最復雜的人工智能系統(tǒng),需要多項關鍵創(chuàng)新,也因為它產生了最有意義的下游影響。通過證明人工智能可以在規(guī)模和幾分鐘內準確預測蛋白質的形狀,直到原子精度,AlphaFold不僅為50年的巨大挑戰(zhàn)提供了解決方案,還成為團隊創(chuàng)始論文的第一個重大證明點:人工智能可以顯著加速科學發(fā)現,進而推進人類。
字母表公司開源了AlphaFold的代碼,并在《自然》雜志上發(fā)表了兩篇深入論文,這些論文已被引用了4000多次。他們與世界領先的EMBL-EBI密切合作,設計了一個最能幫助生物學家訪問和使用AlphaFold的工具,并共同發(fā)布了AlphaFold DB,這是一個向所有人開放和免費的可搜索數據庫。在發(fā)布AlphaFold之前,根據字母表公司負責任的謹慎方法,他們征求了生物學研究、安全、倫理和安全領域的30多名專家的意見,以幫助他們了解如何與世界分享AlphaFold的好處,從而最大限度地發(fā)揮潛在效益并最大限度地降低潛在風險。
迄今為止,來自190個國家的50多萬研究人員訪問了AlphaFold數據庫,查看了200多萬個結構。開源的免費結構也已集成到其他公共數據集中,如Ensembl、UniProt和OpenTargets中,數百萬用戶可以訪問它們,作為其日常工作流程的一部分。

讓谷歌感到驚訝的是,AlphaFold已經成為世界各地實驗室和大學數十萬科學家?guī)椭麄冮_展重要工作的重要工具。至于谷歌自己與AlphaFold的合作,谷歌優(yōu)先考慮谷歌認為具有最積極社會效益的應用程序,重點是歷史上資金不足或被忽視的舉措。例如,谷歌與被忽視疾病藥物倡議(DNDI)合作,幫助他們推進他們的研究,使他們更接近于為利什曼病和南美錐蟲病等疾病尋找拯救生命的治療方法,這些疾病對世界較貧窮地區(qū)的人民產生了不成比例的影響。
谷歌還支持世界被忽視的熱帶疾病日,為世界衛(wèi)生組織確定為研究高度優(yōu)先事項的生物創(chuàng)建結構預測,幫助進一步研究麻風病和血吸蟲病等疾病,這些疾病摧毀了全球超過10億人的生活。
看到研究界以各種方式使用AlphaFold,從了解疾病到保護蜜蜂,到破譯生物謎題,再到更深入地研究生命本身的起源,這真是太鼓舞人心了。
字母表公司的AlphaFold團隊成員選擇的其他令人印象深刻的例子包括:
一種生物拼圖,由Kathryn Tunyasuvunakool選擇
在最近的一期《科學》特刊中,幾個小組描述了AlphaFold如何幫助他們拼湊核孔復合物,這是生物學中最惡魔般的謎題之一。巨型結構由數百個蛋白質部分組成,控制著進出細胞核的一切。通過使用現有的實驗方法來揭示其輪廓和AlphaFold預測,以完成和解釋任何不明確的區(qū)域,最終揭示了其微妙的結構。這種強大的組合現在正在實驗室中成為例行公事,解鎖了新科學,并展示了實驗和計算技術如何協同工作。
理查德·埃文斯選擇的生物信息學新世界
Foldseek和Dali等結構搜索工具允許用戶非常快速地搜索類似于給定蛋白質的條目。這可能是挖掘大序列數據集用于幾乎有用的蛋白質的第一步,例如那些分解塑料的蛋白質,它可以提供有關蛋白質功能的線索。更新數據庫以包括超過2億個預測結構,將進一步擴大這種影響。
John Jumper選擇的對人類健康的直接影響
AlphaFold已經對人類健康產生了重大的直接影響。與歐洲人類遺傳學學會研究人員的會面揭示了AlphaFold結構對試圖解開罕見遺傳疾病原因的生物學家和臨床醫(yī)生的重要性。此外,AlphaFold正在通過更好地了解新發(fā)現的可能成為藥物靶點的蛋白質,并幫助科學家更快地找到與它們結合的潛在藥物,從而加快藥物發(fā)現。
“AlphaFold幾乎在一夜之間成為生物制藥研究的重要工具,包括在羅馬治療公司,在那里,它使AlphaFold能夠預測以前從未解決過的黑暗基因組區(qū)域的蛋白質結構。AlphaFold的速度和準確性正在加速藥物發(fā)現過程,谷歌公司才剛剛意識到它對更快地向患者提供新藥的影響。”
才只是剛剛開始
AlphaFold將生物學推向一個結構豐富的時代,以數字速度解鎖了科學探索。AlphaFold DB是蛋白質結構的“谷歌搜索”,為研究人員提供了他們正在研究的蛋白質預測模型的即時訪問,使他們能夠集中精力并加快實驗工作。從抗擊疾病到開發(fā)疫苗,AlphaFold已經在谷歌一些最大的全球挑戰(zhàn)上取得了令人難以置信的進展,這只是谷歌將在未來幾年開始看到的影響的開始。谷歌希望這個擴展的數據庫將幫助無數科學家開展工作,并開辟全新的科學探索途徑,如元蛋白質組學。
在DeepMind,團隊正在努力利用所有這些潛力,在許多領域進行大量投資,包括與他們新的姐妹字母表公司同構實驗室合作,以人工智能優(yōu)先的方法從第一原則重新想象整個藥物發(fā)現過程;在著名的弗朗西斯·克里克研究所建立一個濕實驗室,以加強人工智能和實驗技術之間的聯系,以促進對生物學的理解,包括蛋白質設計和基因組學;擴大他們的科學人工智能團隊,以加快他們基礎生物學研究的進一步進展,并將人工智能應用于氣候科學等其他引人入勝的重要科學挑戰(zhàn),量子化學和聚變。
AlphaFold給未來更多的想象空間,以及應用于生物學的計算和人工智能方法可能實現什么。在最基本的層面上,生物學可以被視為一個信息處理系統(tǒng),盡管是一個非常復雜和新興的系統(tǒng)。正如數學是物理學的完美描述語言一樣,該公司認為人工智能可能是應對生物學動態(tài)復雜性的正確技術。AlphaFold是這方面的第一個重要證明點,也是未來更多跡象。作為新興“數字生物學”領域的先驅,他們很高興看到人工智能的巨大潛力開始成為人類推進科學發(fā)現和了解生命基本機制的最有用工具之一。
如果你喜歡前沿科技,關注我就是你最好的選擇!