最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

「Nature」基于人工智能的全新蛋白質(zhì)設(shè)計(jì) | 水木視界iss. 30

2023-03-03 12:38 作者:水木未來科技  | 我要投稿




摘要


科學(xué)家們正在使用人工智能來設(shè)計(jì)革命性的全新蛋白質(zhì):由于人工智能的巨大進(jìn)步,它們可以在短短幾秒鐘內(nèi)設(shè)計(jì)出復(fù)雜的分子,而在之前,這一過程則需要幾個(gè)月的時(shí)間。


Copyright ??Nature |?Ewen Callaway



2022年6月,首款基于人工設(shè)計(jì)蛋白的COVID-19疫苗得到了韓國監(jiān)管機(jī)構(gòu)的批準(zhǔn),開創(chuàng)了人造蛋白質(zhì)藥物的先河。該疫苗基于一種球形的"納米顆粒",由蛋白質(zhì)組成,是研究人員近十年實(shí)驗(yàn)的反復(fù)試錯(cuò)所產(chǎn)生的成果「1」。由西雅圖華盛頓大學(xué)的生物化學(xué)家David Baker領(lǐng)導(dǎo)的團(tuán)隊(duì)發(fā)表在《科學(xué)》「2&3」上報(bào)告稱,由于人工智能的巨大進(jìn)步,它們可以在短短幾秒鐘內(nèi)設(shè)計(jì)出復(fù)雜的分子,而在之前,這一過程則需要幾個(gè)月的時(shí)間。

人工智能正在幫助科學(xué)家們構(gòu)建自然界中不曾存在的蛋白質(zhì)?Credit@Ian C Haydon 華盛頓大學(xué)蛋白質(zhì)設(shè)計(jì)研究所在生命科學(xué)領(lǐng)域,人工智能的崛起是大勢(shì)所趨的,DeepMind的蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)軟件AlphaFold等一系列的人工智能工具受到了生命科學(xué)家群體的熱烈歡迎。2022年7月,DeepMind透露其最新版本的AlphaFold已經(jīng)預(yù)測(cè)了科學(xué)界已知的所有蛋白質(zhì)結(jié)構(gòu)。最近幾個(gè)月,人工智能領(lǐng)域表現(xiàn)出爆炸性的增長(zhǎng)(其中的一些成果是基于AlphaFold的),新一批的工具可以快速地構(gòu)思出全新的蛋白質(zhì)。在此之前,這一直是奢侈的設(shè)想而已,失敗率極高。西班牙赫羅納大學(xué)的計(jì)算生物學(xué)家Noelia Ferruz表示:"自AlphaFold發(fā)布之后,我們?cè)诘鞍踪|(zhì)設(shè)計(jì)領(lǐng)域的工作方式發(fā)生了極大轉(zhuǎn)變,這是一個(gè)充滿變革的時(shí)代。"大多數(shù)人工智能研究者的精力都花費(fèi)在了開發(fā)蛋白質(zhì)設(shè)計(jì)的工具上,力求工具的產(chǎn)物不同于自然界的任何蛋白,卻沒有過多地關(guān)注這些分子能做什么。不過,越來越多的研究人員以及人工智能驅(qū)動(dòng)的蛋白質(zhì)設(shè)計(jì)公司希望能夠設(shè)計(jì)出更為實(shí)用的蛋白質(zhì),從清理體內(nèi)毒性物質(zhì)到治療疾?。赫谥鸩綄?shí)現(xiàn)這一目標(biāo)的公司包括倫敦的DeepMind加州的Meta(前身為Facebook)"這些人工智能的方法已經(jīng)非常強(qiáng)大,也將在未來變得更加強(qiáng)大。"Baker說道:"需要我們思考的問題是,它們究竟能夠被用來解決什么樣的問題?"
「從零開始」
在過去的三十年里,Baker的實(shí)驗(yàn)室一直在制造新的蛋白質(zhì)。他們從20世紀(jì)90年代以來一直開發(fā)的一款名為Rosetta的軟件將蛋白質(zhì)設(shè)計(jì)分為了幾個(gè)步驟。首先,研究人員會(huì)為新的蛋白質(zhì)構(gòu)思一個(gè)形狀:通常情況下,這一步需要拼湊一些其他蛋白質(zhì)的碎片,然后軟件會(huì)推導(dǎo)出與這種形狀相對(duì)應(yīng)的氨基酸序列。不過,這會(huì)帶來一個(gè)問題:在實(shí)驗(yàn)室里制備這些蛋白時(shí),它們很少能折疊成所需的形狀,而是最終停留在不同的構(gòu)象中。因此,需要另一個(gè)步驟對(duì)蛋白質(zhì)序列加以調(diào)整,使其只能折疊成單一的理想結(jié)構(gòu)。曾在Baker實(shí)驗(yàn)室工作的哈佛大學(xué)進(jìn)化生物學(xué)家Sergey Ovchinnikov表示,這一步驟需要對(duì)不同序列的所有可折疊方式進(jìn)行模擬,在計(jì)算的方面來說,成本十分高昂:"實(shí)際上,這需要10,000臺(tái)計(jì)算機(jī)運(yùn)行數(shù)周來得出結(jié)果。不過,通過對(duì)AlphaFold和其他人工智能程序的調(diào)試,這個(gè)極為耗時(shí)的步驟現(xiàn)在能夠被瞬間完成。"在Baker團(tuán)隊(duì)開發(fā)的一種被稱為"幻化"(Hallucinated)的方法中,研究人員將隨機(jī)的氨基酸序列輸入到結(jié)構(gòu)預(yù)測(cè)網(wǎng)絡(luò)中:序列的結(jié)構(gòu)將被改變并逐漸像蛋白質(zhì)靠攏,這或多或少地和預(yù)測(cè)的結(jié)果相似。在2021年的一篇論文中,Baker的團(tuán)隊(duì)在實(shí)驗(yàn)室中創(chuàng)造了100多個(gè)小型的 "幻化 "蛋白質(zhì),并發(fā)現(xiàn)有跡象表明大約五分之一與預(yù)測(cè)的形狀相似[4]。AlphaFold以及Baker實(shí)驗(yàn)室開發(fā)的類似工具,稱為RoseTTAFold,被訓(xùn)練來預(yù)測(cè)單個(gè)蛋白質(zhì)鏈的結(jié)構(gòu)。但研究人員很快發(fā)現(xiàn),這種網(wǎng)絡(luò)也可以為多個(gè)相互作用的蛋白質(zhì)的組合進(jìn)行建模。在此基礎(chǔ)上,貝克和他的團(tuán)隊(duì)確信,他們最終會(huì)利用"幻化"方法設(shè)計(jì)出一些蛋白質(zhì):它們將能夠能夠自我組裝成不同形狀和大小的納米顆粒:這將由單個(gè)蛋白質(zhì)的許多副本組成,其原理與前文所述的基于人工設(shè)計(jì)蛋白的COVID-19疫苗類似。

Credit@Nik Spencer/Nature

Source: Adapted from N. Ferruz?et al但是當(dāng)Baker他們在實(shí)驗(yàn)室中嘗試引導(dǎo)微生物制備那些蛋白時(shí),150個(gè)設(shè)計(jì)全部都失敗了:蛋白質(zhì)根本沒有折疊。大約在同一時(shí)間,該實(shí)驗(yàn)室的另一位研究人員,機(jī)器學(xué)習(xí)科學(xué)家Justas Dauparas,正在開發(fā)一種深度學(xué)習(xí)工具"ProteinMPNN",以解決所謂的逆折疊問題,該工具的成品將能夠確定與給定蛋白質(zhì)的整體形狀相對(duì)應(yīng)的蛋白質(zhì)序列[3]。Ovchinnikov認(rèn)為,這個(gè)名為ProteinMPNN的網(wǎng)絡(luò)可以作為"拼寫檢查"工具,對(duì)利用AlphaFold或其他工具所設(shè)計(jì)出的蛋白質(zhì)加以檢查,該網(wǎng)絡(luò)能夠在保持分子的整體形狀的同時(shí)調(diào)整序列。當(dāng)Baker和他的團(tuán)隊(duì)將ProteinMPNN應(yīng)用于他們的幻化蛋白納米顆粒時(shí),在實(shí)驗(yàn)中制作的分子取得了更大的成功。研究人員使用冷凍電鏡等技術(shù)檢查了他們的30種新蛋白質(zhì),其中27種與人工智能主導(dǎo)的設(shè)計(jì)相匹配[2]。該團(tuán)隊(duì)的成果包括具有復(fù)雜對(duì)稱性的巨大環(huán),與自然界中的任何蛋白都不同。共同領(lǐng)導(dǎo)這項(xiàng)工作的生物物理學(xué)家Lukas Milles認(rèn)為,從理論上講,這種方法可以用來設(shè)計(jì)與任何對(duì)稱形狀相對(duì)應(yīng)的納米粒子。"看看這些網(wǎng)絡(luò)的潛力,真是令人振奮!"
「深度學(xué)習(xí)革命」
斯德哥爾摩大學(xué)的計(jì)算生物學(xué)家Arne Elofsson說,像ProteinMPNN這樣的深度學(xué)習(xí)工具已經(jīng)改變了蛋白質(zhì)設(shè)計(jì)的游戲規(guī)則:"你畫出一個(gè)蛋白質(zhì),按下一個(gè)按鈕,得到的東西十有八九是能用的。" 而Ovchinnikov認(rèn)為:"現(xiàn)在我們可以完全控制蛋白質(zhì)的形狀。"通過結(jié)合多個(gè)神經(jīng)網(wǎng)絡(luò)來處理設(shè)計(jì)過程的不同部分,甚至可以實(shí)現(xiàn)更高的成功率,正如Baker的團(tuán)隊(duì)在設(shè)計(jì)納米粒子時(shí)所做的那樣。Baker的實(shí)驗(yàn)室并不是唯一將人工智能應(yīng)用于蛋白質(zhì)設(shè)計(jì)的實(shí)驗(yàn)室。在9月發(fā)布在bioRxiv上的一篇評(píng)論文章中,F(xiàn)erruz和她的同事統(tǒng)計(jì)了近年來使用各種方法開發(fā)的40多個(gè)人工智能蛋白質(zhì)設(shè)計(jì)工具[5]。包括ProteinMPNN在內(nèi),許多這一類的工具解決的是逆折疊問題:它們指定了一個(gè)對(duì)應(yīng)于特定結(jié)構(gòu)的序列,通常使用從圖像識(shí)別工具中借用的方法。其他的一些工具則是基于類似語言神經(jīng)網(wǎng)絡(luò)的架構(gòu),如GPT-3,它產(chǎn)生類似人類的文本,卻也能夠產(chǎn)生新的蛋白質(zhì)序列。作為這類網(wǎng)絡(luò)的開發(fā)者[6],F(xiàn)erruz非常自豪:"這些網(wǎng)絡(luò)能夠'說出'蛋白質(zhì)"。加州大學(xué)伯克利分校的機(jī)器學(xué)習(xí)研究員Chloe Hsu認(rèn)為,盡管源源不斷的蛋白質(zhì)設(shè)計(jì)工具被開發(fā)出來,但它們難以進(jìn)行橫向比較,她與Meta[7]的研究人員開發(fā)了一個(gè)逆折疊網(wǎng)絡(luò)。

蛋白質(zhì) "幻化 "的四個(gè)例子。在每個(gè)例子中,AlphaFold都會(huì)呈現(xiàn)一個(gè)隨機(jī)的氨基酸序列,預(yù)測(cè)結(jié)構(gòu),并改變序列,直到軟件自信地預(yù)測(cè)它將折疊成一個(gè)具有明確的三維形狀的蛋白質(zhì)。顏色表示預(yù)測(cè)的可信度(紅色表示極低的可信度,黃色、淺藍(lán)色和深藍(lán)色的可信度依次遞增) Credit@Sergey Ovchinnikov許多團(tuán)隊(duì)都在測(cè)試他們的網(wǎng)絡(luò)究竟能否從現(xiàn)有蛋白質(zhì)的結(jié)構(gòu)中準(zhǔn)確確定其序列,但這并不容易。Ferruz希望能夠舉辦一場(chǎng)蛋白質(zhì)設(shè)計(jì)競(jìng)賽,類似于兩年一度的蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)關(guān)鍵評(píng)估(CASP)實(shí)驗(yàn),在該實(shí)驗(yàn)中,AlphaFold首次展示了它在結(jié)構(gòu)預(yù)測(cè)網(wǎng)絡(luò)中的統(tǒng)治地位。Ferruz認(rèn)為,類似于CASP的東西將真正推動(dòng)這個(gè)領(lǐng)域的發(fā)展。
「走向濕實(shí)驗(yàn)室」
Baker和他的同事們堅(jiān)持認(rèn)為,在實(shí)驗(yàn)室中制造一種新的蛋白質(zhì)是對(duì)他們方法的最終檢驗(yàn)。他們最初制作幻化蛋白集合體的失敗表明了這一點(diǎn)。Baker實(shí)驗(yàn)室的生物物理學(xué)家Basile Wicky略帶失望地說道:"AlphaFold認(rèn)為它們是可行的蛋白質(zhì),但顯然,它們?cè)跐駥?shí)驗(yàn)室中并沒有起作用。"并不是所有開發(fā)蛋白質(zhì)設(shè)計(jì)人工智能工具的科學(xué)家都能輕松獲取實(shí)驗(yàn)資源,芝加哥豐田計(jì)算技術(shù)研究所的許錦波教授指出:找到可行的合作實(shí)驗(yàn)室需要大量的時(shí)間。因此,他正在建立自己的濕實(shí)驗(yàn)室,以測(cè)試并驗(yàn)證他的科研成果。Baker認(rèn)為,在設(shè)計(jì)具有特定功能的蛋白質(zhì)時(shí),實(shí)驗(yàn)是至關(guān)重要的。今年7月,他的團(tuán)隊(duì)闡述了一套人工智能方法,允許研究人員將特定的序列或結(jié)構(gòu)嵌入到一個(gè)新的蛋白質(zhì)中[8]。他們用這些方法來設(shè)計(jì)能夠催化特定反應(yīng)的酶、能夠與其他分子結(jié)合的蛋白質(zhì)、以及一種可用于防止呼吸道病毒的疫苗蛋白質(zhì),這種病毒是導(dǎo)致嬰兒住院的主要原因之一。2021年,DeepMind在倫敦成立了一家名為Isomorphic Labs的分公司,計(jì)劃將AlphaFold等人工智能工具用于藥物發(fā)現(xiàn)。據(jù)DeepMind的首席執(zhí)行官Demis Hassabis所述,蛋白質(zhì)設(shè)計(jì)將能為AlphaFold等深度學(xué)習(xí)技術(shù)提供廣泛的應(yīng)用場(chǎng)景:"在蛋白質(zhì)設(shè)計(jì)領(lǐng)域,我們要做的工作相當(dāng)多。目前這些還僅僅是早期而已。"

參考資料:

1. Hsia, Y. et al. Nature 535, 136–139 (2016).

2. Wicky, B. I. M. et al. Science?(2022).

3. Dauparas, J. et al. Science?(2022).

4. Anishchenko, I. et al. Nature 600, 547–552 (2021).

5. Ferruz, N. et al. Preprint at bioRxiv?(2022).

6. Ferruz, N., Schmidt, S. & H?cker, B. Nature Commun. 13, 4348 (2022).

7. Hsu, C. et al. Preprint at bioRxiv

8. Wang, J. et al. Science 377, 387–394 (2022).




水木未來丨視界 iss. 30Credit@Nature?|?Ewen Callaway

"Scientists are using AI to dream up revolutionary new proteins"



「Nature」基于人工智能的全新蛋白質(zhì)設(shè)計(jì) | 水木視界iss. 30的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國家法律
印江| 休宁县| 深泽县| 辛集市| 东阿县| 郧西县| 梅河口市| 牡丹江市| 上栗县| 新河县| 焉耆| 庆安县| 开化县| 宁德市| 汝城县| 靖安县| 绥化市| 恩施市| 玉林市| 利辛县| 台安县| 微博| 云南省| 六枝特区| 滨海县| 达尔| 临夏县| 马龙县| 鹤岗市| 吉安市| 英吉沙县| 满洲里市| 宕昌县| 文登市| 南和县| 浠水县| 永泰县| 新巴尔虎左旗| 怀柔区| 富锦市| 清丰县|