水木視界iss. 22 | 人工智能揭開了守護我們DNA復(fù)雜蛋白質(zhì)的面紗

前言
人工智能再一次做到了。
在解決了生物學(xué)中最大的謎團之一“預(yù)測蛋白質(zhì)結(jié)構(gòu)”之后,人工智能還破解了蛋白質(zhì)如何連接成復(fù)合物的問題,并設(shè)想出了新的蛋白質(zhì)結(jié)構(gòu),最終可能被轉(zhuǎn)化為藥物以調(diào)控對人類基本生物特征、健康和生命的影響。
然而,當(dāng)面對巨大的蛋白質(zhì)復(fù)合體時,人工智能卻步履維艱。直到現(xiàn)在,在一項令人費解的技術(shù)中,一種新的算法破譯了遺傳的核心結(jié)構(gòu)--這是由大約1000種蛋白質(zhì)組成的巨大復(fù)合體,幫助將DNA指令傳遞給細胞的其他部分。該人工智能模型建立在深度學(xué)習(xí)(DeepMind)的AlphaFold模型和美國華盛頓大學(xué)大衛(wèi)·貝克博士實驗室的RoseTTAfold模型的基礎(chǔ)上,這兩個模型都已向公眾發(fā)布,以供進一步實驗。
我們的基因被安置在一個類似行星的結(jié)構(gòu)中,被稱為細胞核,起到保護的作用。細胞核是一個高度安全的城堡:只有特定的分子被允許進出,將DNA指令傳遞給外部世界。例如,傳遞給細胞中的蛋白質(zhì)制造工廠,將基因指令轉(zhuǎn)化為蛋白質(zhì)。
調(diào)節(jié)這種交通的核心是核孔復(fù)合體,或稱NPCs。它們就像極其復(fù)雜的吊橋,嚴(yán)格監(jiān)控分子信使的進出。在生物學(xué)教科書中,NPC通??雌饋硐顸c綴在地球上的成千上萬個卡通式的坑洞。在現(xiàn)實中,每個NPC是一個巨大的、復(fù)雜的、甜甜圈形狀的建筑奇跡,也是我們身體中最大的蛋白質(zhì)復(fù)合體之一。
為什么要關(guān)注NPC?就像處理一個巨大的拼圖,解決NPC結(jié)構(gòu)本身就很有意義。而且因為它們指揮著如何將DNA信息傳遞給細胞的其他部分,NPC對于基因治療、mRNA類型的疫苗、CRISPR以及我們尚未想象到的其他潛在的基因治療是至關(guān)重要的。
結(jié)構(gòu)之謎
“核孔”聽起來像是護膚視頻中的東西。但對于細胞生物學(xué)家來說,它們是一個長達數(shù)十年的謎團。
美國國立衛(wèi)生研究院(NIH)前院長弗朗西斯-柯林斯博士解釋說道:
核孔對生命來說至關(guān)重要。
我們的DNA鏈蜷縮在一個蛋白質(zhì)軸上。然后它們被封存在細胞核內(nèi),這使DNA免受潛在的有害化學(xué)物質(zhì)、病毒或其他垃圾的侵害。想象一下用雙層保鮮膜包裹甜甜圈--這就是核膜?,F(xiàn)在在保鮮膜上打幾個洞--那就是NPC。
這些看似簡單的 "孔洞 "是細胞中遺傳控制的關(guān)鍵守門員。我們的細胞通過將DNA代碼轉(zhuǎn)化為蛋白質(zhì)來構(gòu)建物理組織或控制基本的生物功能,譬如告訴細胞何時分裂或死亡,平衡新陳代謝,以及抵御病毒入侵者。
但DNA被封存在細胞核內(nèi)。數(shù)以百計的蛋白質(zhì)信使需要進入細胞核的密室內(nèi),將DNA指令轉(zhuǎn)錄為mRNA,并將其送回細胞的蛋白質(zhì)制造工廠。每一次運行都必須經(jīng)過NPCs--它們在一個結(jié)構(gòu)中充當(dāng)守衛(wèi)和通道。
科學(xué)家們長期以來一直在尋求解碼NPC結(jié)構(gòu),使用生物化學(xué)的“魔法”來篡改其正常功能,或用X射線來掃描其結(jié)晶結(jié)構(gòu)。這項工作是十分艱苦的。從這些數(shù)據(jù)中,科學(xué)家們發(fā)現(xiàn)有兩種主要類型的蛋白質(zhì)組成安全門。
第一種類型建立了門控支架。這些蛋白質(zhì)被稱為NUPs(核蛋白),以標(biāo)簽形式排列在隧道內(nèi)。第二種類型像活性干墻泥。這些蛋白質(zhì)要靈活得多,沿著支架蛋白涂抹,并延伸到中央通道,在那里它們可以抓住貨物,幫助它向前移動。
由近1000種蛋白質(zhì)組成的NPC結(jié)構(gòu)形成了大約30個不同的 "碼頭",由于它們是動態(tài)變化的,所以很難攻克。例如,多種蛋白質(zhì)作為相互連接的鉸鏈,可以改變孔隙的配置或大小。
馬克斯-普朗克生物物理研究所的Gerhard Hummer博士和Martin Beck博士以及歐洲分子生物學(xué)實驗室的Jan Kosinski博士領(lǐng)導(dǎo)的研究小組解釋道:
【由于整個結(jié)構(gòu) “緊密地包裹”著核膜,NPCs不能被孤立地研究。到目前為止,即使采用最先進的生化手段,科學(xué)家也只解決了NPC結(jié)構(gòu)的46%?!?/strong>
“?這就像你拆解和重新組裝一個電子設(shè)備時一樣??倳粝乱恍┞萁z,而你就是不知道它們應(yīng)該在哪里。但多虧了人工智能,我們終于設(shè)法裝好了大部分,現(xiàn)在,我們清楚地知道它們在哪里,它們做什么,以及如何做。”?Kosinski說到。
進入人工智能
該團隊首先開發(fā)并改進了一種用于分析NPC的流行方法,即冷凍ET分析。該方法在2015年聲名鵲起,當(dāng)時它將細胞結(jié)構(gòu)解析到了近原子尺度。該團隊解釋說,解決NPC結(jié)構(gòu)的問題之一是缺乏以前數(shù)據(jù)集的分辨率。在這里,他們收集了一個比之前嘗試的 "大約五倍大的數(shù)據(jù)集",并使用一種新的計算方法來分析數(shù)據(jù)。
通過觀察新繪制的地圖,研究小組可以區(qū)分核膜--或DNA "包裹物"——當(dāng)它處于收縮狀態(tài)與更放松的狀態(tài)時的區(qū)別。深入研究后,研究小組利用AlphaFold和RoseTTAfold來預(yù)測一套全面的NPC蛋白質(zhì)模型。這對組合工作的很順利--該分析可以對大多數(shù)核蛋白進行建模,且具有較高的可信度,并與來自傳統(tǒng)顯微鏡分析方法的數(shù)據(jù)相匹配。
然后,困難的部分來了。就像船廠的碼頭一樣,NPCs與蛋白質(zhì)的運輸方式高度相關(guān),而這些交通方式往往很難在三維中建模。利用他們的模型,該團隊將蛋白質(zhì)鏈接器的 "錨點 "映射到NPC主通道上。進一步的建模為鏈接器如何連接建立了一個 "谷歌地圖"。就像一個組織良好的船廠,每一個都有助于維護NPC的結(jié)構(gòu)。
破解遺傳的核心
使用人工智能解決蛋白質(zhì)結(jié)構(gòu)問題被譽為十年來的突破性進展。這項研究是首次展示該算法在混亂、復(fù)雜、真實環(huán)境中的強大功能的研究之一。
貝克說:“ 這項工作體現(xiàn)了在未來,結(jié)構(gòu)生物學(xué)將如何擁抱細胞生物學(xué),為在細胞不同部分執(zhí)行不同功能的越來越大的分子組合創(chuàng)建原子模型?!?
這場革命已經(jīng)在路上了。在同一期雜志中,由哈佛大學(xué)醫(yī)學(xué)院的吳昊博士領(lǐng)導(dǎo)的另一個團隊將顯微鏡成像與AlphaFold相結(jié)合,利用非洲爪蛙(Xenopus laevis)的卵解決了NPC的部分結(jié)構(gòu),非洲爪蛙是生化研究中的寵兒。
但人工智能還不能解決所有問題。正如沒有參與研究的麻省理工學(xué)院的托馬斯-施瓦茨博士指出的那樣,NPC是改變其結(jié)構(gòu)的生物。例如,當(dāng)它們愉快地依偎在核膜內(nèi)時,它們的通道往往更寬,而當(dāng)它們被拉出來放在顯微鏡下研究時則不然。換句話說,蛋白質(zhì)復(fù)合體是很難破譯和控制的。但人工智能是站在我們這邊的。
麻省理工學(xué)院的托馬斯-施瓦茨博士談道:
我們現(xiàn)在可以考慮建立一個完整的NPC動態(tài)模型,以原子細節(jié)模擬核運輸。隨著基于人工智能的蛋白質(zhì)預(yù)測工作的開展,更令人興奮的是接下來要做的事情。
總結(jié)
雄激素受體(以下簡稱AR)是一種細胞核受體,支配著前列腺發(fā)育和維持男性表型所需的基因表達程序。晚期前列腺癌會伴隨AR過度激活和轉(zhuǎn)錄組擴增,一部分原因是由于的AR過表達以及與腫瘤蛋白輔助因子的相互作用引起的。AR是如何與輔助因子相互作用并結(jié)合DNA的機制一直是長期未解決的重大問題,利用單顆粒冷凍電鏡技術(shù),我們成功獲得了AR與DNA結(jié)合的三種不同構(gòu)象,結(jié)構(gòu)顯示,AR形成非專性二聚體,這一類類固醇受體利用包埋的二聚體界面來促進合作DNA結(jié)合。
我們發(fā)現(xiàn)了在雄激素不敏感綜合征中受到損害的全新別構(gòu)表面,并通過雄激素受體的腫瘤蛋白輔助因子ERG和DNA結(jié)合模體進行驗證。最后,我們的實驗證據(jù)表明,這種可塑的二聚體界面可能是以犧牲DNA結(jié)合為代價來實現(xiàn)反激活的。我們的工作強調(diào)了雄激素受體協(xié)同互作的微調(diào)影響了生長和疾病的結(jié)果。
相關(guān)文獻:
In Its Greatest Biology Feat Yet, AI Unlocks the Complex Proteins Guarding Our DNA
構(gòu)建核孔復(fù)合體

2016年(左)和2022年(右)核孔復(fù)合體的已知結(jié)構(gòu)比較。
顯示了橫截面(外部圖像)和自上而下的視圖(中心)
新解析的部分用橙色和黃色描述。
ILLUSTRATION: V. ALTOUNIAN/SCIENCE;?
PDB DATA: ANDRé HOELZ AND MARTIN BECK
核孔復(fù)合體(NPCs),每一個都由約1000個蛋白亞單位組成,是嵌入核膜的通道,調(diào)節(jié)真核細胞的細胞核和細胞質(zhì)之間的大分子運輸。除了協(xié)調(diào)運輸,NPC還組織基本的細胞核和細胞質(zhì)過程,如轉(zhuǎn)錄、mRNA成熟、剪接體和核糖體組裝。這些不同的作用使NPC成為疾病相關(guān)的突變和宿主-病原體相互作用的熱點。
在低分辨率顯示完整核孔的結(jié)構(gòu)和高分辨率顯示核孔組件結(jié)構(gòu)的基礎(chǔ)上,核孔已逐漸成為焦點。然而,利用這些信息來正確地組裝30多種不同蛋白質(zhì)的副本并建立一個高分辨率的三維結(jié)構(gòu)一直是一個艱巨的挑戰(zhàn)。在這里,《Science》雜志發(fā)表了三篇論文,將這個巨大的拼圖拼湊在一起,揭示了龐大的人類NPC的近乎原子學(xué)的畫面。這些研究建立在幾十年來生化重組、X射線晶體學(xué)、質(zhì)譜學(xué)、誘變和細胞生物學(xué)的艱苦工作之上;使用了大幅改進的整個人類NPC的低溫電子斷層掃描重建;并利用人工智能來準(zhǔn)確模擬各組成部分。還有兩項研究提高了單顆粒冷凍電鏡的分辨率,使脊椎動物NPC中的二級結(jié)構(gòu)元素和殘基級細節(jié)得以可視化。
所揭示的分子裝配豐富了我們對脊椎動物和人類NPC構(gòu)造的理解——從核心支架到將各部分固定在一起的連接蛋白,以及從核膜錨定到中央運輸通道上方的細胞質(zhì)絲。
這里展示的工作代表了實驗結(jié)構(gòu)生物學(xué)的勝利,在我們尋求了解大分子集合體的構(gòu)造和設(shè)計原理中強突出了正在進行的分辨率革命的作用。
? "Building the nuclear pore complex"? ?Vol 376, Issue 6598; pp. 1172-1173
水木未來·視界丨iss. 22
www.shuimubio.com