用一個蛋白叩開uniprot的大門——uniprot入門手冊
在蛋白質(zhì)組學(xué)研究中,通過對細(xì)胞、組織或器官的蛋白質(zhì)分析鑒定明確蛋白質(zhì)在不同物種中發(fā)揮的功能以及蛋白質(zhì)間的相互作用關(guān)系。而當(dāng)你僅僅知道一個蛋白質(zhì)名稱的時候,如何才能知道這個蛋白質(zhì)存在于什么物種的、什么細(xì)胞內(nèi)、它的作用是什么、結(jié)構(gòu)是什么、以及與它有相互作用的蛋白質(zhì)是哪些?
今天就讓我們用一個蛋白打開uniprot的大門,通過Uniprot數(shù)據(jù)庫來剖析一個蛋白吧!
uniprot數(shù)據(jù)庫
uniprot(The Universal Protein Resource)蛋白質(zhì)數(shù)據(jù)庫是一個整合了EBI(European Bioinformatics Institute),SIB(the Swiss Institute of Bioinformatics),PIR(Protein Information Resource)三大數(shù)據(jù)庫的資源。目前國際上序列數(shù)據(jù)較完整、注釋信息較豐富的蛋白質(zhì)序列數(shù)據(jù)庫。
以蛋白HLA-A為例,可以通過uniprot數(shù)據(jù)庫查詢該蛋白的具體信息,具體步驟為:
在搜索框內(nèi)輸入蛋白名,點擊Search得出的界面如下(圖1):
圖1 | 蛋白HLA-A搜索結(jié)果
1、為搜索框,可用關(guān)鍵詞進(jìn)行檢索,點擊搜索框左側(cè)可選取所需的搜尋范圍和側(cè)重的搜尋結(jié)果。
2、表示序列類型,Swiss-Prot是經(jīng)過人工注釋、審核過的序列,TrEMBL是由核苷酸數(shù)據(jù)庫注釋為蛋白質(zhì)編碼區(qū)的序列自動翻譯而成,未經(jīng)人工審核。
3、表示篩選條件,可根據(jù)物種、關(guān)鍵詞等篩選蛋白。
4、為搜尋結(jié)果,這一部分可選擇自己需要進(jìn)行編輯保存,之后所選內(nèi)容便會在搜索結(jié)果界面顯示(如圖2)。
圖2 | 搜尋結(jié)果顯示內(nèi)容設(shè)置界面
圖3 | BLAST方法
也可將查詢到的序列下載到本地,可選擇不同的數(shù)據(jù)類型(圖4):
圖4 | 搜索結(jié)果下載方法
對蛋白的詳細(xì)分析
圖5 | 蛋白P04439詳細(xì)內(nèi)容頁
1、該蛋白的基礎(chǔ)信息,具體包括該蛋白的登記信息(蛋白名、基因名、物種、是否經(jīng)過人工審核、蛋白質(zhì)相關(guān)信息質(zhì)量評分等)、出版發(fā)表的文章信息等。
2、蛋白信息對應(yīng)的條目名稱,可以根據(jù)需求選擇。
3、條目的詳細(xì)內(nèi)容,點擊條目名稱則會出現(xiàn)對該部分內(nèi)容的解釋(圖6):
圖6 | 以“Function”為例的條目內(nèi)容解釋
研究目的不同便會注重不同的條目,在這里我們重點解釋以下幾個部分:
1、Function部分描述該蛋白在物種內(nèi)發(fā)揮的功能、活性位點以及其GO三大層面——分子功能(Molecular Function,MF )、細(xì)胞組分(Cellular Component ,CC)、生物過程(Biological Process ,BP)的功能等,這一部分主要是生物學(xué)知識(圖7)。
圖7 | Function部分具體內(nèi)容
2、Names & Taxonomy部分提供蛋白名、基因名、NCBI物種分類編碼及分類譜系以及該蛋白在其他數(shù)據(jù)庫的ID(圖8)。
圖8 | 蛋白HLA-A搜索結(jié)果
3、Subcellular location 可了解該蛋白的亞細(xì)胞定位,附帶亞細(xì)胞結(jié)構(gòu)圖,注釋該蛋白存在的位置以及GO注釋信息(圖9)。
圖9 | Subcellular location 部分具體內(nèi)容
4、Pathology & Biotech提供與該蛋白質(zhì)相關(guān)的疾病和表型信息,包括與遺傳變異相關(guān)的疾病信息、發(fā)生變異的位點等(圖10)。
圖10 | Pathology & Biotech部分具體內(nèi)容
5、PTM / Processing這部分內(nèi)容針對蛋白的氨基酸序列,分析翻譯后修飾特征。展現(xiàn)在不同位點的轉(zhuǎn)錄后修飾及加工信息,提供了信號肽、二硫鍵、磷酸化位點等信息。除此之外還提供了其他蛋白質(zhì)組數(shù)據(jù)庫的鏈接,可查看質(zhì)譜實驗的結(jié)果(圖11)。
圖11 | PTM / Processing部分具體內(nèi)容
6、Interaction提供有關(guān)蛋白質(zhì)四級結(jié)構(gòu)以及與其他蛋白質(zhì)或蛋白質(zhì)復(fù)合物相互作用的信息,其中詳細(xì)描述該蛋白與其他蛋白如何發(fā)生作用?在這一部分可關(guān)注String數(shù)據(jù)庫提供的數(shù)據(jù),可用作蛋白互作網(wǎng)絡(luò)分析(圖12)。
圖12 | Interaction部分String數(shù)據(jù)庫鏈接
7、Structure提供有關(guān)蛋白質(zhì)三維結(jié)構(gòu)的圖形,可交互操作改變?nèi)S結(jié)構(gòu)方向以及大??;而二級結(jié)構(gòu)不同顏色的標(biāo)注解釋了在相應(yīng)的位點氨基酸序列的形態(tài)。
圖13 | 蛋白的三維結(jié)構(gòu)圖形
圖14 | 蛋白的二維結(jié)構(gòu)標(biāo)注
在這一部分中還提供了蛋白質(zhì)詳細(xì)的家族分類、對同源蛋白和系統(tǒng)發(fā)生關(guān)系進(jìn)行分析、蛋白質(zhì)序列、序列的分析工具以及列出該蛋白到其他數(shù)據(jù)庫的鏈接。每一個部分的使用方法和代表的意義在uniprot中都有完整的解釋,我們可以根據(jù)需求進(jìn)行篩選。
Uniprot數(shù)據(jù)庫作為目前世界上序列最多、注釋信息最完整的數(shù)據(jù)庫,可以說它不僅為蛋白質(zhì)的研究提供數(shù)據(jù)支持,更是為生命科學(xué)領(lǐng)域提供了寶貴的資源。本文所講的知識點在uniprot數(shù)據(jù)庫中僅為滄海一粟,更多有用的知識和技能只有你打開uniprot才能知道。
歡迎百度搜索鹿明生物——訪問鹿明生物官網(wǎng)——了解多組學(xué)技術(shù)
猜你還想看
1、干貨 | METLIN:一個強(qiáng)大的代謝物鑒定及查詢的數(shù)據(jù)庫
2、蛋白研究常用數(shù)據(jù)庫 | UniProt數(shù)據(jù)庫介紹及使用說明
3、百萬立項計劃 | 突破代謝組學(xué)化合物鑒定技術(shù)瓶頸:標(biāo)品庫管理背后的故事
4、導(dǎo)師給你推薦了嗎?歷隔4年,HMDB數(shù)據(jù)庫5.0版強(qiáng)勢來襲!
END本文系鹿明生物原創(chuàng)