五分鐘帶你快速上手基因功能注釋
在進(jìn)行基因的差異分析之后,我們需要對(duì)基因的功能進(jìn)行注釋。基因功能注釋的目的是通過(guò)分析基因的序列和結(jié)構(gòu)以及已知的功能和特征信息,來(lái)預(yù)測(cè)和解釋基因的功能和生物學(xué)作用。功能注釋的結(jié)果可以提供關(guān)于基因的功能、參與的生物過(guò)程、細(xì)胞定位、調(diào)控機(jī)制等方面的信息,從而幫助研究者理解基因在生物體中的功能和相關(guān)的生理過(guò)程。
而對(duì)于基因功能的注釋?zhuān)≡葡胍獙で笠环N高效簡(jiǎn)便的方式,經(jīng)過(guò)搜查資料發(fā)現(xiàn),有一種無(wú)需代碼的在線基因功能注釋網(wǎng)站,它就是eggnog-mapper。下面就和小云來(lái)學(xué)習(xí)一下怎么使用吧!
一、eggNOG-Mapper介紹
eggNOG-Mapper是一種常用的基因功能注釋工具,它基于eggNOG數(shù)據(jù)庫(kù)和OrthoDB數(shù)據(jù)庫(kù),并利用這些數(shù)據(jù)庫(kù)中的數(shù)據(jù)和比對(duì)算法來(lái)推斷基因的功能。
其中,eggNOG數(shù)據(jù)庫(kù)是一個(gè)用于進(jìn)化分類(lèi)和基因功能注釋的數(shù)據(jù)庫(kù),它將已知的基因組按照進(jìn)化關(guān)系進(jìn)行分類(lèi),并給每個(gè)分類(lèi)分配一個(gè)evolutionary genealogy of genes: Non-supervised Orthologous Groups (eggNOG)編號(hào),同時(shí)還提供了關(guān)于這些基因的功能注釋信息。
而OrthoDB數(shù)據(jù)庫(kù)則是另一個(gè)用于基因功能注釋的數(shù)據(jù)庫(kù),它主要用于識(shí)別和注釋正交基因組。
二、如何使用eggNOG-Mapper?
首先我們需要打開(kāi)eggNOG-mapper的主頁(yè),即http://eggnog-mapper.embl.de/,如圖所示為該網(wǎng)頁(yè)的信息。

首先第一步,我們會(huì)選擇數(shù)據(jù)的類(lèi)型;在這里,小云選用的是在NCBI下載的穿心蓮的蛋白質(zhì)序列,然后放入步驟二所示的選擇文件框中;最后第三步,則是我們需要輸入接收郵件的email地址(一定要確保該郵箱能夠接受郵件哦?。?/p>
在經(jīng)過(guò)上面的步驟之后,就可以點(diǎn)擊submint按鈕進(jìn)行提交。之后我們可以打開(kāi)接受的郵件,打開(kāi)郵件之后,我們可以看到的信息如下。在這時(shí)候,我們需要點(diǎn)擊1中的Click to manage your job去進(jìn)行管理提交的任務(wù)。否則打開(kāi)2中的鏈接我們會(huì)發(fā)現(xiàn),就會(huì)沒(méi)有基因功能注釋文件的存在。


之后,我們就可以點(diǎn)擊start job的按鈕,啟動(dòng)任務(wù)了,在這里需要等待的時(shí)間大概要十來(lái)分鐘。如何判斷是否完成工作了。這個(gè)時(shí)候,我們可以等待下一封郵件的到來(lái)。

如果已經(jīng)完成比對(duì),并生成注釋文件,這時(shí)候會(huì)收到一封郵件,上面會(huì)注明"finished"、"with status finished"等字樣。打開(kāi)郵件。并且點(diǎn)擊上面2中的Access your job files here按鈕,可以得到out.emapper.annotations文件并下載就行了


接下來(lái),打開(kāi)我們下載的out.emapper.annotations文件,就可以得到相應(yīng)的基因功能注釋信息了啦!

其中以下是out.emapper.annotations文件每個(gè)列的說(shuō)明:
1)query:輸入序列的名稱(chēng)。
2)seed_ortholog:匹配到的種子序列的注釋信息。
3)evalue:輸入序列與種子序列的匹配E-value閾值。
4)score:輸入序列與種子序列的匹配得分。
5)eggNOG_OGs:與輸入序列匹配的EggNOG orthologous groups(OGs)。
6)max_annot_lvl:在輸入序列的注釋中提供的最大注釋級(jí)別。
7)COG_category:Clusters of Orthologous Groups(COG)分類(lèi)。
8)Description:該序列的功能描述。
9)Preferred_name:該序列的首選或標(biāo)準(zhǔn)名稱(chēng)。
10)GOs:Gene Ontology(GO)注釋信息。
11)EC:對(duì)應(yīng)的酶學(xué)注釋號(hào)。
12)KEGG_ko:對(duì)應(yīng)的KEGG Orthology(KO)號(hào)。
13)KEGG_Pathway:KEGG通路信息。
14)KEGG_Module:KEGG模塊信息。
15)KEGG_Reaction:KEGG反應(yīng)信息。
16)KEGG_rclass:KEGG反應(yīng)分類(lèi)信息。
17)BRITE:BRITE功能層次結(jié)構(gòu)注釋。
18)KEGG_TC:KEGG傳輸物質(zhì)分類(lèi)信息。
19)CAZy:碳水化合物活性酶家族注釋信息。
20)BiGG_Reaction:輸入序列與BiGG數(shù)據(jù)庫(kù)中的反應(yīng)匹配的信息。
21)PFAMs:序列中與PFAM數(shù)據(jù)庫(kù)匹配的信息。
好啦!經(jīng)過(guò)一番學(xué)習(xí),是不是感覺(jué)到eggNOG-Mapper的簡(jiǎn)便性了呢!真的就是零代碼就能得到基因功能注釋文件了呢!那么接下來(lái)大家也可以找到自己感興趣的蛋白等去進(jìn)行實(shí)操哦!

