蛋白質(zhì)組學(xué)的生物信息學(xué)分析:功能注釋和富集分析
功能注釋是將生物學(xué)信息附加到基因或蛋白質(zhì)序列的過程。功能注釋包括三個(gè)主要步驟:
1. 確定基因組中不編碼蛋白質(zhì)的部分;
2. 鑒定基因組中的元素(基因預(yù)測(cè));
3. 給這些元素添加生物學(xué)信息。
功能富集分析確定在大量基因或蛋白質(zhì)中過表達(dá)的基因或蛋白質(zhì)的類別,這些過表達(dá)物質(zhì)可能與疾病表型有關(guān)。統(tǒng)計(jì)法可用于確定顯著富集的基因組。富集分析的一般步驟包括:
1. 計(jì)算p值(該值代表列表中蛋白質(zhì)的過表達(dá));
2. 根據(jù)p值評(píng)估節(jié)點(diǎn)或路徑的統(tǒng)計(jì)顯著性;
3. 歸一化分析每組蛋白質(zhì)的p值,并為多個(gè)假設(shè)檢驗(yàn)計(jì)算錯(cuò)誤發(fā)現(xiàn)率。
Go注釋分析
基因本體(Gene Ontology,GO)統(tǒng)一了所有物種中基因和基因產(chǎn)物屬性的表示形式。Go注釋分析的應(yīng)用范圍包括:
1.整合來(lái)自不同物種的蛋白質(zhì)組學(xué)數(shù)據(jù)
2.對(duì)差異蛋白質(zhì)進(jìn)行分類
3.預(yù)測(cè)特定蛋白質(zhì)結(jié)構(gòu)域
4.識(shí)別涉及某些疾病的基因。
Go富集分析
基因或蛋白質(zhì)集的富集分析:可用于從龐大的數(shù)據(jù)集中探索功能和生物學(xué)意義,例如質(zhì)譜數(shù)據(jù)和微陣列結(jié)果。GO富集分析還有助于組織來(lái)自全新(或完全注釋)基因組的數(shù)據(jù),并比較各進(jìn)化枝成員之間的生物學(xué)功能。
KEGG注釋分析
KEGG是一個(gè)可以系統(tǒng)地分析細(xì)胞中基因產(chǎn)物的代謝途徑以及這些基因產(chǎn)物的功能的數(shù)據(jù)庫(kù)。生物體中,不同的基因產(chǎn)物之間彼此協(xié)調(diào)以執(zhí)行生物學(xué)功能。對(duì)差異表達(dá)基因途徑的注釋分析有助于進(jìn)一步解釋基因的功能。
KEGG富集分析
差異表達(dá)基因的KEGG富集分析可以豐富具有顯著差異的通路,并有助于找到在實(shí)驗(yàn)條件下具有顯著差異的生物調(diào)節(jié)途徑。
COG富集分析
基于全基因組分析,COG可以使用簡(jiǎn)單的基于雙向最佳匹配和三角形約束的搜索方法,準(zhǔn)確地分配大多數(shù)基因的旁系同源物和直系同源物。該方法可以識(shí)別較遠(yuǎn)的同源物和分離密切相關(guān)的同源物?;诩蚁捣治?,該方法可以利用蛋白質(zhì)家族的特征成員的功能將功能分配給整個(gè)蛋白質(zhì)家族,并對(duì)多個(gè)家族的潛在功能進(jìn)行描述。