生物信息學(xué)一非生信人如何看懂生信圖合集1(1一16)


1.火山圖可以用來展示基因表達的總體差異情況,通常使用紅色表示上調(diào),綠色表示下調(diào),灰色表示無顯著變化。
2.在火山圖中,縱坐標(biāo)p的負(fù)對數(shù),顯著性是指p值小于0.05,p越小,點位置越高。Y=1.3以上的點p<0.05,越上越小
3.倍數(shù)變化被用來判斷基因表達的差異,當(dāng)基因表達的變化超過兩倍時,可以定義為差異表達基因。橫坐標(biāo)的fc表示倍數(shù)變化,以≥2來作為標(biāo)準(zhǔn)

1.熱圖,用于展示基因在不同樣本中的表達情況。熱圖由小色塊構(gòu)成的數(shù)值矩陣,每個色塊代表一個基因的表達量,顏色越紅表達量越高,越藍表達量越低。tumor指腫瘤樣本,normal指正常樣本
2.聚類分析,聚類分析可以將表達模式相似的樣本歸為一類,通過疊加可以形成層級結(jié)構(gòu),指圖中所示頂部白色線條

3熱圖常常與火山圖一起使用,用來展示差異基因的表達情況
富集分析

1.富集分析,不篩選差異基因,預(yù)定義基因集A(自己想求證某個信號通路中的所有基因),自己的表達數(shù)據(jù)B(根據(jù)fold change基因表達程度排序),然后進行檢驗預(yù)定義基因集A是否在表達數(shù)據(jù)集B的頂端或底端富集或隨機分布,判斷基因集A在表達中的貢獻
2.縱坐標(biāo)ES富集分?jǐn)?shù),指A在B中的頂部或底部過表達程度,富極分?jǐn)?shù)會隨著計算動態(tài)變化,并在最大峰值處達到最大值。根據(jù)富極分?jǐn)?shù)的正負(fù)值可以確定基因的位置,正值表示基因位于排序列表頂部,負(fù)值表示基因位于排序列表底部
3.排序列表橫坐標(biāo)是基因的表達量,一般從大到小排列
4.讀圖,rank文件排在峰值前代表上調(diào),峰值后代表下調(diào),NES是負(fù)值代表基因富集在底端,底端小于峰值,故該通路趨勢下調(diào)。
FDRq越小,假陽性越低,,p值越準(zhǔn)確
