讀懂聚類熱圖與PCA圖譜
爾云間? 一個(gè)專門(mén)做科研的團(tuán)隊(duì)
? ? ?

在使用GEO數(shù)據(jù)進(jìn)行免疫細(xì)胞經(jīng)潤(rùn)分析時(shí),經(jīng)常需要做一些相關(guān)性圖來(lái)檢驗(yàn)組間樣本的相關(guān)程度是否顯著,往往有時(shí)候作圖不會(huì)遇到問(wèn)題,但是對(duì)于得到的圖譜讀不懂其中的含義,這就需要去提高讀圖能力,這里就選用了兩張圖譜來(lái)學(xué)習(xí)下:
1.?聚類熱圖

在本圖中,橫縱標(biāo)軸表示:樣本名稱;縱坐標(biāo)軸表示:不同的細(xì)胞;右上角的Expression中藍(lán)色表示表達(dá)量低,紅色表示表達(dá)量高;Group表示分兩組,分別是tumor與normal組;左邊的聚類樹(shù)是表示縱坐標(biāo)軸中細(xì)胞的聚類情況。
圖中可以看出來(lái)自同一分組的不同樣本在同一類型細(xì)胞中的表達(dá)量是相近的,來(lái)自不同分組不同類型細(xì)胞在不同的樣本的樣本中表達(dá)不同。
2.?PCA圖

PCA是主成分分析(Principle Component Analysis,PCA),是一種數(shù)據(jù)降維算法,利用它可以幫助我更好地從多個(gè)維度去分析數(shù)據(jù)之間的相關(guān)性,至于PCA原理的實(shí)現(xiàn)在這里我們不展開(kāi)描述。
PCA1和PCA2可以看成是數(shù)據(jù)降維為后形成不同維度的矩陣在空間中的名稱,(50.30%)和(9.56%)表示主成分的貢獻(xiàn)率;橫縱坐標(biāo)軸的數(shù)值表示載荷系數(shù)范圍,其中帶“-”表示變量與數(shù)據(jù)變化的主成分之間的關(guān)系是負(fù)的,不帶“-”變量與數(shù)據(jù)變化的主成分之間的關(guān)系是正的;紅色原點(diǎn)代表腫瘤組的變量,藍(lán)色正方形代表正常組的變量;紅色和藍(lán)色線是趨勢(shì)線。
通過(guò)圖中可以看到,紅色和藍(lán)色線各自圈住的區(qū)域,說(shuō)明它們各自組中樣本之間比較聚集,在各自組中重復(fù)較好,數(shù)據(jù)相似性高,反之,就是各自組中樣本之間比較離散,在各自組重復(fù)性過(guò)低,相似性較低,紅色和藍(lán)色線圈住的共有區(qū)域,說(shuō)明這些樣本在兩個(gè)組中重復(fù)性好,相似性高。

推薦閱讀
關(guān)注小果,小果將會(huì)持續(xù)為你帶來(lái)更多生信干貨哦。

生信果
生信入門(mén)、R語(yǔ)言、生信圖解讀與繪制、軟件操作、代碼復(fù)現(xiàn)、生信硬核知識(shí)技能、服務(wù)器等
原創(chuàng)內(nèi)容