10X單細(xì)胞轉(zhuǎn)錄組測(cè)序—resolution確定
在進(jìn)行單細(xì)胞降維分析時(shí),resolution
值的確定會(huì)影響亞群數(shù)的多少,但最開(kāi)始分析的時(shí)候不知道亞群數(shù)最佳為多少,可通過(guò)一些分析結(jié)果進(jìn)行確定。
10X單細(xì)胞轉(zhuǎn)錄組測(cè)序—常規(guī)流程 - 嗶哩嗶哩 (bilibili.com)
獲取PCA分析后的結(jié)果
P值分析
通過(guò)p值分析,確定最多降維出多少個(gè)亞群是可信的。參數(shù)dims可設(shè)置最大(最大為PCA分析時(shí)參數(shù)npcs
值的大小,默認(rèn)為30)。
作出的圖中有一條虛線(xiàn),只要實(shí)線(xiàn)在虛線(xiàn)之上就認(rèn)為是可信的。若實(shí)現(xiàn)太靠上或太靠下,顯得不美觀,可調(diào)整ymax值的大小。
可通過(guò)碎石圖初步確定亞群數(shù)
通過(guò)人為確定拐點(diǎn)來(lái)確定分組數(shù)
樹(shù)形圖確定
不能確定resolution
就設(shè)置一系列resolution
值進(jìn)行篩選
解讀:箭頭的指向代表了一種從屬關(guān)系,每一列代表一種resolution
值,resolution
值從左到右依次增大,每一個(gè)圓圈代表該resolution
值的一個(gè)亞群,箭頭的指向應(yīng)盡量避免雜亂,如果出現(xiàn)兩個(gè)箭頭共同指向同一個(gè)亞群,說(shuō)明降維效果不好,應(yīng)找不出現(xiàn)這種情況的最小resolution
,即當(dāng)前最適合的resolution
,若想繼續(xù)減小resolution
,需要對(duì)降維參數(shù)進(jìn)行優(yōu)化。
優(yōu)化思路
數(shù)據(jù)質(zhì)控的好壞會(huì)影響降維的好壞。可根據(jù)我寫(xiě)的文章10X單細(xì)胞轉(zhuǎn)錄組測(cè)序—常規(guī)流程 - 嗶哩嗶哩 (bilibili.com)中質(zhì)控的方法,調(diào)整各類(lèi)型基因所占比例的闕值,也可以刪除reads數(shù)貢獻(xiàn)較大的基因,也可刪除線(xiàn)粒體,核糖體,血紅蛋白相關(guān)基因。
若沒(méi)有刪除細(xì)胞周期相關(guān)基因,需要進(jìn)行周期分析,回歸掉相關(guān)基因,降低該部分基因?qū)稻S的影響。
若分析的是免疫細(xì)胞,那就可以用相關(guān)的免疫細(xì)胞的marker基因進(jìn)行標(biāo)準(zhǔn)化和降維,例如
cellmarker
數(shù)據(jù)庫(kù)中的基因。在我的文章10X單細(xì)胞轉(zhuǎn)錄組測(cè)序—常規(guī)流程 - 嗶哩嗶哩 (bilibili.com)中都有涉及。標(biāo)準(zhǔn)化和PCA分析時(shí)可將參數(shù)features
設(shè)置成不同的基因集,來(lái)篩選哪種設(shè)置方法最佳。各個(gè)函數(shù)中
dims
參數(shù)的大小也會(huì)影響降維的好壞。
歡迎關(guān)注我的公眾號(hào)「26號(hào)宇宙」,我會(huì)不斷發(fā)布數(shù)據(jù)分析,電腦技巧等相關(guān)的內(nèi)容,你也可以向我提出相關(guān)的問(wèn)題,我會(huì)盡可能地幫你解決。