scran:細(xì)胞表達大數(shù)據(jù)的智能處理工具,助你成為表達分析專家!
爾云間? 一個專門做科研的團隊
? ? ?
歡迎點贊+收藏+關(guān)注

當(dāng)我們拿到一組單細(xì)胞數(shù)據(jù)的矩陣時,如何在處理之前觀察細(xì)胞和基因表達之間的關(guān)系呢?今天小果就帶大家一起來看一下!

1、生成數(shù)據(jù)矩陣
今天我們用到的數(shù)據(jù)仍然來自于scRNAseq包中的細(xì)胞集哦!數(shù)據(jù)矩陣的生成方法小果已經(jīng)給大家準(zhǔn)備好啦!一起來看一下吧!
使用R語言中的View()函數(shù)可以直接查看我們生成的數(shù)據(jù)矩陣哦,我們一起來看一下。

2、探索基因表達情況
在探索基因表達情況,具體時從哪些角度來看呢?小果在這里給大家體共兩種思路:
1.統(tǒng)計某個基因在多少個細(xì)胞中得到表達;
2.統(tǒng)計一個細(xì)胞中表達了多少個基因;
那么要從這兩個角度去探索,分別要如何去統(tǒng)計呢?快調(diào)動你聰明的小腦袋!如果想不到也沒關(guān)系,今天小果手把手教你完成!

o?統(tǒng)計所有基因表達成功的細(xì)胞個數(shù)
對于基因表達成功的細(xì)胞個數(shù),我們需要用apply函數(shù)統(tǒng)計數(shù)據(jù)矩陣中每一行元素中對應(yīng)值大于0的個數(shù),接下來我們進行統(tǒng)計并繪制箱線圖觀察整體表達情況。和小果一起來看看吧!
fivenum(apply(counts,1,function(x) sum(x>0) ))#統(tǒng)計所有基因表達成功細(xì)胞個數(shù)中的五個指標(biāo)
boxplot(apply(counts,1,function(x) sum(x>0) ))#繪制箱線圖

得到以上的箱線圖后,小果來給大家做一個簡單的解讀吧!由箱線圖的中位線可以看出,基因表達成功的細(xì)胞數(shù)的中位數(shù)值大概在3個左右,表達細(xì)胞數(shù)的閾值大概在35左右,即說明如果基因在35個細(xì)胞內(nèi)不表達就可以直接過濾掉哦。
o?統(tǒng)計所有細(xì)胞表達了的基因個數(shù)
有了上面的基礎(chǔ),你是否學(xué)會舉一反三了呢?對于細(xì)胞表達了的基因個數(shù),我們同樣使用apply函數(shù)統(tǒng)計數(shù)據(jù)矩陣中的每一列元素中對應(yīng)值大于0的個數(shù)即可,接下來我們用直方分布圖來和大家展示一下整體的表達情況。和小果一起看看吧!
fivenum(apply(counts,2,function(x) sum(x>0) ))#統(tǒng)計所有細(xì)胞表達了基因個數(shù)中的五個指標(biāo)
hist(apply(counts,2,function(x) sum(x>0) )) #繪制直方分布圖

????在分析了箱線圖的統(tǒng)計結(jié)果后,你能否獨立分析直方圖的統(tǒng)計結(jié)果呢?我們還是和小果一起來看一下!
?????由直方分布圖的統(tǒng)計結(jié)果可以看出,表達基因個數(shù)在3000~4000之間的細(xì)胞占最多數(shù)量,表達基因個數(shù)在8000以上的細(xì)胞僅有2~3個,占最少的數(shù)量。
?????通過以上兩組統(tǒng)計圖的分析,我們就對基因在細(xì)胞中的表達情況游客整體的把握,怎么樣,今天的小技巧你學(xué)廢了嘛?更多生信技巧請繼續(xù)關(guān)注小果哦!

生信人R語言學(xué)習(xí)必備
立刻擁有一個Rstudio賬號
開啟升級模式吧
(56線程,256G內(nèi)存,個人存儲1T)
“生信果”,生信入門、R語言、生信圖解讀與繪制、軟件操作、代碼復(fù)現(xiàn)、生信硬核知識技能、服務(wù)器、生物信息學(xué)的教程,以及基于R的分析和可視化等原創(chuàng)內(nèi)容,一起見證小白和大佬的成長。