Seurat RunPCA報(bào)錯(cuò)?小果教大家,遇到報(bào)錯(cuò)不要怕
爾云間? 一個(gè)專門做科研的團(tuán)隊(duì)
歡迎點(diǎn)贊+收藏+關(guān)注
生信人R語言學(xué)習(xí)必備
立刻擁有一個(gè)Rstudio賬號(hào)
開啟升級(jí)模式吧
(56線程,256G內(nèi)存,個(gè)人存儲(chǔ)1T)

各位小伙伴們,大家好呀,我是你們的老朋友小果,最近小果在分析單細(xì)胞數(shù)據(jù)時(shí)遇到了一個(gè)問題,在這里和大家分享一下呀。

首先小果從10x Genomics支持網(wǎng)站上的一個(gè)公開數(shù)據(jù)集下載FASTQ文件。這是來自人類外周血單個(gè)核細(xì)胞(PBMC)的1,000個(gè)PBMC數(shù)據(jù)集,包括淋巴細(xì)胞(T細(xì)胞、B細(xì)胞和NK殺傷細(xì)胞)和單核細(xì)胞。
下載代碼為:
此數(shù)據(jù)集大小為5.17G,不是很大,大概幾分鐘就可以下載完成嘍。
之后對(duì)此壓縮文件進(jìn)行解壓。因?yàn)檫@是一個(gè)tar文件而不是tar.gz文件,所以不需要使用-z參數(shù)來提取它。
代碼:
使用cellranger進(jìn)行定量后,得到三個(gè)文件夾如下所示:

小果以此三個(gè)文件夾作為輸入文件,進(jìn)行seurat的分析。
在進(jìn)行下游分析時(shí)遇到一個(gè)問題,數(shù)據(jù)縮放之后進(jìn)行PCA線性降維,代碼如下,出現(xiàn)下圖的錯(cuò)誤。

我們可以發(fā)現(xiàn),主要問題是RunPCA過程出現(xiàn)錯(cuò)誤,導(dǎo)致流程中斷。發(fā)現(xiàn)報(bào)錯(cuò)提示:最大的npcs必須嚴(yán)格遵循小于最小行列數(shù)的規(guī)則。

npcs必須要小于最小行列數(shù),默認(rèn)情況下npcs = 50,scdata查看矩陣行列數(shù),發(fā)現(xiàn)最小值為30,將其改為29后,可以成功運(yùn)行。
這邊小果總結(jié)一下:
1.在學(xué)習(xí)某個(gè)軟件或者某個(gè)包的使用時(shí),我們可以詳細(xì)查看每一個(gè)函數(shù)的使用手冊(cè),了解函數(shù)的原理、功能以及每個(gè)參數(shù)的作用,這樣在我們之后實(shí)際操作過程中也比較方便快捷。
2.在遇到問題時(shí),我們要仔細(xì)查看報(bào)錯(cuò)內(nèi)容,根據(jù)報(bào)錯(cuò)提示找尋答案。

在做數(shù)據(jù)分析時(shí),不可避免的會(huì)遇到降維分析,在這里小果給大家推薦一個(gè)做降維分析非常方便的小工具:PCA-UMAP和tSNE降維分析(http://www.biocloudservice.com/794/794.php),可以在線網(wǎng)頁運(yùn)行,運(yùn)行速度很快,大家可以用起來哦。
大家遇到問題,歡迎來和小果討論呀。

“生信果”,生信入門、R語言、生信圖解讀與繪制、軟件操作、代碼復(fù)現(xiàn)、生信硬核知識(shí)技能、服務(wù)器、生物信息學(xué)的教程,以及基于R的分析和可視化等原創(chuàng)內(nèi)容,一起見證小白和大佬的成長(zhǎng)。