單細(xì)胞測序流程(三):單細(xì)胞計數(shù)矩陣的生成
爾云間 一個專門做科研的團(tuán)隊
歡迎點贊+收藏+關(guān)注

上一期小果跟大家嘮了單細(xì)胞測序的建庫流程,那么這一回,咱們來嘮嘮單細(xì)胞計數(shù)矩陣的生成。
上回書說到,在建庫時,單細(xì)胞測序通過barcode區(qū)分來源不同細(xì)胞的RNA序列,但是在同一個細(xì)胞中,同一基因可能會產(chǎn)生多次轉(zhuǎn)錄,而PCR步驟也會產(chǎn)生重復(fù)讀取。為了區(qū)分reads是來源于生物擴增還是PCR擴增,scRNA-seq采用在PCR擴增前在cDNA序列上引入UMI標(biāo)記,確定單個cDNA擴增過程中產(chǎn)生的拷貝數(shù)。因此scRNA-seq的數(shù)據(jù)處理有以下幾種可能
相同轉(zhuǎn)錄本但UMI不同的reads來源于同一細(xì)胞不同的分子,屬于生物學(xué)重復(fù),每個reads都應(yīng)當(dāng)被計算。
具有相同UMI的reads來源于同一分子的PCR重復(fù),應(yīng)當(dāng)被即為單個reads。
如圖所示,ATCB應(yīng)當(dāng)被記為單詞reads,而ARL1應(yīng)當(dāng)分別計數(shù)。

了解UMI的原理,有利于我們了解scRNA-seq如何在細(xì)胞水平上進(jìn)行量化。
在了解了UMI和barcode是如何區(qū)分不同細(xì)胞和不同分子后,接下來咱們來了解以下scRNA-seq的工作流程。
工作流程步驟為:
計數(shù)矩陣的生成:formating reads, demultiplexing samples, mapping and quantification
原始計數(shù)矩陣的質(zhì)控:過濾劣質(zhì)細(xì)胞
聚類:基于轉(zhuǎn)錄活性的相似性對細(xì)胞進(jìn)行聚類(細(xì)胞類型?類似于?不同的clusters)
marker鑒定和簇注釋:識別每個簇的marker并注釋已知的細(xì)胞類型簇。
工作流程如下圖所示:

當(dāng)然,無論進(jìn)行什么分析,基于不同條件的單個樣本得出的關(guān)于總體的結(jié)論都是不可信的。若想得到可靠的結(jié)論,仍然需要生物重復(fù)!也就是說,如果您想得出與總體相對應(yīng)的結(jié)論,請做生物學(xué)重復(fù)。
在完成了測序后,原始測序數(shù)據(jù)一般輸出為BCL或FASTQ格式。如果reads是BCL格式,可以使用cellranger的mkfastq工具將BCL轉(zhuǎn)換為FASTQ格式。
在得到FASTQ文件后,使用cell ranger軟件進(jìn)行數(shù)據(jù)的質(zhì)控和定量,可以通過下圖的細(xì)胞基因計數(shù)矩陣探索和過濾數(shù)據(jù),輸出的csv文件就可以使用R的seurat包進(jìn)行下游分析啦。

下一回就到了激動人心的實操環(huán)節(jié)啦,不要走開,后續(xù)更精彩喲。
小果今天的分享就到這里,歡迎大家和小果一起討論學(xué)習(xí)哦!我們下期再見~

“生信果”,生信入門、R語言、生信圖解讀與繪制、軟件操作、代碼復(fù)現(xiàn)、生信硬核知識技能、服務(wù)器、生物信息學(xué)的教程,以及基于R的分析和可視化等原創(chuàng)內(nèi)容,一起見證小白和大佬的成長。