10X單細(xì)胞轉(zhuǎn)錄組測(cè)序—常規(guī)流程
文章中其中用到的文件獲取方式https://pan.baidu.com/s/1HCsHRXNX9Il8u8RIPXSEug?pwd=2626
1.上游分析
1.1 安裝conda、sratoolkit、cellranger
1.2 使用conda進(jìn)行常用軟件安裝
1.3 參考基因組下載
1.4 文件夾創(chuàng)建
1.5 數(shù)據(jù)下載
1.6?SRA轉(zhuǎn)fastq
1.7 cellranger count流程
1.8 結(jié)果解讀
web_summary.html:必看,官方說明 summary HTML file ,包括許多QC指標(biāo),預(yù)估細(xì)胞數(shù),比對(duì)率等;
metrics_summary.csv:CSV格式數(shù)據(jù)摘要,可以不看;
possorted_genome_bam.bam:比對(duì)文件,用于可視化比對(duì)的reads和重新創(chuàng)建
FASTQ
文件,可以不看;possorted_genome_bam.bam.bai:索引文件;
filtered_gene_bc_matrices:是重要的一個(gè)目錄,下面又包含了 barcodes.tsv.gz、features.tsv.gz、matrix.mtx.gz,是下游Seurat、Scater、Monocle等分析的輸入文件,是經(jīng)過
Cell Ranger
過濾后構(gòu)建矩陣所需要的所有文件;filtered_feature_bc_matrix.h5:過濾掉的barcode信息HDF5 format,可以不看;
raw_feature_bc_matrix:原始barcode信息,未過濾的可以用于構(gòu)建矩陣的文件,可以不看;
raw_feature_bc_matrix.h5:原始barcode信息HDF5 format,可以不看;
analysis:數(shù)據(jù)分析目錄,下面又包含聚類clustering(有g(shù)raph-based & k-means)、差異分析diffexp、主成分線性降維分析pca、非線性降維tsne,因?yàn)槲覀冏约簳?huì)走Seurat流程,所以不用看;
molecule_info.h5:可用于整合多樣本,使用
cellranger aggr
函數(shù);cloupe.cloupe:官方可視化工具Loupe Cell Browser?輸入文件,無代碼分析的情況下使用,會(huì)代碼的同學(xué)通常用不到。
將所有結(jié)果中的filtered_gene_bc_matrices文件夾保存在自己電腦output文件夾下,進(jìn)行下游分析
2. 下游分析
2.1 R包安裝、加載
2.2 數(shù)據(jù)讀取過濾
2.3 標(biāo)準(zhǔn)化
2.4 尋找高變基因
2.5 (可選)可通過以下方法修改組織樣本信息
2.6 細(xì)胞周期分析
2.7 PCA分析
2.8 非線性降維
2.9 分析各亞群的marker基因
2.10 singleR 預(yù)測(cè)亞群名稱
