一文了解單細胞RNA測序的可視化與統(tǒng)計分析如何更簡單高效

單細胞RNA測序(scRNA-seq)的出現為探索單細胞水平的基因表達譜提供了前所未有的機會。目前,scRNA-seq已成為研究細胞異質性的關鍵生物學問題(尤其是在腫瘤學和免疫學研究中)的首選。然而,由于它的高維、稀疏性、跨細胞群體的異質性、技術噪音以及缺乏可重復性,它在數據可視化和統(tǒng)計分析方面提出了新的挑戰(zhàn)。

基于下一代測序的基因組學,轉錄組學和表觀基因組學技術現在越來越關注于單個細胞的表征。例如,單細胞RNA測序(scRNA-seq)可以在細胞水平上全面表征轉錄變化,并有助于更好地了解單個細胞在其微環(huán)境中的功能。最近,通過呈現單個免疫細胞的轉錄變化,它已經被用來抗擊COVID-19。
JMP Genomics是JMP產品家族中專為基因組學分析的專業(yè)分析軟件。

JMP Genomics 10中全新的標準化、交互式且可重現的scRNA-seq工作流程,可以賦予科學家們充滿信心地探索scRNA-seq數據。通過數據質量控制(QC),可變基因選擇,稀疏SVD分析,聚類分析,基因重要性篩選,動態(tài)的可視化(例如小提琴圖,山脊線圖和點圖)以及差異基因表達分析幫助用戶通過充分地探索復雜和稀有細胞群體,并檢測跨細胞類型和其他實驗條件之間的基因差異化表達模式。
今天我們就一起看看JMP Genomics 10中全新的scRNA-seq工作流程究竟有哪些強大的功能。
以JMP Genomics 10為平臺?
在今天的案例中,我們以 PBMC數據集為例。

首先,打開JMP Genomics 10菜單Import>Next-Gen Sequencing,以稀疏格式讀取原始UMI計數數據,然后將其轉換為密集格式。?
然后,可以將輸出的密集數據用作基本單細胞RNA-seq工作流程的輸入數據,此工作流程位于Workflows>Basic子菜單。在界面中指定設置后運行后,可以在JMP Project里生成分頁式的報告。

數據概述和質量控制
此工作流程執(zhí)行質量控制步驟以刪除低質量的細胞和基因。Data Overview報告可以幫助你確定需要使用的質量控制標準。

可變基因選擇
處理scRNA-seq數據中的高維度和稀疏性的一種方法是使用那些表現出高細胞間差異的基因。為此,此工作流程提供了兩種可變基因選擇方法,即Dispersion和VST,以幫助你選擇一組高度可變的基因用于后續(xù)分析。
Variable Gene Selection 頁面顯示了方差均值圖,其中,選定的可變基因為紅色。

稀疏SVD分析
然后,工作流將執(zhí)行稀疏SVD分析,以進一步減少數據集的維度和稀疏性,以實現聚類分析和可視化的目的。聚類分析頁面同時提供了2D和3D SVD圖形來展示重要的組成,以幫助你探索數據的全局結構。

聚類分析
scRNA-seq數據分析中的一項重要任務是通過聚類算法識別細胞群體。此工作流程提供了兩種聚類算法:層次聚類和K均值聚類。
在本示例,我們使用層次聚類,它在PBMC數據集中標識了九個細胞群。你還可以通過系統(tǒng)樹圖或星座圖探索聚類。


基于UMAP與t-SNE的可視化
UMAP和t-SNE是scRNA-seq數據探索中經常使用的兩種可視化方法。如果你已將Rtsne和UMAP軟件包安裝到本地R環(huán)境中,則JMP Genomics提供了一個選項,可以通過t-SNE和UMAP可視化聚類的結果。
JMP Genomics還提供了一個名為Feature Switcher的工具,可以幫助你以交互式的方式瀏覽t-SNE和UMAP可視化中的基因表達模式,而無需在硬盤上生成幾十個圖形。如圖7中以UMAP數據集為例的展示。

其他豐富的可視化展示
除了上述的可視化工具外,JMP Genomics還提供了包括小提琴圖、脊線圖和點圖等在內的幾十種圖形,可以讓你動態(tài)交互式地探索各種細胞類型中的基因表達模式,也可以通過“?Recode(重新編碼)”功能基于標記基因列表的表達模式來定義細胞群體。此外,你可以通過到外部數據庫的鏈接檢查有關基因的信息。

基因重要性篩選
盡管可變基因選擇步驟顯著減少了分析中的基因數量,但仍有數千個基因需要探索。因此,JMP Genomics提供了一種使用Bootstrap森林算法的特征篩選方法,以根據基因在細胞群分離中的重要性對基因進行排名。用戶可以選擇前30個基因而非2000個基因進行可視化。
JMP Genomics還提供了一個工具,可以將該基因重要性的列表發(fā)送到GTEx數據庫,以探索其組織特異性表達模式。

基因表達差異化
基因表達差異化分析是從scRNA-seq數據得出有關細胞類型間轉錄變化的統(tǒng)計見解的關鍵步驟。該工作流程集成了JMP Genomics中ANOVA平臺,以使用復雜的混合效應模型執(zhí)行基因差異化表達分析,該模型允許進行復雜的研究設計。
隨著scRNA-seq在生物醫(yī)學研究中的不斷普及,用戶需要一種可重現、交互式且對用戶友好的工作流程,以便從迅速增長的scRNA-seq數據集中快速提取有效信息。
JMP Genomics 10中的全新scRNA-seq工作流程,以及借助于JMP Pro中強大的預測建模功能,以及軟件與R和Python開源軟件包更好的集成,JMP Genomics 10讓你能夠以更加快捷、高效的方式賦予你充滿信心地加速重要的研究。
想體驗JMP Genomics 10中全新的單細胞RNA測序(scRNA-seq)功能,可復制以下鏈接到瀏覽器申請JMP Genomics 10試用評估:https://www.jmp.com/zh_cn/software/genomics-data-analysis-software/jmp-genomics-evaluation.html?td7011U0000009icEQAQ&utm_source=bilibili&utm_medium=social