最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

三分鐘教你如何進(jìn)行單細(xì)胞測序數(shù)據(jù)分析

2023-07-25 11:13 作者:爾云間  | 我要投稿

大家好呀!今天小云為大家?guī)砹藛渭?xì)胞測序數(shù)據(jù)分析的干貨,趕快跟隨小云學(xué)起來吧!

(1)數(shù)據(jù)矩陣生成和質(zhì)量控制

單細(xì)胞分析的一項關(guān)鍵技術(shù)進(jìn)步是條形碼(短的核酸片段)的發(fā)展,其允許大規(guī)模并行化,同時將成本保持在最低水平。在逆轉(zhuǎn)錄過程中,條形碼將被添加至RNA分子中,從而可以識別單個細(xì)胞和獨(dú)特的分子。

分析流程的第一步是生成數(shù)據(jù)矩陣,該矩陣通過轉(zhuǎn)錄物數(shù)據(jù)庫從原始測序文件中呈現(xiàn)細(xì)胞的條形碼。對于10*Genomics的數(shù)據(jù),CellRanger是最常用的渠道,包括測序reads到基因組的解多路復(fù)用和比對,將比對的reads注釋到基因,以及對基因進(jìn)行量化。

圖 1 ?scRNA-seq分析的生物信息學(xué)工具

小云在這里僅展示部分相關(guān)工具,有關(guān)scRNA-seq分析的生物信息學(xué)工具的全面概述,請參見https://www.scrna-tools.org/tools。包括工具、方法和數(shù)據(jù)庫,并帶有存儲庫URL。、

分析流程的第二步是質(zhì)量控制(QC),例如確定每個條形碼的計數(shù)、基因數(shù)及其中線粒體基因的基數(shù)比例,低基因數(shù)和高線粒體讀數(shù)比例通常表明細(xì)胞質(zhì)量差,在這里小云推薦幾個雙重檢測工具,包括DoubleDecon, scrulet,?DoubletFinder等。

圖 2 ?數(shù)據(jù)分析的典型步驟

(2)數(shù)據(jù)標(biāo)準(zhǔn)化

單細(xì)胞數(shù)據(jù)需要不同類型和級別的歸一化,例如,總測序讀取計數(shù)數(shù)改變原始計數(shù)數(shù),因此基因計數(shù)應(yīng)按比例縮放到總體計數(shù)深度。Scran使用基于池的大小因子估計和線性回歸對數(shù)據(jù)進(jìn)行歸一化,這是除seurat使用的簡單對數(shù)歸一化之外最流行的方法之一。

(3)批處理效果校正和數(shù)據(jù)集成

Seurat中,有一個基于參考的集成選項,它使用典型相關(guān)分析或互反主成分分析(PCA)最近,Harmony24越來越受歡迎,并迅速成為單細(xì)胞數(shù)據(jù)集最常用的集成方法。小云在這里推薦大家去查看Tran等人(26)和Chen等人(27)最近發(fā)表的兩篇優(yōu)秀論文,這兩篇論文提供了一些支持Harmony、基因組實(shí)驗(yàn)關(guān)系關(guān)聯(lián)推斷和Seurat關(guān)于批效應(yīng)校正的最佳證據(jù)。

(4)可視化和聚類

單細(xì)胞數(shù)據(jù)可視化主要使用其他非線性降維方法,如t分布隨機(jī)鄰居嵌入該方法側(cè)重于以犧牲全局結(jié)構(gòu)為代價獲取局部相似性。均勻逼近和投影(UMAP)方法也因其速度快而受到歡迎UMAP似乎可以更好地捕獲底層數(shù)據(jù)結(jié)構(gòu),并可以在兩個以上的維度上總結(jié)數(shù)據(jù);因此,它現(xiàn)在最常用于單個單元格數(shù)據(jù)可視化。聚類是一種基于距離矩陣的無監(jiān)督機(jī)器學(xué)習(xí)過程。社區(qū)中默認(rèn)的聚類方法是基于單個細(xì)胞k近鄰的Louvain社區(qū)檢測方法。單元格在圖中表示為節(jié)點(diǎn)。每個細(xì)胞連接到它的K個最相似的細(xì)胞,這通常是使用pc減少表達(dá)空間上的歐幾里得距離獲得的。

圖 3 ?數(shù)據(jù)可視化

(5)細(xì)胞水平分析:細(xì)胞分?jǐn)?shù)變化、分解和軌跡分析

Monocle是一種機(jī)器學(xué)習(xí)方法,用于重建每個細(xì)胞從一種狀態(tài)過渡到另一種狀態(tài)時必須執(zhí)行的基因表達(dá)變化序列。小云為大家推薦一個有用的軟件包是PHATE,這是一種利用數(shù)據(jù)點(diǎn)之間的信息幾何距離捕獲局部和全局非線性結(jié)構(gòu)的可視化方法。推斷的軌跡不一定要代表一個生物過程,應(yīng)該收集進(jìn)一步的證據(jù)來源來解釋從這些方法中得出的軌跡。

(6)基因水平分析:差異表達(dá)、基因調(diào)控網(wǎng)絡(luò)、驅(qū)動通路和細(xì)胞-細(xì)胞相互作用

差異表達(dá)(DE)分析通過包括技術(shù)和生物協(xié)變量對未校正的數(shù)據(jù)進(jìn)行。Seurat使用不同的模型進(jìn)行DE分析。MAST使用障礙模型來解釋輟學(xué)為了將scRNA-seq數(shù)據(jù)集信息與其他表型變量關(guān)聯(lián)起來,基于回歸的模型可以將幾個樣本及其相關(guān)的表型特征結(jié)合起來,將某些細(xì)胞類型(如近端小管細(xì)胞)的基因表達(dá)變化與各自的定量測量表型(例如GFR、蛋白尿)關(guān)聯(lián)起來。

以上便是單細(xì)胞測序數(shù)據(jù)分析的典型流程,小伙伴們有什么問題請積極和小云進(jìn)行討論哦!



三分鐘教你如何進(jìn)行單細(xì)胞測序數(shù)據(jù)分析的評論 (共 條)

分享到微博請遵守國家法律
元谋县| 诸暨市| 广东省| 新沂市| 新泰市| 元朗区| 多伦县| 滨海县| 宁海县| 嘉祥县| 青海省| 务川| 石家庄市| 博兴县| 卢龙县| 天镇县| 泊头市| 内丘县| 行唐县| 锦州市| 武乡县| 呼图壁县| 班戈县| 平南县| 宜君县| 东宁县| 五峰| 富平县| 巫山县| 南靖县| 宁晋县| 永德县| 临沂市| 自治县| 田东县| 岳阳市| 文登市| 阳朔县| 五莲县| 新密市| 五大连池市|