談一談單細(xì)胞轉(zhuǎn)錄組測(cè)序細(xì)胞組成分析方法
·背景介紹·
眾所周知,疾病、衰老和免疫等各種生物因素對(duì)各種組織的細(xì)胞組成都有顯著影響。因此,對(duì)許多研究課題來(lái)說(shuō),能夠精細(xì)地研究這些細(xì)胞組成成分的變化是特別有趣的方向。而單細(xì)胞 RNA 測(cè)序技術(shù)的最新進(jìn)展開(kāi)辟了從組織樣本中準(zhǔn)確獲取大量單個(gè)細(xì)胞的可能性,為細(xì)胞群的差異分析鋪平了道路。
圖1
但目前使用 scRNA-seq 檢測(cè)細(xì)胞類型組成的變化并非易事,有以下幾個(gè)限制性因素需要解決:(1)由于單細(xì)胞轉(zhuǎn)錄組細(xì)胞群數(shù)據(jù)是組成性數(shù)據(jù),在現(xiàn)有的技術(shù)方案下,某些細(xì)胞類型可能更容易受到損壞,從而導(dǎo)致數(shù)據(jù)存在負(fù)偏差及細(xì)胞類型比例的更大差異 ;(2) 此外,由于測(cè)序成本的限制,多數(shù)數(shù)據(jù)集中樣本數(shù)目相對(duì)較少,導(dǎo)致細(xì)胞數(shù)目統(tǒng)計(jì)結(jié)果會(huì)存在不準(zhǔn)確的情況;(3)通常情況下,不同條件或者因素只會(huì)影響一部分類型的細(xì)胞, 因此需要開(kāi)發(fā)用于估計(jì)細(xì)胞類型組成不確定性的方法。
那今天在這里給大家介紹兩種不同的統(tǒng)計(jì)方法:scDC和scCODA,用于對(duì)單細(xì)胞轉(zhuǎn)錄組學(xué)數(shù)據(jù)進(jìn)行細(xì)胞類型組成成分分析,老師們可以根據(jù)自己研究課題需要進(jìn)行選用。?
·方法介紹·
1.scDC
原理簡(jiǎn)介
scDC是一種新的統(tǒng)計(jì)方法,用于對(duì) scRNA-seq 數(shù)據(jù)進(jìn)行差異細(xì)胞類型組成分析。scDC通過(guò)偏差校正和加速自舉置信區(qū)間,捕獲與每個(gè)受試者的細(xì)胞類型比例相關(guān)的不確定性。它使用 bootstrap 重采樣來(lái)估計(jì)與細(xì)胞類型比例估計(jì)相關(guān)的標(biāo)準(zhǔn)誤差,并通過(guò) GLM 和 GLMM 模型執(zhí)行顯著性檢驗(yàn)。具體處理步驟如下圖所示:
圖2
1.預(yù)處理單細(xì)胞數(shù)據(jù)并進(jìn)行細(xì)胞類型鑒定 ;
2.使用分層bootstrap生成重采樣(有放回的抽取,即一個(gè)數(shù)據(jù)有可以被重復(fù)抽取超過(guò)一次)數(shù)據(jù),然后使用聚類算法進(jìn)行聚類。每個(gè)簇都使用原始數(shù)據(jù)的參考細(xì)胞標(biāo)簽與細(xì)胞類型相匹配,這一步重復(fù)n次;
3.使用 GLM 擬合每個(gè)重采樣數(shù)據(jù)集中的細(xì)胞統(tǒng)計(jì)情況,每個(gè)單獨(dú) GLM 擬合模型之間的相關(guān)系數(shù)估計(jì)使用魯賓規(guī)則合并并測(cè)試顯著性;
4.提取統(tǒng)計(jì)的總體估計(jì)值;
5.每次引導(dǎo)重新采樣都會(huì)給出每個(gè)患者的細(xì)胞類型組成的估計(jì)分布,結(jié)果以圖形方式顯示。
結(jié)果示例
該分析軟件中涉及的主要功能函數(shù)及參數(shù)如下:scDC_noClustering(cellTypes, group, calCI = TRUE,calCI_method = c("BCa"),ncores = 20,nboot = 1000) ,其中celltype為細(xì)胞類型,group為不同條件分組。
圖3 | scDC分析柱狀圖
其中縱坐標(biāo)為樣本名稱,橫坐標(biāo)為各種細(xì)胞類型在不同條件中的成分占比,縱坐標(biāo)為不同條件,method為置信區(qū)間統(tǒng)計(jì)方法:BCa ,percentile和 multinom。
圖4 | scDC分析密度圖
其中縱坐標(biāo)為樣本名稱,橫坐標(biāo)為各種細(xì)胞類型在不同條件中的成分占比,cond1為不同條件,method為置信區(qū)間統(tǒng)計(jì)方法:BCa ,percentile和 multinom。
圖5 | scDC分析熱圖
其中坐標(biāo)為不同條件,縱坐標(biāo)為各種細(xì)胞類型在不同條件中的成分占比,該值采用1000次自助采樣結(jié)果中的中位值并針對(duì)列進(jìn)行了scale處理,聚類方式為無(wú)監(jiān)督聚類。

圖6 | scDC分析折線圖
其中橫坐標(biāo)為不同條件,縱坐標(biāo)為特定細(xì)胞類型在不同條件下的成分占比,該值采用1000次自助采樣結(jié)果中的中位值, 陰影區(qū)域分別表示置信區(qū)間上限,下限。
2. scCODA
原理簡(jiǎn)介
scCODA是一種設(shè)計(jì)用于在 scRNA-seq 中執(zhí)行細(xì)胞類型組成差異豐度分析的貝葉斯模型,設(shè)計(jì)靈感來(lái)源于微生物組數(shù)據(jù)的組成分析方法。scCODA框架使用分層 Dirichlet-Multinomial 分布對(duì)細(xì)胞類型計(jì)數(shù)進(jìn)行建模,該分布通過(guò)對(duì)所有測(cè)量的細(xì)胞類型比例,而不是通過(guò)聯(lián)合建模來(lái)解釋細(xì)胞類型比例的不確定性。
該模型使用帶有對(duì)數(shù)鏈接函數(shù)的 Logit 正態(tài)尖峰和平板先驗(yàn),以簡(jiǎn)約的方式估計(jì)二元(或連續(xù))協(xié)變量對(duì)細(xì)胞類型比例的影響。由于細(xì)胞成分分析始終需要能夠識(shí)別成分變化的參考, scCODA 支持自動(dòng)選擇適當(dāng)?shù)募?xì)胞類型作為參考(reference_cell_type = “automatic”),當(dāng)然也可以使用預(yù)先指定的參考細(xì)胞類型, 這也意味著必須根據(jù)所選參考細(xì)胞類型來(lái)解釋 scCODA 檢測(cè)到的可信變化。此外,該框架集成了其他細(xì)胞類型組成差異豐度分析方法,如scDC,t-test等,并完全集成到 Scanpy 生態(tài)系統(tǒng)中。
結(jié)果示例
不同分組柱狀圖
圖7 | scCODA分組柱狀圖?
其中橫坐標(biāo)為不同樣本或者不同條件,縱坐標(biāo)為各種細(xì)胞類型在不同樣本或者不同條件中的成分占比
差異分析箱線圖
圖8 | scCODA細(xì)胞成分分析箱線圖?
其中橫坐標(biāo)為不同細(xì)胞類型,縱坐標(biāo)為各種細(xì)胞類型在不同條件中的成分占比
·應(yīng)用實(shí)例·
2021年底發(fā)表的結(jié)直腸癌肝轉(zhuǎn)移的單細(xì)胞時(shí)空免疫圖譜文章中,作者使用scDC軟件來(lái)估計(jì)不同分組的免疫細(xì)胞差異, 結(jié)果表明一些免疫抑制細(xì)胞特異性地存在于肝轉(zhuǎn)移中,其中觀察到SPP1+巨噬細(xì)胞和MRC1+ CCL18+巨噬細(xì)胞顯著增加,中性粒細(xì)胞作為潛在的促瘤參與者也在肝轉(zhuǎn)移中出現(xiàn)了富集,這些發(fā)現(xiàn)得到了后續(xù)的mIHC量化結(jié)果的驗(yàn)證,進(jìn)一步證實(shí)了肝轉(zhuǎn)移中潛在的抑制性TME。結(jié)合TCGA中結(jié)直腸癌人群中scRNA-seq定義的免疫細(xì)胞亞群的預(yù)后信息,發(fā)現(xiàn)原發(fā)性腫瘤中MRC1+ CCL18+巨噬細(xì)胞和SPP1+巨噬細(xì)胞的高分都預(yù)示著預(yù)后更差?;谶@些結(jié)論,文章推斷特定的巨噬細(xì)胞亞群可能在結(jié)直腸癌肝轉(zhuǎn)移前腫瘤生態(tài)位形成中起根本作用。
圖9 | 結(jié)直腸癌肝轉(zhuǎn)移免疫細(xì)胞成分分析
在scCODA算法文章中,作者針對(duì)早期發(fā)表的COVID-19患者支氣管肺泡免疫細(xì)胞數(shù)據(jù), 比較了健康對(duì)照組 (4例樣本)、重癥組 (6例樣本)和輕癥組( 3例樣本)之間支氣管肺泡灌洗液中主要細(xì)胞類型的組成變化 。
該研究最初報(bào)告了pDC細(xì)胞在健康組與輕癥組, 輕癥組與重癥組均存在顯著差異變化;相對(duì)于健康組樣本,mDCs細(xì)胞比例在重癥組中降低;相對(duì)于輕癥組,T細(xì)胞比例在重癥組中也降低。由于樣本較少,采用多重測(cè)試校正后,導(dǎo)致只有pDC細(xì)胞的結(jié)論仍然成立。而通過(guò)scCODA分析, 證實(shí)了 T 細(xì)胞在重癥病例出現(xiàn)耗竭現(xiàn)象,并確定了NK 細(xì)胞在輕癥組顯著增加;相對(duì)于健康組和輕癥組,中性粒細(xì)胞在重癥組顯著增加 。
這些結(jié)論得到了FACS驗(yàn)證并與其他研究結(jié)果一致:T細(xì)胞豐度與嚴(yán)重程度的相關(guān)性已得到充分確立,并已被用作嚴(yán)重病例的危險(xiǎn)因素;較高的中性粒細(xì)胞比例與重癥相關(guān)聯(lián), 并被懷疑是宿主反應(yīng)加劇的主要驅(qū)動(dòng)因素。
圖10 | 不同癥狀COVID-19患者的支氣管肺泡免疫細(xì)胞成分分析
今天的介紹就到這里了
歡迎百度搜索歐易生物——訪問(wèn)歐易生物官網(wǎng)——了解單細(xì)胞轉(zhuǎn)錄組測(cè)序技術(shù)
原創(chuàng)聲明:本文由歐易生物(OEBIOTECH)學(xué)術(shù)團(tuán)隊(duì)報(bào)道,本文著作權(quán)歸文章作者所有。歡迎個(gè)人轉(zhuǎn)發(fā)及分享,未經(jīng)作者的允許禁止轉(zhuǎn)載。