還在單細(xì)胞測序?單核更出色
單細(xì)胞RNA-seq(single cell RNA-seq, scRNA-seq)是目前用于細(xì)胞類型、細(xì)胞狀態(tài)研究的核心工具,很多實(shí)驗(yàn)室也同時(shí)圍繞scRNA-seq技術(shù)建立了多種計(jì)算方法并且優(yōu)化了建庫方法,不同方法在如何鑒別分子的細(xì)胞來源和文庫建立方面有所區(qū)別。scRNA-seq技術(shù)不斷革新、升級的同時(shí),隨之產(chǎn)生的高分辨、高通量數(shù)據(jù)也助力發(fā)表了多項(xiàng)研究成果,以Human Cell Atlas (HCA)為代表的大型單細(xì)胞綜合數(shù)據(jù)庫也被建立,致力于在單細(xì)胞水平上繪制所有人類細(xì)胞轉(zhuǎn)錄組圖譜,推動(dòng)發(fā)展疾病的診斷、檢測和治療。
圖1.Human Cell Atlas(https://www.humancellatlas.org/)
雖然scRNA-seq給生物研究帶來了巨大的影響,但是該技術(shù)的實(shí)際應(yīng)用時(shí),仍然面臨著巨大的挑戰(zhàn)和困境。
1)單細(xì)胞懸液的制備是單細(xì)胞技術(shù)的重要環(huán)節(jié),scRNA-seq非常依賴單細(xì)胞懸液的質(zhì)量,常用的10x Genomics平臺對于單細(xì)胞懸液的要求為細(xì)胞起始量大于1×10^5個(gè),活細(xì)胞數(shù)目在85%以上,無細(xì)胞團(tuán),無碎片,因此scRNA-seq技術(shù)僅適用于新鮮組織樣本,但是大量的珍貴樣本都是以低溫凍存的狀態(tài)進(jìn)行保存的,所以這類樣本不適用于scRNA-seq;
2)不同的組織、樣品類型的適用性不同,在單細(xì)胞懸液的制備時(shí)需要對樣品解離獲取單細(xì)胞狀態(tài),可是不同類型細(xì)胞的解離效率存在差異,不同組織類型的解離條件需要多次優(yōu)化,像成纖維細(xì)胞、內(nèi)皮細(xì)胞等多遷入細(xì)胞外基質(zhì)和基底膜中,很難分離,一些敏感細(xì)胞在物理外力的處理下會(huì)發(fā)生破碎,可見不同的組織、樣品類型的適用性不同;
3)部份樣本類型,如心臟、肌肉、脂肪組織(含有直徑比較大的心肌細(xì)胞、骨骼肌細(xì)胞、成熟脂肪細(xì)胞等),這些細(xì)胞體積大,商業(yè)化的單細(xì)胞平臺對細(xì)胞大小有嚴(yán)格的限制,建議捕獲的細(xì)胞大小不超過40um,因此30-40um的分子篩會(huì)過濾掉感興趣的大體積細(xì)胞,有效信息會(huì)大大減少;
4)細(xì)胞本身是很脆弱的,解離過程中有可能導(dǎo)致細(xì)胞死亡,酶解時(shí)間,酶濃度,是否使用寬口槍頭,離心力等對細(xì)胞狀態(tài)均有較大影響,37度下借助物理外力的解離和酶消化過程也會(huì)給細(xì)胞狀態(tài)造成很大的影響,改變細(xì)胞的生物學(xué)狀態(tài),從而在數(shù)據(jù)中引入實(shí)驗(yàn)造成的偏差(bias)。
酶的類型、酶解時(shí)間、酶濃度、機(jī)械損傷、離心條件、環(huán)境溫度、緩沖液等均可影響單細(xì)胞懸液的制備。
單細(xì)胞核測序(single nucleus RNA-seq, snRNA-seq)對單個(gè)核進(jìn)行分離測序,這種建庫策略用單個(gè)細(xì)胞核代替單個(gè)細(xì)胞來表示細(xì)胞個(gè)體的基因表達(dá)水平,穩(wěn)定性高且信息更加全面,細(xì)胞核可以從冰凍或者輕度固定的組織中進(jìn)行提取,單核技術(shù)的這一特征有效的避免了細(xì)胞懸液制備這一過程對細(xì)胞狀態(tài)的影響,很好的解決了scRNA-seq僅適用于新鮮樣本的問題,本期公眾號結(jié)合相關(guān)文獻(xiàn)深度比較scRNA-seq和snRNA-seq測序技術(shù)的實(shí)際應(yīng)用的優(yōu)缺點(diǎn)。
圖2.腎臟纖維化的單核、單細(xì)胞測序技術(shù)比較https://jasn.asnjournals.org/content/jnephrol/30/1/23.full.pdf
snRNA-seq在處理罕見樣本類型和發(fā)掘新的細(xì)胞狀態(tài)時(shí)具有極大的技術(shù)優(yōu)勢。下文將從實(shí)驗(yàn)方法、基本信息覆蓋統(tǒng)計(jì)、無監(jiān)督聚類、等方面綜合比較在腎臟組織應(yīng)用結(jié)果中兩種技術(shù)的具體表現(xiàn)。
優(yōu)勢1:樣品前處理,snRNA-seq更為簡單。
例如腎臟和其他實(shí)體樣本,想要獲得高質(zhì)量的單細(xì)胞測序數(shù)據(jù),技術(shù)挑戰(zhàn)就是解離困難,如何順利的解離細(xì)胞,保證RNA不降解,并且不引進(jìn)任何因?yàn)閷?shí)驗(yàn)造成的數(shù)據(jù)偏差,是當(dāng)下首要的技術(shù)難題。本篇文章中用的scRNA-seq和snRNA-seq高通量技術(shù)的樣本前處理的大致流程如下。
圖3.單細(xì)胞和單核樣品處理的實(shí)驗(yàn)流程簡圖
實(shí)驗(yàn)方法1:單細(xì)胞解離+甲醇處理
C57BL/6小鼠腎臟切割為1mm大小組織塊,250U/ml Liberase和40U/ml DNaseI解離緩沖液在37攝氏度酶解,之后進(jìn)行10min研磨消化,使用10%FBS終止消化,分離得到的細(xì)胞500x 5min離心,洗兩遍,過35um濾網(wǎng),然后離心500x 5分鐘,PBS中細(xì)胞重懸,添加1%BSA,FACS純化,然后使用FACS進(jìn)行前向角散射(forward scatter)和側(cè)向角散射(side scatter),每個(gè)腎臟收獲約2百萬個(gè)細(xì)胞,用甲醇處理,200ul冷PBS重懸,預(yù)冷100%甲醇緩慢滴入細(xì)胞懸濁液中進(jìn)行固定,7天存儲(chǔ)后PBS從-80移動(dòng)到冰上,PBS洗兩遍過40um過濾網(wǎng),技術(shù),稀釋預(yù)處理用于DropSeq。
實(shí)驗(yàn)方法2:單核分離
使用添加有蛋白酶抑制劑和RNase酶抑制劑和Nuclei EZ裂解緩沖液(NUC-101;Sigma-Aldrich)捕獲單個(gè)細(xì)胞核,樣品分割為大小,使用Dounce Homogenizer在裂解緩沖液中均一化,過40um過濾網(wǎng),離心,重懸洗滌,過20um過濾網(wǎng)后計(jì)數(shù)。
優(yōu)勢2:信息覆蓋snRNA-seq更全面。
scRNA-seq使用scDropSeq方法實(shí)現(xiàn),而snRNA-seq通過snDropSeq\DroNc-seq\sn10X獲取。
圖4.snRNA-seq核scRNA-seq的reads匹配比較
scRNA-seq和snRNA-seq產(chǎn)生的數(shù)據(jù)各自有什么特點(diǎn)?
1)scRNA-seq產(chǎn)生的數(shù)據(jù)大部分比對到外顯子區(qū)域,而snRNA-seq多數(shù)匹配到內(nèi)含子和基因間區(qū),雖然單細(xì)胞數(shù)據(jù)更多的覆蓋到外顯子區(qū)域;
2)因?yàn)榫€粒體是獨(dú)立于細(xì)胞核獨(dú)立存在的細(xì)胞器,所以只是在scDropSeq數(shù)據(jù)中檢測到線粒體來源的RNA信息,占到了整個(gè)細(xì)胞的24%,這一部分信息時(shí)scRNA-seq獨(dú)有的;
3)雖然細(xì)胞核的mRNA含量遠(yuǎn)遠(yuǎn)低于整個(gè)細(xì)胞,但是單核測序平均每個(gè)細(xì)胞的基因表達(dá)數(shù)量和整個(gè)細(xì)胞的基因表達(dá)數(shù)目相當(dāng),把這部分信息除去以后snRNA-seq的基因檢出率反而要高于scDropSeq數(shù)據(jù),尤其在基因表達(dá)檢測方面相當(dāng)甚至由于單細(xì)胞測序。
圖5.無監(jiān)督聚類結(jié)果比較
優(yōu)勢3:snRNA-seq聚類效果更佳。
1)在無監(jiān)督聚類的結(jié)果上比較snRNA-seq和scRNA-seq的表現(xiàn)。如果僅分析外顯子匹配得到的reads信息,單核測序結(jié)果可以找到4個(gè)cluster,單細(xì)胞測序結(jié)果可以找到7個(gè)cluster;再加入內(nèi)含子信息的時(shí)候,單核測序可以找到6種細(xì)胞類型,單細(xì)胞測序的細(xì)胞亞群數(shù)目沒有改變,可見當(dāng)充分應(yīng)用內(nèi)含子匹配到的reads信息時(shí),snRNA-seq在無監(jiān)督聚類的分類數(shù)目同scRNA-seq相當(dāng);
2)scRNA-seq聚類分析得到的7個(gè)細(xì)胞壓群中,有一個(gè)細(xì)胞亞群(Artifact,對應(yīng)圖5H的灰色亞群)高表達(dá)壓力應(yīng)答基因,這些基因的高表達(dá)實(shí)際上是由于細(xì)胞解離時(shí)因?yàn)閷?shí)驗(yàn)操作引入的偏差,snRNA-seq消除了這一部分錯(cuò)誤的信息,其次在組織解離時(shí)由于細(xì)胞破裂從而導(dǎo)致釋放到環(huán)境中的mRNA能夠污染單細(xì)胞測序數(shù)據(jù),在其他發(fā)表的論文中,相關(guān)數(shù)據(jù)分析也發(fā)現(xiàn)在幾乎所有的cluster中Slc34a1基因都是高表達(dá)的,雖然在單核測序數(shù)據(jù)中也發(fā)現(xiàn)了類似的情況,但是相比于scRNA-seq數(shù)據(jù),單核測序的污染程度已經(jīng)被大大緩解;
3)引入內(nèi)含子reads的時(shí)候可以提高snRNA-seq聚類結(jié)果中不同類內(nèi)部的cohesion(拉近同一個(gè)cluster內(nèi)樣品的基因表達(dá)平均值)并且增加不同亞群之間的間隔(separation),但是對于單細(xì)胞測序分析來講,對聚類的結(jié)果沒有顯著改變;
圖6整合分析和Marker基因的相關(guān)性分析
單細(xì)胞與單核測序數(shù)據(jù)進(jìn)行整合分析,去批次效應(yīng),t-SNE發(fā)現(xiàn)了包括足細(xì)胞、內(nèi)皮細(xì)胞、腎小球膜細(xì)胞、腎小管細(xì)胞和巨噬細(xì)胞在內(nèi)的共13個(gè)cluster,和其他最近發(fā)表的腎臟單細(xì)胞測序數(shù)據(jù)比較分析,對細(xì)胞亞群的注釋結(jié)果進(jìn)行確認(rèn)。
圖7整合分析和Marker基因的相關(guān)性分析
優(yōu)勢4:snRNA-seq在整合分析中占主導(dǎo)作用,部分細(xì)胞的檢出靈敏度更高,結(jié)果可靠
tSNE結(jié)果能分析每個(gè)平臺數(shù)據(jù)對每個(gè)cluster的貢獻(xiàn)度,圖7C當(dāng)中顯示,紅色、綠色、藍(lán)色所代表的單核測序數(shù)據(jù)的貢獻(xiàn)程度均高于黃色的單細(xì)胞數(shù)據(jù),這三種測序平臺在檢測足細(xì)胞、內(nèi)皮細(xì)胞、閏細(xì)胞(intercalated cell)方面有更高的靈敏度,從圖7D中看到,EC、IC-A、IC-B三種細(xì)胞的紅、綠、藍(lán)色代表的單核測序數(shù)據(jù)對應(yīng)細(xì)胞的檢測頻率要明顯高于黃色的單細(xì)胞測序平臺,圖4E的結(jié)果顯示,snRNA-seq結(jié)果中的足細(xì)胞檢出率是scRNA-seq對應(yīng)檢出率的20倍(2.4% vs. 0.12%,P=0.02)。
在基因差異表達(dá)方面,9588(71.4%)個(gè)表達(dá)的基因在scRNA-seq和snRNA-seq中的表達(dá)情況類似,有676個(gè)基因(5%)在單細(xì)胞數(shù)據(jù)中高表達(dá)(fc 1.5;P),863(6.4%)個(gè)基因在單核數(shù)據(jù)中高表達(dá)。scRNA-seq數(shù)據(jù)中高表達(dá)基因功能分析顯示,這些基因主要包括線粒體、核糖體、熱休克信號通路相關(guān),值得一提是的在snRNA-seq中高表達(dá)的基因是和一些cell identity、轉(zhuǎn)錄因子相關(guān)的基因,和最近發(fā)表的有關(guān)腦組織中的富集分析結(jié)論一致。同樣在單核數(shù)據(jù)中能夠檢測到更多的長鏈非編碼分子。
這些表達(dá)差異是否會(huì)影響細(xì)胞聚類結(jié)果?從snDropSeq和DroNc-seq我們提取了足細(xì)胞、內(nèi)皮細(xì)胞、系膜細(xì)胞共650個(gè)單核,通過隨機(jī)森林算法在腎小球單細(xì)胞圖譜(glomerular single-cell atlas)中選取了最相似的650個(gè)最匹配的單細(xì)胞整合分析,所有細(xì)胞可以聚類成三種獨(dú)特的細(xì)胞類型,通過MetaNeighbor方法來預(yù)測scDropSeq得到的細(xì)胞亞群。盡管一些基因的表達(dá)數(shù)據(jù)有所差別,但是snRNA-seq基本能夠以較高置信度的完成細(xì)胞分類。
圖8壓力應(yīng)激基因在snRNA與sCell中的相關(guān)表達(dá)
優(yōu)勢5:snRNA-seq高信噪比
37攝氏度下的組織解離過程確實(shí)誘導(dǎo)一些壓力應(yīng)激基因的表達(dá),在scRNA-seq數(shù)據(jù)的當(dāng)中,有一個(gè)細(xì)胞亞群就是基于壓力應(yīng)答基因進(jìn)行分類獲得的,整個(gè)抽核過程是在冰上進(jìn)行,這樣可以成功的避免轉(zhuǎn)錄組數(shù)據(jù)的改變,我們在對glomerular atlas數(shù)據(jù)重分析時(shí)候發(fā)現(xiàn),幾乎所有細(xì)胞也都存在豐富的壓力應(yīng)答基因的廣泛高表達(dá)(圖8J),但是在snRNA-seq數(shù)據(jù)中無明顯表達(dá)。
圖9腎小球細(xì)胞snRNA-seq和scRNA-seq在線粒體、熱休克、凋亡相關(guān)基因的表達(dá)差異
通過對glomercular細(xì)胞類型的差異基因分析可以發(fā)現(xiàn),線粒體基因、熱休克基因、細(xì)胞凋亡基因在scRNA-seq平臺中都會(huì)呈現(xiàn)高表達(dá),而在snRNA-seq數(shù)據(jù)中,這類基因的表達(dá)豐度相對較低。
優(yōu)勢6:snRNA-seq分析罕見細(xì)胞類型和細(xì)胞亞群的發(fā)現(xiàn)
接下來使用纖維化炎癥腎臟組織對單核數(shù)據(jù)進(jìn)行驗(yàn)證,一共發(fā)現(xiàn)在sn10X平臺上產(chǎn)生的數(shù)據(jù)檢測平均每個(gè)單核有763個(gè)基因1206個(gè)分子標(biāo)記,無監(jiān)督聚類的結(jié)果發(fā)現(xiàn)17個(gè)獨(dú)特的細(xì)胞亞群,在這些結(jié)果中發(fā)現(xiàn)了兩類新的近端小管(proximal tubule)細(xì)胞亞群,其中一類高表達(dá)增值相關(guān)的基因(proliferative gene signature),因此將這類基因注釋為proliferative 近端小管細(xì)胞(Prolif.PT),與此同時(shí)這類細(xì)胞還表達(dá)損傷相關(guān)的marker基因,比如Havcr1和Vcam1。另一類新的近端小管(proximal tubule)高表達(dá)細(xì)胞運(yùn)動(dòng)相關(guān)基因,有趣的是這類細(xì)胞亞群也表達(dá)部份損傷相關(guān)基因,如Vcam1,但不表達(dá)Havcr1,同時(shí)還高表達(dá)許多分泌促炎細(xì)胞因子,包括巨噬細(xì)胞趨化Ccl2、巨噬細(xì)胞因子 Il34和中性粒細(xì)胞趨化因子Cxcl1和Cxcl2,定義為dedifferentiated近端小關(guān)細(xì)胞(Dediff.PT)。
差異基因分析顯示proliferating cluster主要富集一些細(xì)胞周期相關(guān)的條目,dedifferentiated cluster主要是細(xì)胞運(yùn)動(dòng)調(diào)控相關(guān)的條目,例如rhoGEF Dock10主要在dedifferentiated cluster中富集表達(dá),這個(gè)基因調(diào)控通過Cdc42信號通路進(jìn)行細(xì)胞形態(tài)塑造(morphogenesis)。
圖10 t-SNE腎臟snRNA-seq分析與Marker基因的表達(dá)
1)基于Ren1和內(nèi)皮素受體A表達(dá)找到了一些罕見的球旁復(fù)合體(juxtaglomerular apparatus)細(xì)胞,而這類細(xì)胞也表達(dá)Hopx基因;
2)新發(fā)現(xiàn)了兩群獨(dú)特的活化的成纖維細(xì)胞,其中一群表達(dá)2型甘露糖受體,這種分子和結(jié)合膠原減輕腎纖維化,另外一類活化的成纖維表達(dá)tenascine C,在最近的研究認(rèn)為這類分子是細(xì)胞外基質(zhì)磷酸糖蛋白,能夠促進(jìn)腎纖維化,這兩類細(xì)胞都能表達(dá)平滑肌肌動(dòng)蛋白。
3)snRNA-seq數(shù)據(jù)的細(xì)胞通訊分析能發(fā)現(xiàn)一些新的細(xì)胞間交流的信號通路,分析顯示像已知的Bmp6、Pdgfd、Spp1和新的Sema3c、Sema6a、Gpc和Slit3信號通路,圖11G就總結(jié)了纖維化腎臟的腎小管間質(zhì)互作網(wǎng)絡(luò)。
圖11受體配體相互集合與細(xì)胞間信號傳導(dǎo)通路
總結(jié):snRNA-seq實(shí)驗(yàn)過程中避免因?yàn)榻怆x細(xì)胞帶來的實(shí)驗(yàn)偏差,但是在基因表達(dá)檢測方面可以提供與單細(xì)胞技術(shù)同等的效能,這一點(diǎn)非常重要,相比于單細(xì)胞測序,單核實(shí)驗(yàn)過程減少了所需的細(xì)胞數(shù)量同時(shí)增加了有效信息量。使用snRNA-seq技術(shù)在腎纖維化組織上確實(shí)發(fā)現(xiàn)了新的細(xì)胞狀態(tài)和一些罕見的細(xì)胞類型,并且成功構(gòu)建了更加完整的細(xì)胞通訊網(wǎng)絡(luò),細(xì)粒度的分析并理解了腎臟纖維化的生物學(xué)過程。總體來看,snRNA-seq的優(yōu)勢在于樣品處理過程更加簡單、測序信息覆蓋更加全面、細(xì)胞亞群聚類效果更好、信噪比、靈敏度高且結(jié)果可靠,針對罕見樣本和發(fā)現(xiàn)新的細(xì)胞狀態(tài)和細(xì)胞亞型具有明顯的技術(shù)優(yōu)勢。