最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

單細胞分析方法選對了么?Nature子刊的反卷積方法讓你的腫瘤研究少走彎路!

2023-10-31 10:28 作者:爾云間  | 我要投稿

單細胞轉(zhuǎn)錄組測序(scRNA-seq)是一種能檢測單個細胞內(nèi)基因表達情況的轉(zhuǎn)錄組測序技術(shù),這也是單細胞轉(zhuǎn)錄組測序相比bulk轉(zhuǎn)錄組測序最大的優(yōu)勢。近幾年很多高分文獻都運用了scRNA-seq,也是斬獲課題和基金的利器。可以說掌握了單細胞測序的分析,畢業(yè)和論文起碼都不愁了耶~~ 許多組織樣本不適合分解成單個細胞而進行scRNA-seq,但是對整個組織進行RNA測序后,再通過反卷積分析由整體探知局部,從而獲知整個組織的細胞類型也能達成相似的效果。小云今天分享的文獻,從可變腫瘤純度、缺失細胞類型以及上皮細胞和免疫細胞類型共三個維度出發(fā),利用公共數(shù)據(jù)庫中乳腺癌的單細胞測序數(shù)據(jù),針對九種分析腫瘤微環(huán)境的反卷積方法進行性能對比。這下還用發(fā)愁怎么分析scRNA-seq么,這樣現(xiàn)成的好東西快抓緊用起來呀!

題目:腫瘤微環(huán)境反卷積方法在乳腺癌單細胞組群混合物中的表現(xiàn)

雜志:Nature Communications

影響因子:IF=16.6

發(fā)表時間:2023年9月

研究背景

腫瘤微環(huán)境(TME)在癌癥的發(fā)生、進展和轉(zhuǎn)移中起著關(guān)鍵作用,腫瘤浸潤性免疫細胞的存在與多種癌癥的治療反應(yīng)和患者預(yù)后有關(guān)。乳腺癌是一種由多種分子亞型組成的異質(zhì)性疾病,根據(jù)分子亞型的不同,TME的組成具有不同的治療和結(jié)果影響。其他TME成分,包括腫瘤相關(guān)巨噬細胞和成纖維細胞,也與影響乳腺癌預(yù)后和治療反應(yīng)有關(guān),盡管它們的作用尚未完全確定。 Bulk RNA-seq分析是研究TME的常用方法,有幾種計算方法可以通過對bulk RNA-seq數(shù)據(jù)進行反卷積來估計TME內(nèi)的細胞類型。先前對TME反卷積方法性能的測試研究要么集中在可能影響反卷積的技術(shù)方面,要么集中在整體反卷積性能,而沒有全面研究可能影響TME反卷積的生物和樣本異質(zhì)性的影響。此外最近開發(fā)的幾種利用scRNA-seq作為基因表達參考譜或訓(xùn)練數(shù)據(jù)的方法尚未進行基準測試。相關(guān)細胞系的細胞類型之間的基因表達相似性已被證明會影響基于轉(zhuǎn)錄組學(xué)的反卷積的性能。理論上,高TME反卷積粒度可以通過更多的注釋良好的scRNA-seq數(shù)據(jù)集和最近開發(fā)的基于scRNA-seq的反卷積方法來實現(xiàn),但仍然需要進行基準測試。此外腫瘤細胞的比例也可能會影響TME反卷積性能。

數(shù)據(jù)來源

研究思路

在這項研究中,作者綜合衡量了可變腫瘤純度、缺失細胞類型以及上皮細胞和免疫細胞類型譜系對計算TME反卷積性能的影響。作者評估了最近開發(fā)的三類不同的反卷積方法的性能:七種基于單細胞的方法(CIBERSORTx, MuSiC, Bisque, DWLS, CPM, BayesPrism, hspe),一種基于簽名基因的方法(EPIC)和一種基于深度學(xué)習(xí)的方法(Scaden)。作者使用scRNA-seq乳腺癌圖譜來模擬具有已知純度水平和腫瘤和正常上皮細胞、b細胞、t細胞和骨髓亞型顆粒組成的人工bulk?RNA混合物,以確定樣品異質(zhì)性對每種反卷積方法性能的影響,強調(diào)了對更罕見的細胞類型進行更多單細胞表征的必要性。 ?

主要結(jié)果

1.?模擬人工bulk混合物以評估TME反卷積方法的性能

作者使用已發(fā)表的scRNAseq乳腺癌數(shù)據(jù)模擬了人工大量RNA-seq混合物。scRNA-seq數(shù)據(jù)來自26例乳腺癌患者,代表三種分子亞型:ER+ (n = 11例)、HER2+ (n = 5例)和三陰性乳腺癌(TNBC;N = 10例)。共有100,064個細胞被注釋為9種主要細胞類型,29種次要細胞類型和49個亞群(圖1a)。每個患者樣本在細胞類型豐度上存在差異,某些細胞類型在特定患者中缺失;使用一種稱為合成少數(shù)過采樣技術(shù)(SMOTE)的過采樣方法,以確保每個患者體內(nèi)細胞類型的均勻表示,并實現(xiàn)不同范圍的模擬混合物。 作者將數(shù)據(jù)分成訓(xùn)練(18例患者樣本)和測試(8例患者樣本)數(shù)據(jù)集,確保所有三種乳腺癌亞型(ER+, HER2+和TNBC)和主要細胞類型都在這兩個數(shù)據(jù)集中表示(圖1b)。使用稀疏模擬過程來創(chuàng)建大體積細胞混合物,該方法隨機化了細胞類型的數(shù)量,并在所有細胞類型中實現(xiàn)了更多樣化的比例范圍,模擬具有不同腫瘤純度和免疫細胞系的大量RNA-seq數(shù)據(jù),以評估九種反卷積方法的性能(圖1b, c)。

圖1??研究的實驗設(shè)計

2.?跨腫瘤純度水平的TME反卷積方法的性能

作者首先評估不同腫瘤純度水平對TME反卷積方法性能的影響,模擬了38,000個測試細胞混合物,包括19種純度水平中,每種水平的2000個模擬(每位患者250個),腫瘤細胞的范圍從5%到95%(圖1b)。在所有細胞類型中,預(yù)測比例和真實比例之間的布雷-柯蒂斯差異表明BayesPrism, Scaden和MuSiC在所有純度水平上都優(yōu)于其他方法 (圖2a)。此外,BayesPrism、MuSiC和hspe通常在腫瘤含量較高的樣品中表現(xiàn)較好,而DWLS、CBX、Bisque、EPIC和CPM在腫瘤純度較高的樣品中表現(xiàn)較差。 為了研究特定細胞類型的預(yù)測是否受到腫瘤純度的影響,作者分析了九種主要細胞類型的中位數(shù)RMSE值。BayesPrism、Scaden、MuSiC、CBX和DWLS是唯一在所有腫瘤純度水平的混合物中對所有三種免疫細胞類型(t細胞、b細胞和骨髓細胞)實現(xiàn)RMSE值< 10的方法(圖2b)。在去卷積t細胞和b細胞中,BayesPrism和DWLS更優(yōu),在所有純度水平下的RMSE值都較低。值得注意的是,DWLS在所有純度水平的b細胞中獲得了最低的RMSE值,而另四種方法在大多數(shù)腫瘤純度水平下的免疫細胞的RMSE值≥2,在低腫瘤純度水平下的RMSE值≥10,表明免疫細胞的性能相對較差(圖2b)。癌癥和正常上皮是BayesPrism、Scaden、MuSiC、CBX、DWLS、hspe和EPIC的所有純度水平中預(yù)測錯誤最多的細胞類型(圖2b),預(yù)測錯誤的程度隨著腫瘤純度的提高而增加。

圖2??可變腫瘤純度對反卷積的影響

?3

.??驗證了TME反卷積方法的性能

作者使用了另外兩個單細胞RNA-seq數(shù)據(jù)集來重復(fù)評估腫瘤純度對反卷積的影響。模擬了另外85,000個測試細胞混合物,其中包括5000個模擬(每個患者250個),用于19個純度水平。BayesPrism對腫瘤純度表現(xiàn)出最佳的整體性能,是唯一在兩個數(shù)據(jù)集所有腫瘤純度水平上實現(xiàn)布雷-柯蒂斯不相似度≤0.22的方法。Scaden、MuSiC和CBX也表現(xiàn)出良好的表現(xiàn)。BayesPrism、Scaden、MuSiC、CBX和DWLS在免疫細胞類型上表現(xiàn)良好。 作者繼續(xù)使用了 TCGA中乳腺癌患者的數(shù)據(jù),將預(yù)測的癌細胞比例原研究 (n = 1031)得出的共識純度估計(CPE)進行了比較,并使用深度學(xué)習(xí) (n = 892)將預(yù)測的淋巴細胞比例(t細胞和b細胞)與H&E圖像產(chǎn)生的腫瘤浸潤淋巴細胞(TIL)估計進行了比較。BayesPrism、Scaden和MuSiC在癌癥和淋巴細胞預(yù)測方面表現(xiàn)最強,Pearson相關(guān)系數(shù)最高,RMSE評分最低(圖2c, d),CBX、DWLS和hspe在預(yù)測癌癥比例方面的表現(xiàn)優(yōu)于Bisque、EPIC和CPM(圖2c)。除了hspe和DWLS外,這4種方法都過度預(yù)測了淋巴細胞比例(圖2d)。

4.???反卷積方法在不同乳腺癌分子亞型正常上皮細胞系中的表現(xiàn)

接下來作者探討了癌癥上皮細胞作為正常上皮細胞的錯誤預(yù)測(在7種方法中觀察到)是否與乳腺癌分子亞型(ER+、HER+和TNBC)或正常上皮次要細胞類型(管腔祖細胞、成熟管腔細胞和肌上皮細胞)相關(guān)。作者在固定的腫瘤純度為50%的情況下,對正常上皮細胞使用次要亞型注釋模擬新的混合物(圖2b)。在每一種乳腺癌分子亞型中,癌癥上皮細胞和正常上皮小細胞類型是原始預(yù)測誤差的主要驅(qū)動因素,對三種正常上皮小細胞類型的預(yù)測各不相同(圖3a, b)。在TNBC中,所有反卷積方法中,管狀祖細胞產(chǎn)生最高的RMSE評分(圖3a),而癌癥上皮細胞被低估(圖3b),表明它們可能是正常上皮細胞錯誤預(yù)測的原因。相比之下,成熟的管腔細胞是ER+腫瘤錯誤預(yù)測的可能原因。對于HER2+分子亞型,不同方法對管腔祖細胞或成熟管腔細胞的預(yù)測誤差均升高。

圖3?正常上皮譜系和分子亞型對反卷積的影響?

5.???跨反卷積方法的假陽性和假陰性預(yù)測

在反卷積的背景下,假陽性和假陰性預(yù)測可能導(dǎo)致TME內(nèi)細胞組成的嚴重錯誤表征。當一種方法預(yù)測一種細胞類型存在,而它在混合細胞中不存在(<0.1%)時,就會出現(xiàn)假陽性;反之亦然(圖4a)。作者使用腫瘤純度為50%的2000個細胞混合物(每個患者250個)和先前腫瘤純度實驗中的9種主要細胞類型(圖1b)來確定每種反卷積方法的假陽性和假陰性預(yù)測率。 對于假陽性預(yù)測,作者關(guān)注的是缺乏一種或多種細胞類型成分的細胞混合物??傮w上hspe方法預(yù)測所有細胞類型的假陽性百分比最低(20.7%),其次是BayesPrism (31.9%), MuSiC (36.1%),EPIC (46%),DWLS (48.4%),CBX(50%)和Bisque(61.1%)(圖4b)。Scaden和CPM的假陽性率最高。假陽性比例最大的細胞類型是正常上皮,除Bisque外,所有方法的錯誤預(yù)測最嚴重(圖4)。在免疫細胞類型(t細胞、b細胞和骨髓細胞)的假陽性比例方面,hspe、BayesPrism、MuSiC和DWLS表現(xiàn)最好,假陽性率≤42%(圖4b)。由于腫瘤純度固定為50%,因此不確定癌癥上皮細胞類型的假陽性率。 對于假陰性率的計算,作者只關(guān)注混合物中存在的細胞類型成分。Scaden和CPM是唯一沒有假陰性的方法 (圖4c)。BayesPrism、MuSiC、CBX和DWLS的總體假陰性率最低,分別為2.6%、5.7%、3.2%和6.8%(圖4c)。雖然hspe的假陽性表現(xiàn)最好,但其假陰性率最高24.4%。按細胞類型比較,Bisque法是唯一對正常上皮細胞類型假陰性率較高的方法(40.3%)。在免疫細胞類型的假陰性方面,BayesPrism、MuSiC、CBX和DWLS表現(xiàn)最好。綜上,考慮假陽性和陰性率,沒有一種方法優(yōu)于其他方法,但BayesPrism, MuSiC, CBX和DWLS表現(xiàn)出最佳的可比較性能。

圖4?用假陽性和假陰性率評價九種反卷積方法的性能

6.???跨免疫細胞譜系水平反卷積方法的性能

作者試圖確定在t細胞(11種亞型)、b細胞(2種亞型)和髓細胞(10種亞型)的次要細胞類型或更顆粒亞細胞類型的背景下,反卷積性能是否會下降(圖5)。使用Aitchison距離來比較每個方法在譜系水平上的總體性能。BayesPrism在所有主要、次要和子集細胞類型水平上的最佳綜合性能對應(yīng)的中位數(shù)距離最低,其艾氏距離分別為2.88、8.2和12.14(圖5b)。三個級別的總體表現(xiàn)緊隨其后的是DWLS、MuSiC和CBX。當僅使用混合物的免疫細胞來計算預(yù)測比例和期望比例之間的Aitchison距離時,DWLS在子集和次要水平上優(yōu)于其他方法,而BayesPrism在主要水平上仍然是最佳方法(圖5c)。 在各個譜系水平上,BayesPrism在主要水平(BayesPrism的RMSE為2.0-4.5,DWLS的RMSE為2.1-3.2)、次要水平(BayesPrism的RMSE為3.4-8.5,DWLS的RMSE為2.8-9.4)和子集水平(BayesPrism的RMSE為0.8-9.4,DWLS的RMSE為0.7-14.8)上的表現(xiàn)都不如DWLS;圖5d)。作者使用相對比例誤差(RPE)值來了解每一個百分比的地面真值的錯誤預(yù)測程度。對于所有三個譜系水平的大多數(shù)細胞類型,DWLS產(chǎn)生的RPE值低于BayesPrism(圖5e)。然而BayesPrism和DWLS在子集水平上也產(chǎn)生了一些極端的錯誤預(yù)測。 總體而言,DWLS和BayesPrism在所有次要和亞群免疫細胞類型中假陽性率最低(DWLS為29.9%,BayesPrism為22.10%)。另一方面,DWLS在處理假陰性方面優(yōu)于BayesPrism,在次要(28.3%相比BayesPrism的40.1%)和子集(49.0%相比BayesPrism的55.8%)水平上都實現(xiàn)了更低的假陰性率。

圖5 免疫譜系對反卷積的影響

文章小結(jié)

針對最近開發(fā)出的單細胞反卷積方法,作者用多組乳腺癌測序數(shù)據(jù)進行測試,多角度分析了各類方法在不同腫瘤微環(huán)境下的分析差異,可以讓相關(guān)的研究者依據(jù)數(shù)據(jù)特征選擇合適的方法,或用不同的方法驗證已分析的結(jié)果。不知道在其他腫瘤數(shù)據(jù)是否也能起到作用呢,有興趣的小伙伴也來試試吧~ 如果你還苦惱于生信分析沒有思路,或者嫌分析方法太過簡單、太過老套,想要創(chuàng)新思路的,或者對單細胞分析、多組學(xué)聯(lián)合分析等方向感興趣的小伙伴快來聯(lián)系小云吧!

單細胞分析方法選對了么?Nature子刊的反卷積方法讓你的腫瘤研究少走彎路!的評論 (共 條)

分享到微博請遵守國家法律
会东县| 常德市| 茌平县| 资阳市| 克什克腾旗| 景宁| 芦山县| 当雄县| 五河县| 泰来县| 尖扎县| 绥江县| 衡东县| 贡觉县| 措美县| 昭觉县| 梅州市| 鄂温| 改则县| 沙雅县| 余干县| 铅山县| 中阳县| 宝清县| 肇源县| 阜阳市| 兖州市| 赣榆县| 冀州市| 绥芬河市| 开江县| 中山市| 宜兴市| 天长市| 东乌珠穆沁旗| 八宿县| 富锦市| 垣曲县| 察隅县| 芜湖市| 台中市|