質(zhì)譜流式實(shí)驗(yàn)數(shù)據(jù)分析-百泰派克生物科技BTP
質(zhì)譜流式技術(shù)(Mass Cytometry)在藥物開發(fā)和生物藥物表征中的潛力巨大。質(zhì)譜流式細(xì)胞術(shù)將質(zhì)譜技術(shù)與流式細(xì)胞儀相結(jié)合,能夠?qū)崿F(xiàn)對(duì)單個(gè)細(xì)胞的生化成分進(jìn)行深入研究,幫助我們理解疾病機(jī)制,驗(yàn)證藥物的效果,發(fā)現(xiàn)新的藥物靶點(diǎn)以及增強(qiáng)生物制藥質(zhì)量控制。這在生物藥物表征中非常有用,它可以幫助解決以下一些問題:
單細(xì)胞層次的分子表征:傳統(tǒng)的質(zhì)譜技術(shù)通常需要大量的樣本以獲取可靠的結(jié)果,而質(zhì)譜流式技術(shù)則可以分析單個(gè)細(xì)胞的生化成分,這可以幫助我們更深入地理解細(xì)胞的生物學(xué)特性。
生物分子的定量分析:質(zhì)譜流式技術(shù)可以對(duì)細(xì)胞內(nèi)的生物分子進(jìn)行定量分析,包括蛋白質(zhì)、代謝物和其他生物分子。
細(xì)胞異質(zhì)性的研究:細(xì)胞群體中的細(xì)胞并非完全相同,它們之間的差異可能影響疾病的發(fā)展和治療的效果。質(zhì)譜流式技術(shù)可以幫助我們研究這種細(xì)胞異質(zhì)性。
百泰派克生物科技BTP采用基于Fluidigm Helios流式細(xì)胞儀(Mass Cytometry System for Single Cell Analysis)用于單細(xì)胞質(zhì)譜分析,該平臺(tái)能夠完成包括單細(xì)胞捕獲、cDNA合成、實(shí)時(shí)定量PCR分析、目標(biāo)區(qū)域擴(kuò)增以及質(zhì)譜流式細(xì)胞分析。
百泰派克生物科技BTP采用基于Fluidigm Helios流式細(xì)胞儀(Mass Cytometry System for Single Cell Analysis)用于單細(xì)胞質(zhì)譜分析,該平臺(tái)能夠完成包括單細(xì)胞捕獲、cDNA合成、實(shí)時(shí)定量PCR分析、目標(biāo)區(qū)域擴(kuò)增以及質(zhì)譜流式細(xì)胞分析。
相較于傳統(tǒng)流式,質(zhì)譜流式的特點(diǎn)在于包含巨大的信息量。質(zhì)譜流式提供的高維數(shù)據(jù)能夠檢查單個(gè)樣本中大量細(xì)胞亞群的特征、研究已知細(xì)胞群內(nèi)的異質(zhì)性、識(shí)別與臨床狀態(tài)相關(guān)的細(xì)胞群變化、評(píng)估靶細(xì)胞群與已知參考群體的相似性、確定細(xì)胞群生理狀態(tài)的變化、識(shí)別發(fā)育途徑中的中間狀態(tài)或分支點(diǎn)。

1、質(zhì)譜流式數(shù)據(jù)導(dǎo)出
使用質(zhì)譜流式儀器檢測(cè)的數(shù)據(jù),需要進(jìn)行數(shù)據(jù)合并、校正、歸一化等數(shù)據(jù)轉(zhuǎn)換操作后方可導(dǎo)出,導(dǎo)出的文件格式為FCS(圖2)。

質(zhì)譜流式原始數(shù)據(jù)通常以具有不同表達(dá)范圍的偏態(tài)分布為特征。由于可視化和聚類性能取決于規(guī)模和分布,使表達(dá)峰盡可能接近正態(tài)分布非常重要。因此,表達(dá)值通常使用反雙曲正弦(arcsinh)變換進(jìn)行變換,輔因子分別通常5。arcsinh 轉(zhuǎn)換的行為類似于高值時(shí)的對(duì)數(shù)變換,但在接近零時(shí)近似線性,并且輔助因子控制線性區(qū)域的寬度。由于背景噪聲、自發(fā)熒光和補(bǔ)償?shù)男U?,傳統(tǒng)流式數(shù)據(jù)包含更多的負(fù)值;相反,當(dāng)未檢測(cè)到離子時(shí),質(zhì)譜流式數(shù)據(jù)包含零值,并且由于背景減法和隨機(jī)化而引入的負(fù)值很少。
對(duì)于不同時(shí)間檢測(cè)數(shù)據(jù)的可比性,質(zhì)譜流式引入了基于beads的歸一化。該算法使用市售校準(zhǔn)微球(EQ beads),加入并與樣品一起采集。因此,可以通過采集時(shí)間跟蹤信號(hào)的變化。在數(shù)據(jù)處理過程中,識(shí)別beads并在所有文件中以定義的時(shí)間間隔計(jì)算beads的中值強(qiáng)度。根據(jù)獲得的值,計(jì)算每個(gè)beads的全局平均值并將其用作目標(biāo)值。為了獲得變換因子,使用全局均值和區(qū)間特定強(qiáng)度計(jì)算線性模型。然后將該因子應(yīng)用于所有細(xì)胞事件,并插值到相應(yīng)間隔和文件中的所有標(biāo)記。
2、質(zhì)譜流式數(shù)據(jù)預(yù)處理
在傳統(tǒng)流式中,通常使用FSC參數(shù)高度(H)和面積(A)消除雙峰,超出對(duì)角線的事件被定義為雙峰,因?yàn)樗鼈兊奶卣魇切盘?hào)曲線的高度相同但面積不同。在質(zhì)譜流式數(shù)據(jù)中,通常使用cytobank或FlowJo對(duì)細(xì)胞數(shù)據(jù)進(jìn)行過濾,其中順鉑用于區(qū)分活細(xì)胞,Cell-ID intercalator Ir同于區(qū)分單個(gè)細(xì)胞。圈出單個(gè)活細(xì)胞群進(jìn)行后續(xù)分析(圖3)。

也可以使用例如flowWorkspace包將數(shù)據(jù)導(dǎo)入R環(huán)境中進(jìn)行自動(dòng)門控。如果已有某些文件提供了門控策略,則可以使用像flowLearn這樣的半監(jiān)督門控方法來重現(xiàn)其余數(shù)據(jù)的門控策略,該算法使用提供的門控閾值作為輸入,并使用基于導(dǎo)數(shù)的密度對(duì)齊將它們傳輸?shù)狡溆鄻颖尽O駀lowStats,flowDensity或OpenCyto(用于構(gòu)建自動(dòng)門控層次結(jié)構(gòu)的框架)這樣的軟件包對(duì)于構(gòu)建用戶定義的門控策略很有用。自動(dòng)門控的方法更適用于大樣本的處理過程。
除了導(dǎo)出單個(gè)活細(xì)胞數(shù)據(jù),也可以對(duì)感興趣的某類細(xì)胞亞群進(jìn)行圈門導(dǎo)出(圖4)。

在圈門前需要確認(rèn)在數(shù)據(jù)轉(zhuǎn)換導(dǎo)出過程中是否把EQ beads的數(shù)據(jù)去除,如果未去除,則在圈單個(gè)活細(xì)胞前加一步去除beads的操作(圖5)。

導(dǎo)出細(xì)胞亞群后,可以對(duì)數(shù)據(jù)進(jìn)行進(jìn)一步的降維聚類等分析(表1)。
表1. 質(zhì)譜流式數(shù)據(jù)常用的數(shù)據(jù)分析方法舉例

降維方法的目標(biāo)是將高維數(shù)據(jù)的結(jié)構(gòu)保留在較低的、更易于解釋的二維或三維地圖中。這些方法可分為線性工具和非線性工具。由PCA(主成分分析),表示的線性方法側(cè)重于將點(diǎn)的最大方差保持在較低空間中,從而使不同的點(diǎn)彼此遠(yuǎn)離。另一方面,非線性算法如t-SNE(t-隨機(jī)鄰居嵌入)及其衍生算法,使相似的細(xì)胞彼此靠近,專注于保持局部關(guān)系。一些工具,如t-SNE和UMAP將眾所周知的群體分開,可以很好地概述了現(xiàn)有細(xì)胞。其他方法,如Isomap(等距特征映射)或擴(kuò)散圖可視化分化軌跡,因?yàn)樗鼈兡軌虮A艏?xì)胞之間的局部和全局距離。
基于聚類的算法對(duì)相似的細(xì)胞進(jìn)行分組,并使用可視化工具在低維空間中表示它們。在選擇最佳聚類方法時(shí),應(yīng)考慮幾個(gè)要求,例如需要縮減采樣、可重復(fù)性、稀有細(xì)胞檢測(cè)和運(yùn)行時(shí)間。不同的分析方法具有不同的特點(diǎn),可根據(jù)實(shí)驗(yàn)需求自行選擇分析方法。2019發(fā)表的一篇文章在六個(gè)質(zhì)譜流式細(xì)胞術(shù)數(shù)據(jù)集上測(cè)試了七種無監(jiān)督方法(Accense、Xshift、PhenoGraph、FlowSOM、flowMeans、DEPECHE和kmeans)和兩種半監(jiān)督方法(自動(dòng)細(xì)胞類型發(fā)現(xiàn)和分類(ADCC)以及線性判別分析 (LDA)),計(jì)算所有定義的性能度量,并將其與隨機(jī)子抽樣、不同的樣本大小以及每種方法的聚類數(shù)進(jìn)行比較(圖5)。

在準(zhǔn)確性(precision)上,研究人員將“manual gating”的細(xì)胞分群結(jié)果看作“ground truth”,利用四種外部評(píng)價(jià)指標(biāo)(Accuracy,F(xiàn)-measure, NMI和ARI),對(duì)不同方法的分群準(zhǔn)確性和效率進(jìn)行了討論。討論發(fā)現(xiàn),LDA是準(zhǔn)確性比較高的半監(jiān)督分群方法,無監(jiān)督方法中FlowSOM和flowMeans的準(zhǔn)確性較高,其次是PhenoGraph和DEPECHE方法。
在一致性(coherence)上,不再考慮“manual gating”的細(xì)胞分群結(jié)果,而是直接利用三種內(nèi)部評(píng)價(jià)指標(biāo)(DB,CH和XB),對(duì)每個(gè)方法揭示細(xì)胞數(shù)據(jù)內(nèi)部本質(zhì)結(jié)構(gòu)的能力進(jìn)行了探討。經(jīng)過探討發(fā)現(xiàn),DEPECHE,F(xiàn)lowSOM和PhenoGraph方法能更好地捕捉到CyTOF數(shù)據(jù)的內(nèi)部本質(zhì)結(jié)構(gòu)。
在穩(wěn)定性(stability)上,根據(jù)細(xì)胞采樣數(shù)量的變化,研究人員對(duì)不同方法在分群準(zhǔn)確性上的魯棒性和不同方法識(shí)別出的細(xì)胞亞群數(shù)量的魯棒性進(jìn)行了深入研究。綜合來說,PhenoGraph,DEPECHE和LDA具有相對(duì)較高的穩(wěn)定性,而FlowSOM在分析較大的CyTOF數(shù)據(jù)時(shí)更加魯棒。此外,這篇文章還研究了分群方法的分群分辨率,發(fā)現(xiàn)PhenoGraph和Xshifit能夠?qū)μ囟ǖ募?xì)胞亞型細(xì)化分類(識(shí)別出更細(xì)粒度的亞群),而DEPECHE更傾向于忽略細(xì)胞亞型之間的差異,將不同的T細(xì)胞或B細(xì)胞合并到一個(gè)細(xì)胞亞群(識(shí)別粗粒度的亞群)。
總的來說,文章結(jié)果表明,LDA最精確地再現(xiàn)了手動(dòng)標(biāo)簽,但在評(píng)估中排名不高。PhenoGraph和FlowSOM在精度,連貫性和穩(wěn)定性方面優(yōu)于其他無監(jiān)督工具。PhenoGraph和Xshift在檢測(cè)精細(xì)的子集群時(shí)具有優(yōu)勢(shì),而DEPECHE和FlowSOM傾向于將相似的集群分組到元集群中。PhenoGraph、Xshift和flowMeans的性能受到樣本量增加的影響,但隨著樣本量的增加,F(xiàn)lowSOM相對(duì)穩(wěn)定(圖6)。

2023年在Nature Communications上發(fā)表的一篇文章在對(duì)425種質(zhì)譜流式數(shù)據(jù)降維方法的性能進(jìn)行了基準(zhǔn)測(cè)試。結(jié)果表明像SAUCIE,SQuaD-MDS和scvis這樣鮮為人知的方法總體上表現(xiàn)最佳。特別是SAUCIE和SCVIS平衡良好,SQuaD-MDS在結(jié)構(gòu)保持方面表現(xiàn)出色,而UMAP具有出色的下游分析性能。t-SNE(以及SQuad-MDS/t-SNE雜交種)具有最佳的局部結(jié)構(gòu)保存。該研究的結(jié)果反駁了該領(lǐng)域的普遍想法,即tSNE和UMAP是scRNA-seq數(shù)據(jù)的最佳表現(xiàn)者,也是CyTOF數(shù)據(jù)的最佳選擇。并且數(shù)據(jù)降維工具之間存在顯著的互補(bǔ)性,方法的選擇應(yīng)取決于底層數(shù)據(jù)結(jié)構(gòu)和分析需求(圖7)。

參考文獻(xiàn):
[1] Marsh-Wakefield FM, Mitchell AJ, Norton SE, Ashhurst TM, Leman JK, Roberts JM, Harte JE, McGuire HM, Kemp RA. Making the most of high-dimensional cytometry data. Immunol Cell Biol. 2021 Aug;99(7):680-696. doi: 10.1111/imcb.12456. Epub 2021 May 4. PMID: 33797774; PMCID: PMC8453896.
[2] Rybakowska P, Alarcón-Riquelme ME, Mara?ón C. Key steps and methods in the experimental design and data analysis of highly multi-parametric flow and mass cytometry. Comput Struct Biotechnol J. 2020 Mar 31;18:874-886. doi: 10.1016/j.csbj.2020.03.024. PMID: 32322369; PMCID: PMC7163213.
[3] Liu X, Song W, Wong BY, Zhang T, Yu S, Lin GN, Ding X. A comparison framework and guideline of clustering methods for mass cytometry data. Genome Biol. 2019 Dec 23;20(1):297. doi: 10.1186/s13059-019-1917-7. PMID: 31870419; PMCID: PMC6929440.
[4] Wang K, Yang Y, Wu F, Song B, Wang X, Wang T. Comparative analysis of dimension reduction methods for cytometry by time-of-flight data. Nat Commun. 2023 Apr 1;14(1):1836. doi: 10.1038/s41467-023-37478-w. PMID: 37005472; PMCID: PMC10067013.