百趣代謝組學(xué)分享:從SWATH到MRM:一種新型高覆蓋度靶向代謝組學(xué)技術(shù)

百趣代謝組學(xué)文獻(xiàn)分享,SWATHtoMRM: Development of High-Coverage Targeted Metabolomics Method Using SWATH Technology for Biomarker Discovery,是由中國科學(xué)院生物與化學(xué)交叉研究中心,Dr. Zheng-Jiang Zhu課題組發(fā)表在AC上的一篇技術(shù)型文章。
代謝組學(xué)文獻(xiàn)分享—摘要
生物樣本代謝組存在高度復(fù)雜性,對大規(guī)模定量研究這些代謝物帶來極大的挑戰(zhàn),嚴(yán)重限制了代謝組學(xué)在生物標(biāo)志物發(fā)現(xiàn)研究中的運(yùn)用。靶向代謝組學(xué)研究主要運(yùn)用MRM技術(shù),具有極高的定量能力,但卻受制于較為有限的覆蓋度。為了解決這一挑戰(zhàn),作者開發(fā)了一項(xiàng)新的技術(shù)策略——SWATHtoMRM,巧妙的運(yùn)用了SWATH技術(shù)的高覆蓋度特點(diǎn)來開發(fā)高覆蓋度的靶向代謝組學(xué)方法。
首先,運(yùn)用SWATH技術(shù)對一個生物混樣進(jìn)行非靶向代謝譜分析,以獲取其中“所有”代謝物的二級譜圖 (MS2);然后從中提取MRM離子對信息,用于構(gòu)建高達(dá)1000-2000代謝物覆蓋度的靶向代謝組學(xué)分析;隨后,作者又展示了這種方法在定量代謝組學(xué)中優(yōu)勢,例如:覆蓋度、重復(fù)性、靈敏度和動態(tài)范圍等。最后,作者運(yùn)用SWATHtoMRM技術(shù)尋找colorectal cancer (CRC)診斷標(biāo)志物,單針進(jìn)樣便可完成多達(dá)1303種代謝物MRM檢測。從CRC病人組織中發(fā)現(xiàn)并驗(yàn)證了20種潛在診斷標(biāo)志物。其中17種標(biāo)志代謝物在CRC病人血漿中被進(jìn)一步驗(yàn)證與腫瘤切除相關(guān),有著極大的CRC術(shù)后預(yù)后標(biāo)志物潛力。
SWATHtoMRM技術(shù)為我們提供了一種全新的途徑來開發(fā)高覆蓋度的靶向代謝組學(xué)方法,將促進(jìn)靶向代謝組學(xué)在疾病標(biāo)志物發(fā)現(xiàn)研究中的應(yīng)用。
代謝組學(xué)文獻(xiàn)分享—背景
代謝組學(xué)旨在系統(tǒng)性定量檢測所有代謝物的動態(tài)變化,為疾病表型提供一個綜合的特征描述,以便于疾病標(biāo)志物的發(fā)現(xiàn)。代謝物具有廣泛的結(jié)構(gòu)多樣性和懸殊的濃度范圍(>109)。因此,代謝組學(xué)研究要求分析技術(shù)具有廣泛覆蓋度、高靈敏性和特異性以及寬動態(tài)范圍。
液質(zhì)聯(lián)用(LC-MS)技術(shù)是較為流行的代謝譜分析技術(shù)之一,包括靶向和非靶向兩種方式。非靶向代謝組學(xué)多運(yùn)用高分辨質(zhì)譜(TOF/Orbitrap)來檢測盡量多的代謝物,具有很寬的覆蓋度,但是受限于動態(tài)范圍、定量精度以及靈敏度等。相反,基于LC-MS的靶向代謝組學(xué)技術(shù)主要使用MRM技術(shù),能夠精確定量一定數(shù)量(100-300)的已知代謝物。
靶向代謝組學(xué)技術(shù)作為代謝物定量的金標(biāo)準(zhǔn),具有較高的靈敏度、動態(tài)范圍和較好的重現(xiàn)性。然而,較低的代謝物覆蓋度成為了靶向代謝組學(xué)的主要運(yùn)用瓶頸,因此,開發(fā)一種具有高覆蓋度的靶向方法來準(zhǔn)確定量在非靶向代謝組學(xué)中檢測到的已知/未知代謝物至關(guān)重要。
針對MRM覆蓋度低這一瓶頸,近期已有多篇文章著手開發(fā)高覆蓋度的靶向代謝組學(xué)技術(shù)。 但這些技術(shù)往往需要很長的機(jī)時(20-30針, 有的甚至需要80針)來獲取代謝物的二級譜圖,嚴(yán)重限制了該技術(shù)的通量;使用常規(guī)的DDA采集模式來獲取代謝物二級譜圖也是這些方法中的一種,但由于DDA模式本身的隨機(jī)性和偏好性,使得這種采集方式重復(fù)性低,覆蓋度也偏低。不同于DDA采集模式,DIA/SWATH模式能夠高效、高覆蓋度獲取“所有”代謝物的二級譜圖,在近幾年被不斷開發(fā)用于非靶向代謝組學(xué)研究。
盡管SWATH技術(shù)能夠同時采集所有代謝物的二級碎片離子信息,但是在復(fù)雜生物樣品中,它的定量動態(tài)范圍和重復(fù)性都受到了很大的限制。正是由于任何單一技術(shù)都不是廣泛適用的,本文作者集各家之所長,將SWATH技術(shù)強(qiáng)大的定性能力與MRM技術(shù)的精確定量能力完美結(jié)合,開發(fā)出了SWATHtoMRM技術(shù)。
代謝組學(xué)文獻(xiàn)分享—方法
LC-MS方法
為了保證SWATH采集到的代謝物二級碎片離子信息與MRM中所使用的Q1/Q3離子對信息相對應(yīng),需要保證液相條件(RT)完全一致,并盡量保證SWATH采集所使用的Q-TOF質(zhì)譜儀(TripleTOF 6600)與MRM采集所使用的QQQ質(zhì)譜儀(Agilent 6495 QQQ)具有相對一致的各項(xiàng)參數(shù)(CE,DP等)。
數(shù)據(jù)處理方法
SWATHtoMRM流程
SWATHtoMRM技術(shù)的分析流程已整理成R包,用于從SWATH數(shù)據(jù)中大規(guī)模提取MRM離子對信息,該R包可以在(http://www.zhulab.cn/software.php)下載安裝。整個流程分為兩步(圖1):

圖1. (a) SWATHtoMRM 技術(shù)流程概覽。 (b) 從SWATH數(shù)據(jù)中提取虛擬MS2圖譜。 (c) 將來自多個樣品的MS2譜圖合并為consensus 譜圖,保留出現(xiàn)頻率超過50%的碎片離子,并用于生成MRM離子對。
1.非靶向分析SWATH數(shù)據(jù)
a) 使用XCMS包中的CentWave算法實(shí)現(xiàn)色譜峰(LC peak)識別,然后用CAMERA進(jìn)行質(zhì)譜峰(MS peak)注釋,并去除同位素峰和小于1000的弱信號峰。對于多個數(shù)據(jù)文件,使用OBI-Warp算法進(jìn)行峰對齊?!鶰S1 LC peak 。
b) 針對每一個MS1peak,從峰頂位置找到對應(yīng)RT的混合MS2譜圖,并過濾掉小于200的弱信號值、同位素離子以及大于母離子m/z的碎片離子。提取保留的碎片離子色譜峰(EIC)。→MS2 LC peak 。
c) 通過計(jì)算每一個碎片離子EIC與母離子EIC之間的相關(guān)性得分(PPC score),將得分大于0.8的碎片離子EIC和對應(yīng)母離子EIC歸為一組,得到peak group(一個母離子EIC +多個碎片離子EIC),然后對每個peak group生成一張?zhí)摂M二級譜圖?!?Pseudo MS2 spectrum。
d) 將來自多個樣品的相同MS1 peak的二級譜圖合并為一張譜圖(consensus MS2)。合并原則為:保留出現(xiàn)頻率超過50%的碎片離子,合并后的m/z為mean(m/z),intensity %為 mean(intensity %)?!?Consensus MS2 spectrum。
2.生成MRM離子對信息
a) 采用3個原則評估consensus MS2中每一個碎片離子:(1)m/z(product ion)<m/z(precursor ion)-14.0126 Da,即在離子碎裂過程中至少有一個(CH?)基團(tuán)從母離子丟失;(2)剔除中性丟失H?O、NH?或者CO?產(chǎn)生的碎片離子(也可自定義其他類型);(3)選擇剩余例子中強(qiáng)度最高的碎片離子作為MRM離子對。最后,使用Agilent MassHunter構(gòu)建schedule MRM方法,最小dwell 時間 5ms,cycle time為990ms。
代謝組學(xué)文獻(xiàn)分享—結(jié)果與討論
SWATHtoMRM 流程評估
首先,作者測試了SWATHtoMRM技術(shù)在多種生物樣品,例如,人類尿液、結(jié)腸直腸組織以及Jurkat細(xì)胞中的適用性。
以人尿液樣品為例,3554個MS1 feature在SWATH數(shù)據(jù)中被檢測到,其中950個同位素峰和弱信號峰被初步過濾。剩余的2604個代謝物峰中,2091 (80.3%) 個代謝物具有合適的MRM離子對信息,其他代謝物峰由于不滿足PPC > 0.8這一條件被進(jìn)一步剔除。通過手動分析2091個MRM離子對結(jié)果發(fā)現(xiàn),多達(dá)1614 (77.2%) 個代謝物成功在尿液樣品中檢測到(圖2a)。
類似的,在其他類型樣品中得到了接近的檢出率(76 - 80%)。 本次實(shí)驗(yàn)中僅采用了正離子模式,但負(fù)離子模式也是完全適用的。
圖2b詳細(xì)演示了通過SWATHtoMRM構(gòu)建MRM離子對的過程。 以taurine這個代謝物(m/z = 126.0212 Da,RT= 518 s)為例:首先,包含多個代謝物碎片離子的多重二級譜圖被提取出來。然后根據(jù)與母離子EIC之間的相關(guān)性PPC,保留得分大于0.8 的碎片離子。隨后,將來自多個樣品的同一代謝物二級譜圖合并,得到一張包含13個碎片離子的consensus二級譜圖。最后,從中選擇響應(yīng)強(qiáng)度最高的碎片離子(m/z = 44.0496 Da)構(gòu)建taurine的MRM離子對(Q1/Q3, 126.0/44.0)。

圖2. (a) 使用人尿液樣品大規(guī)模生成MRM離子對。(b) 代謝物taurine的離子對生成過程。 (c) 從不同類型生物樣品(尿液,組織和細(xì)胞)中檢測到的MRM離子對統(tǒng)計(jì)信息。
SWATHtoMRM技術(shù)的覆蓋度評估
為了證實(shí)這一技術(shù)具有廣泛的覆蓋度,作者將SWATHtoMRM方法與DDA方法做了系統(tǒng)的比較。使用相同的尿液樣品,相同的儀器參數(shù),連續(xù)采集SWATH和DDA數(shù)據(jù)。后續(xù)的數(shù)據(jù)分析也采用相似的參數(shù)自動化進(jìn)行,以較大的降低主觀偏好性。從相同的尿液樣品中,分別檢測出2604(SWATH)和2149(DDA)個feature(圖3a, 3b)。比較兩者的二級譜圖覆蓋度,SWATH(2105, 80.8%)顯著高于DDA(1174, 54.6%)。二級覆蓋度在兩者共享feature中,SWATH(84.9%)也顯著高于DDA(61.1%)。
SWATH與DDA技術(shù)分別成功構(gòu)建2091和1163個MRM離子對,其中852個是共享離子對(圖3c)。在這852個共享離子對中,分別有87.2%(SWATH)和88.7%(DDA)的檢出率,兩種方法具有接近的檢出率,說明SWATH技術(shù)生成的MRM離子對信息是可靠的(圖3d)。 但是從總檢出數(shù)上來看,SWATH技術(shù)比DDA多出66%的代謝物。簡言之,SWATH技術(shù)具有與DDA相似的數(shù)據(jù)質(zhì)量,同時又顯著超越了DDA的檢測數(shù)量。

圖3. 從SWATH數(shù)據(jù)中生成的MRM離子對具有很廣的覆蓋度。(a) 韋恩圖展示了SWATH與DDA技術(shù)檢測到的共享和特有feature。(b) SWATH與DDA數(shù)據(jù)中MS1和MS2的分布圖。紅/藍(lán)=有MS2,灰色=無MS2。(c) 兩種方法構(gòu)建的MRM離子對數(shù)目比較。(d) 兩種方法檢測到的代謝物數(shù)目比較。
SWATHtoMRM定量性能評估
為了評估SWATHtoMRM技術(shù)的定量性能,作者對比了SWATHtoMRM,SWATH-MS1以及SWATH-MS2 3種技術(shù)間的靈敏度、動態(tài)范圍和重復(fù)性。首先,梯度稀釋尿液樣品,分別進(jìn)行SWATHtoMRM和SWATH采集,然后隨機(jī)選擇629個檢測到的代謝物進(jìn)行比較。
1.靈敏度:比較不同稀釋梯度中代謝物檢出數(shù)來評估,結(jié)果SWATHtoMRM > SWATH-MS1= SWATH-MS2(圖4a)。將這一比較細(xì)化到不同豐度范圍代謝物中,同樣是SWATHtoMRM優(yōu)勝,尤其是在低豐度代謝物中(圖4b)。
2.動態(tài)范圍:比較不同稀釋梯度中,629個代謝物的定量線性范圍(R2)來評估,結(jié)果SWATHtoMRM > SWATH-MS1> SWATH-MS2,SWATHtoMRM數(shù)據(jù)中R2> 0.8的代謝物超過了80%,而SWATH-MS1和SWATH-MS2則不到60%(圖4c)。
3.重復(fù)性:通過比較相鄰稀釋梯度的代謝物檢出強(qiáng)度比值來評估。統(tǒng)計(jì)629個代謝物在兩組相鄰稀釋梯度間檢出強(qiáng)度比值(4×:16×、16×:64×,log2(理論值)=2),結(jié)果表明SWATHtoMRM > SWATH-MS1> SWATH-MS2,SWATHtoMRM技術(shù)在不同的稀釋梯度組合中具有接近的中位值以及較窄的分布,同時SWATH-MS1也是優(yōu)于SWATH-MS2的,SWATH-MS2在16×:64×組合中,比值中位數(shù)已經(jīng)嚴(yán)重偏離了理論值(4倍),并且具有很寬的分布范圍(圖4e)。

圖4. SWATHtoMRM技術(shù)定量性能評估。(a) 3種方法在不同稀釋梯度中的代謝物檢出數(shù)比較。 (b) 細(xì)化到不同豐度范圍時代謝物檢出數(shù)。(c)R2累積分布,從R2=1到R2=0.8,滿足條件的代謝物數(shù)目逐漸增多。(d) 列舉了兩種實(shí)際代謝物的定量線性范圍。(e) 兩個相鄰稀釋梯度間的比值分布圖。
SWATHtoMRM實(shí)用性評估
為了評估SWATHtoMRM技術(shù)的實(shí)用性能,作者將該技術(shù)運(yùn)用于結(jié)腸癌(CRC)診斷標(biāo)志物的發(fā)現(xiàn)研究(18對樣品作為訓(xùn)練集,42對用作驗(yàn)證集)。利用pooled QC樣品構(gòu)建了1705個MRM離子對,并成功檢測到了其中的1303(76.4%)個代謝物。總共有1213(93.1%)個代謝物在>4個實(shí)際組織樣品中加測到,并用于后續(xù)統(tǒng)計(jì)分析。從QC樣品的RSD以及PCA分析結(jié)果來看,SWATHtoMRM在重復(fù)性和靈敏度方面顯著優(yōu)于SWATH-MS1技術(shù),主要表現(xiàn)在更低中位RSD值和較窄的RSD分布(圖5a),以及PCA得分圖中更小的組內(nèi)離散度和更大的組間分離度(圖5b)。
在生物標(biāo)志物發(fā)現(xiàn)研究階段,1303個代謝物中有358個具有統(tǒng)計(jì)學(xué)差異(fold-change >1.5, p-value > 0.01),其中67個被成功鑒定。隨后,使用PLS-DA模型分析了CRC癌組織與癌旁組織的代謝物差異,VIP最高的20個代謝物被定義為潛在生物標(biāo)志物(圖5d),并具有極好的辨別能力(AUC = 1)。接下來,作者在驗(yàn)證集樣品中檢測了這20個代謝物,并評估了其預(yù)測精度,結(jié)果發(fā)現(xiàn)這些代謝物在驗(yàn)證集樣品中同樣具有極好的辨別能力(AUC=0.998,95% CI)(圖5e)。
最后,作者使用CRC病人手術(shù)切除前后血漿樣品來評估了這些代謝物的預(yù)后標(biāo)志物潛力。其中17個代謝物表現(xiàn)出可靠的預(yù)測能力(AUC = 0.779,95% CI,sensitivity = 91.2%,specificity = 64.7%)(圖5f)。

圖5. (a) QC樣品中檢測到的1213個代謝物RSD值分布。(b) 分別使用SWATH-MS1和SWATHtoMRM技術(shù)檢測癌組織和癌旁組織中代謝物得到的PCA打分。(c)生物標(biāo)志物發(fā)現(xiàn)研究的SWATHtoMRM實(shí)驗(yàn)流程。(d) 火山圖展示1213個檢測到的代謝物,紅色點(diǎn)表示定義的20個潛在生物標(biāo)志物。(e) 使用驗(yàn)證集組織樣品的20個代謝物構(gòu)建的PLS預(yù)測模型ROC曲線(左)和概率分布圖(右)。(f) 使用驗(yàn)證集血漿樣品的17個代謝物構(gòu)建的PLS預(yù)測模型ROC曲線(左)和概率分布圖(右)。
代謝組學(xué)文獻(xiàn)分享—總結(jié)
作者開發(fā)了一種新的靶向代謝組學(xué)技術(shù)—SWATHtoMRM,可同時檢測高達(dá)1000-2000個代謝物。并從多個角度詳細(xì)對比了SWATHtoMRM與DDA、SWATH-MS1以及SWATH-MS2技術(shù)之間的優(yōu)劣。與DDA相比,SWATHtoMRM技術(shù)能夠構(gòu)建更多的MRM離子對。而與SWATH-MS技術(shù)相比,SWATHtoMRM具有更好的重復(fù)性、更高的靈敏度和更廣的覆蓋度。同時通過實(shí)際案例探究了該方法在代謝物生物標(biāo)志物發(fā)現(xiàn)研究中的巨大潛力。