最新綜述 | 基于質(zhì)譜的體液蛋白質(zhì)組學:未來已來
基于質(zhì)譜的蛋白質(zhì)組學分析是發(fā)現(xiàn)疾病生物標志物的有力手段。近期蛋白組學領軍人物Matthias Mann團隊在《Molecular & Cellular Proteomics》特約專欄發(fā)表了題為“MS-Based Proteomics of Body Fluids: The End of the Beginning”的最新綜述,總結了不斷成熟的樣本前處理、蛋白檢測、數(shù)據(jù)分析方法,展望了基于質(zhì)譜的體液蛋白質(zhì)組學走向臨床應用的廣闊前景。

文章標題:MS-Based Proteomics of Body Fluids: The End of the Beginning
發(fā)表期刊:Molecular & Cellular Proteomics?
刊發(fā)時間:2023年5月

完善的樣品前處理技術已實現(xiàn)?
在過去的幾年里血漿蛋白質(zhì)組學發(fā)生了翻天覆地的變化,前處理的完善實現(xiàn)了血漿蛋白質(zhì)組檢測深度的大幅度提升,自動化推進了其快速檢測?,F(xiàn)在前處理已有完善的處理方案,全自動化或半自動化的液體處理機器人已得到廣泛使用。樣品制備過程也得到了簡化,例如,通常用于在質(zhì)譜分析之前所涉及到的蛋白質(zhì)提取酶切等獨立步驟,現(xiàn)在可以通過磁珠沉淀方法與酶切步驟進行合并,集成到全自動流程中。面對高豐度蛋白的挑戰(zhàn),除了常規(guī)的去除高豐富蛋白排除其信號干擾以達到檢測低豐度蛋白的目的。還有通過具有特定表面化學結構的納米顆粒也被用來選擇性地富集低豐度的蛋白質(zhì)。例如Seer平臺基于磁珠富集的ProteoMiner蛋白富集試劑盒,當樣本分成多餾分進行檢測時,可以達到數(shù)千個血漿蛋白的鑒定深度。

靈敏度的提高使得縮短梯度增加通量成為現(xiàn)實
隨著性能更強且更穩(wěn)定的商業(yè)化色譜柱的大范圍應用,短柱與短梯度的新方法極大地增加了通量。商業(yè)化色譜柱現(xiàn)在可以持續(xù)以往10倍的時間,性能更穩(wěn)定。與蛋白質(zhì)組學中典型的nl/min流速相比,Sciex率先采用了流速較短的梯度,現(xiàn)在已廣泛應用于各種平臺。色譜柱的內(nèi)徑達1 mm,在μl/min的流速下,短梯度中可以產(chǎn)生良好的分離效果并且更加耐用,但需要更多的填料。極端情況下,經(jīng)典HPLC色譜柱的梯度非常短,流速為mL/min,可在幾分鐘內(nèi)完成整個測試,盡管這是以蛋白質(zhì)組深度為代價的,但鑒于最近靈敏度的提高,這些方法正變得逐漸可行。特別是在血漿研究中,總蛋白量的受限比蛋白質(zhì)組學其他領域要小。
DIA與多路復用結合解決缺失值與高通量問題?
近年來,數(shù)據(jù)獨立采集(DIA)MS的成熟和廣泛采用是一項標志性的里程碑。DIA技術對肽段離子的采樣更加均勻,從而使數(shù)據(jù)更加完整,增強了蛋白質(zhì)組的深度,并提高了靈敏度。因此,除了一些特定的工作流,如TMT標記,DIA在很大程度上取代了依賴性的數(shù)據(jù)采集(DDA)方法。DIA通常需要光譜庫來匹配采集運行,算法的發(fā)展正日益減少對實驗性庫的需求,DIA技術已可以實現(xiàn)無建庫的“direct DIA”。TMT(Tandem Mass Tags,TMT)體外同位素標記技術也是目前流行的質(zhì)譜技術,采用多個(6-18)穩(wěn)定同位素標簽,特異性標記多肽的氨基基團,經(jīng)高精度質(zhì)譜儀串聯(lián)質(zhì)譜分析,能夠同時比較多達18種不同樣本中蛋白質(zhì)的相對含量。TMT樣品通常通過分餾分以實現(xiàn)高蛋白質(zhì)組覆蓋率,由于不同肽在報告通道中的串擾和復雜的衍生化要求,TMT的定量存在固有挑戰(zhàn),因此這種定量策略在常規(guī)臨床中難以建立。對于大隊列測量,DIA技術有著不可替代的優(yōu)勢。
針對非標技術檢測有著高缺失值的問題,多路復用蛋白質(zhì)組可以解決,但該技術限制了蛋白質(zhì)組的深度。多重數(shù)據(jù)非依賴性采集(mDIA或plexDIA)技術的出現(xiàn)避免了這一限制。mDIA里引入一個參考通道(reference channel)可實現(xiàn)雙倍蛋白質(zhì)的鑒定和定量。通過匹配保留時間、離子遷移率和質(zhì)量轉移,參考通道中每個肽特征的輪廓被轉移到目標通道上,產(chǎn)生需要整合信號以進行量化的精確區(qū)域。這種方法將鑒定和定量分離,增加了定量肽和蛋白質(zhì)的數(shù)量,并大大提高了DIA蛋白質(zhì)組學的可重復性和穩(wěn)健性。mDIA工作流程與TMT工作流程相比,不存在壓縮效應,利用數(shù)據(jù)非依賴性采集(DIA)技術,通過自動化和完整的二甲基化標記(二甲基化標記具有簡單、可靠、成本效益高等優(yōu)點)實現(xiàn)多重標記,以提高蛋白質(zhì)組學的深度、通量和穩(wěn)定性。mDIA在常規(guī)蛋白質(zhì)組分析中保留了DIA的大部分優(yōu)點,同時將通量提高了三倍。
基于質(zhì)譜的蛋白質(zhì)組學與親和結合技術對比
與基于質(zhì)譜技術的蛋白質(zhì)組學相比,親和結合技術在蛋白質(zhì)組深度和樣品通量方面一直處于領先地位。親和結合蛋白質(zhì)組學研究在幾年前僅限于數(shù)百個樣本,而在資金充足的情況下,對數(shù)以萬計的個體進行人口研究也是可行的。這與基于質(zhì)譜的蛋白質(zhì)組學的幾千個樣本的通量形成了鮮明對比。
親和結合的蛋白質(zhì)組學方法有望實現(xiàn)更大的規(guī)模,并可能在未來幾年解決目前對特異性的擔憂。質(zhì)譜在蛋白質(zhì)組深度、樣品通量以及定量和工藝方面的進一步改進方面也正朝著同樣的方向發(fā)展。此外,質(zhì)譜還適用于研究親和技術難以觸及的其他蛋白質(zhì)組學方面。包括蛋白質(zhì)的異構體、多肽和翻譯后修飾。例如,分泌蛋白的糖基化是血漿蛋白的常見修飾,而血紅蛋白的糖基化是監(jiān)測糖尿病患者血糖水平的金標準,基于質(zhì)譜的蛋白質(zhì)組學很容易檢測到這一點,但目前還沒有親和結合的測定方法。

靈敏度提高使縮短梯度增加通量成為現(xiàn)實
隨著性能更強且更穩(wěn)定的商業(yè)化色譜柱的大范圍應用,短柱與短梯度的新方法極大地增加了通量。商業(yè)化色譜柱現(xiàn)在可以持續(xù)以往10倍的時間,性能更穩(wěn)定。與蛋白質(zhì)組學中典型的nl/min流速相比,Sciex率先采用了流速較短的梯度,現(xiàn)在已廣泛應用于各種平臺。色譜柱的內(nèi)徑達1 mm,在μl/min的流速下,短梯度中可以產(chǎn)生良好的分離效果并且更加耐用,但需要更多的填料。極端情況下,經(jīng)典HPLC色譜柱的梯度非常短,流速為mL/min,可在幾分鐘內(nèi)完成整個測試,盡管這是以蛋白質(zhì)組深度為代價的,但鑒于最近靈敏度的提高,這些方法正變得逐漸可行。特別是在血漿研究中,總蛋白量的受限比蛋白質(zhì)組學其他領域要小。
DIA與多路復用解決缺失值與高通量問題
近年來,數(shù)據(jù)獨立采集(DIA)MS的成熟和廣泛采用是一項標志性的里程碑。DIA技術對肽段離子的采樣更加均勻,從而使數(shù)據(jù)更加完整,增強了蛋白質(zhì)組的深度,并提高了靈敏度。因此,除了一些特定的工作流,如TMT標記,DIA在很大程度上取代了依賴性的數(shù)據(jù)采集(DDA)方法。DIA通常需要光譜庫來匹配采集運行,算法的發(fā)展正日益減少對實驗性庫的需求,DIA技術已可以實現(xiàn)無建庫的“direct DIA”。TMT(Tandem Mass Tags,TMT)體外同位素標記技術也是目前流行的質(zhì)譜技術,采用多個(6-18)穩(wěn)定同位素標簽,特異性標記多肽的氨基基團,經(jīng)高精度質(zhì)譜儀串聯(lián)質(zhì)譜分析,能夠同時比較多達18種不同樣本中蛋白質(zhì)的相對含量。TMT樣品通常通過分餾分以實現(xiàn)高蛋白質(zhì)組覆蓋率,由于不同肽在報告通道中的串擾和復雜的衍生化要求,TMT的定量存在固有挑戰(zhàn),因此這種定量策略在常規(guī)臨床中難以建立。對于大隊列測量,DIA技術有著不可替代的優(yōu)勢。
針對非標技術檢測有著高缺失值的問題,多路復用蛋白質(zhì)組可以解決,但該技術限制了蛋白質(zhì)組的深度。多重數(shù)據(jù)非依賴性采集(mDIA或plexDIA)技術的出現(xiàn)避免了這一限制。mDIA里引入一個參考通道(reference channel)可實現(xiàn)雙倍蛋白質(zhì)的鑒定和定量。通過匹配保留時間、離子遷移率和質(zhì)量轉移,參考通道中每個肽特征的輪廓被轉移到目標通道上,產(chǎn)生需要整合信號以進行量化的精確區(qū)域。這種方法將鑒定和定量分離,增加了定量肽和蛋白質(zhì)的數(shù)量,并大大提高了DIA蛋白質(zhì)組學的可重復性和穩(wěn)健性。mDIA工作流程與TMT工作流程相比,不存在壓縮效應,利用數(shù)據(jù)非依賴性采集(DIA)技術,通過自動化和完整的二甲基化標記(二甲基化標記具有簡單、可靠、成本效益高等優(yōu)點)實現(xiàn)多重標記,以提高蛋白質(zhì)組學的深度、通量和穩(wěn)定性。mDIA在常規(guī)蛋白質(zhì)組分析中保留了DIA的大部分優(yōu)點,同時將通量提高了三倍。
基于質(zhì)譜的蛋白質(zhì)組學 VS 親和結合技術
與基于質(zhì)譜技術的蛋白質(zhì)組學相比,親和結合技術在蛋白質(zhì)組深度和樣品通量方面一直處于領先地位。親和結合蛋白質(zhì)組學研究在幾年前僅限于數(shù)百個樣本,而在資金充足的情況下,對數(shù)以萬計的個體進行人口研究也是可行的。這與基于質(zhì)譜的蛋白質(zhì)組學的幾千個樣本的通量形成了鮮明對比。
親和結合的蛋白質(zhì)組學方法有望實現(xiàn)更大的規(guī)模,并可能在未來幾年解決目前對特異性的擔憂。質(zhì)譜在蛋白質(zhì)組深度、樣品通量以及定量和工藝方面的進一步改進方面也正朝著同樣的方向發(fā)展。此外,質(zhì)譜還適用于研究親和技術難以觸及的其他蛋白質(zhì)組學方面。包括蛋白質(zhì)的異構體、多肽和翻譯后修飾。例如,分泌蛋白的糖基化是血漿蛋白的常見修飾,而血紅蛋白的糖基化是監(jiān)測糖尿病患者血糖水平的金標準,基于質(zhì)譜的蛋白質(zhì)組學很容易檢測到這一點,但目前還沒有親和結合的測定方法。

生物標志物panel通常由10~20個蛋白質(zhì)組成
矩形策略現(xiàn)在已經(jīng)能夠在多種體液中發(fā)現(xiàn)生物標志物。而特異性指示疾病的單一生物標志物是很少見的,因此作為生物標志物測試的是組合蛋白而不是單個蛋白。蛋白質(zhì)組學通常會產(chǎn)生一組生物標志物,這些生物標志物單獨情況下的差異倍數(shù)可能不大,但組合起來所捕獲的體液蛋白組信息可解析多因素并準確診斷疾病狀態(tài)。作者強調(diào)了蛋白質(zhì)組合相比單一蛋白質(zhì)分析物的優(yōu)勢,結合最近的經(jīng)驗進一步表明,這些panel通常由10到20個蛋白質(zhì)組成,一起對患者進行分類。
體液蛋白質(zhì)組學已走向臨床應用?
在臨床中,質(zhì)譜蛋白質(zhì)組學的非偏好性質(zhì)使它非常適合于發(fā)現(xiàn)。不需要事先洞察或開發(fā)蛋白質(zhì)特異性試劑避免了候選方法費時的建立和驗證,而且不需要對疾病機制的先驗知識或深入了解。隨著技術的進步,如基于DIA的策略和越來越強大的質(zhì)譜儀,將越來越多的目標納入質(zhì)譜分析的范圍。之前由于魯棒性、通量、重現(xiàn)性的問題使得質(zhì)譜在常規(guī)臨床診斷中的應用很少。但在過去幾年中質(zhì)譜取得了巨大的進步。例如,血漿蛋白質(zhì)組可一分鐘非靶向測量實現(xiàn)了COVID-19 嚴重程度的高通量和可靠分類。這一產(chǎn)量已經(jīng)可以與臨床實驗室的常規(guī)質(zhì)譜小分子分析相媲美,后者通常需要在幾秒鐘到幾分鐘內(nèi)進行測量。在可重復性方面,全球多個學術實驗室的日間非靶向蛋白質(zhì)組測量顯示,變異中位數(shù)系數(shù)低于20%。MS的分析過程兼容自動化和ISO規(guī)范質(zhì)量管理。正如臨床實驗室使用質(zhì)譜進行小分子測量所表明的那樣,質(zhì)譜在設置、操作、故障排除和分析方面也比免疫分析更加復雜。質(zhì)譜分析的實際邊際成本相當?shù)停谀承┬》肿优R床實驗室環(huán)境下,甚至可以低至每個樣本1美元。質(zhì)譜還在一次運行中分析了許多分析物,這是現(xiàn)有ELISA檢測方法所做不到的。在靶向質(zhì)譜分析中也是如此,這種方法能夠很容易地測量生物標志物panel中發(fā)現(xiàn)的典型蛋白質(zhì)。與傳統(tǒng)的ELISA或親和結合技術相比,這種多路復用、高特異性和定量準確性是質(zhì)譜的關鍵優(yōu)勢。

參比蛋白質(zhì)組減輕了對絕對定量的需求
在臨床實踐中廣泛需要絕對定量,即血漿中的pg/ml值或其一些替代值,以確保測量結果的可解釋性、可追溯性和可轉移性。MS中的這種絕對定量通??梢酝ㄟ^在工作流程中的某個點添加已知的摻入標準來實現(xiàn)。但完全嚴謹?shù)臉藴驶⒉蝗菀祝仪疤幚淼目勺冃圆]有得到消除。更普遍地說,絕對定量的概念最初并不嚴謹。例如,尿生物標志物/分析物常規(guī)地標準化為尿肌酐,以通過考慮腎臟中的水重吸收來確保可解釋性。這表明絕對定量并不總是有意義的,其次,使用歸一化和相對定量數(shù)據(jù)在臨床實踐已經(jīng)被接受。體液蛋白質(zhì)組學的經(jīng)驗表明,在某些情況下與絕對定量相比,體液蛋白質(zhì)組的相對定量可能是一種更可靠和可解釋的標準化措施。此外,它還具有很大的分析優(yōu)勢:將分析物與內(nèi)源性蛋白質(zhì)組相關聯(lián)可以解釋采樣、儲存、運輸和處理步驟引入的變異。

下一步廣泛應用需解決的困難和問題
從更廣闊的角度來看,蛋白質(zhì)組學領域還需要越來越多地關注非技術方面,包括開發(fā)與隱私保護法規(guī)兼容的基礎設施以及與醫(yī)學界進行更多的溝通。應共同選擇生物標志物需求和合適的研究群體并優(yōu)先考慮。臨床用途必須明確定義并可操作,例如,通過干預引導治療或改變生活方式。此外,所設想的生物標志物及其所引導的行動需要對患者和整個醫(yī)療系統(tǒng)具有良好的風險效益和成本效益比。當定義一種沒有有效的治療疾病的新分子亞型或診斷時,其難點在于生物標記物未被發(fā)現(xiàn)的情況下,不能對作用的益處進行研究。還有就是如果沒有激勵公司或醫(yī)療行業(yè)的參與者繼續(xù)生物標志物候選,財務方面就會成為一個關鍵問題。要進行大規(guī)模的驗證,需要以多中心驗證的形式提供強有力的證據(jù)。此外,應用于常規(guī)臨床將需要監(jiān)管部門的批準,這是一個漫長而昂貴的過程。與臨床實驗室、公司、監(jiān)管機構以及資助機構和報銷機構的合作將是關鍵。
展望
體液蛋白質(zhì)組學的許多挑戰(zhàn)現(xiàn)在已經(jīng)被克服,許多研究已經(jīng)在獨立的隊列中得到了驗證。生物標志物雖仍集中在高豐度范圍內(nèi),但也表明隨著技術的進步正在將可檢測的體液蛋白質(zhì)組的邊界推向較低豐度范圍,還有更多的生物標志物等待發(fā)現(xiàn)。曾經(jīng)的挑戰(zhàn)已變?yōu)樨敻?,基于質(zhì)譜的體液蛋白質(zhì)組學已做好準備走向未來。