「青蓮聚焦」糖組學(xué)研究方法評(píng)估來了,哪些軟件性能更優(yōu)?
糖基化是復(fù)雜的蛋白翻譯后修飾之。與其他蛋白后修飾相比,糖基化不但會(huì)產(chǎn)生宏觀不均性(每個(gè)蛋白上可能有多個(gè)后修飾位點(diǎn)),更會(huì)產(chǎn)生大量的微觀不均性(每個(gè)位點(diǎn)上可能有幾十甚至上百種不同的后修飾基團(tuán))。并且糖鏈本身的離子化效率很低。因此大規(guī)模、高準(zhǔn)確性完整糖肽解析一直是蛋白質(zhì)翻譯后修飾分析領(lǐng)域極具挑戰(zhàn)性的工作。
糖蛋白質(zhì)組學(xué)是一種強(qiáng)大但在分析上具有挑戰(zhàn)性的研究工具。幫助解釋復(fù)雜糖肽串聯(lián)質(zhì)譜的軟件包已經(jīng)出現(xiàn),但它們的相對(duì)性能仍未經(jīng)過測(cè)試。

?
今天小編分享一篇2021年11月發(fā)表在nature methods雜志上的文章“Community evaluation of glycoproteomics informatics solutions reveals high-performance search strategies for serum glycopeptide analysis”。該研究通過?HUPO?人類糖蛋白組學(xué)計(jì)劃進(jìn)行,由糖蛋白組學(xué)軟件的開發(fā)人員和專家用戶團(tuán)隊(duì)(中國(guó)大陸團(tuán)隊(duì)復(fù)旦大學(xué)以及北京國(guó)家蛋白質(zhì)科學(xué)中心)首次全系統(tǒng)的評(píng)估了當(dāng)前完整糖肽分析信息學(xué)解決方案的性能。
研究人員使用兩種碎裂模式分別生成來自人血清的兩個(gè)糖蛋白質(zhì)組學(xué)原始質(zhì)譜數(shù)據(jù)(文件A和B)。得到的糖蛋白質(zhì)組學(xué)數(shù)據(jù)集與所有22個(gè)參與團(tuán)隊(duì)共享,將其歸類為糖蛋白質(zhì)組學(xué)軟件的開發(fā)者(9個(gè)團(tuán)隊(duì))和使用者(13個(gè)團(tuán)隊(duì)),所有團(tuán)隊(duì)都從質(zhì)譜數(shù)據(jù)中鑒定N-糖肽和O-糖肽并報(bào)告了他們的方法和鑒定結(jié)果。參與團(tuán)隊(duì)使用了不同的搜索引擎,其中13個(gè)使用者團(tuán)隊(duì)中有10個(gè)團(tuán)隊(duì)(~75%)使用了?Byonic軟件,不同團(tuán)隊(duì)的搜索設(shè)置差異很大。

最終獲得了軟件搜索設(shè)置的詳細(xì)信息和糖肽鑒定過程產(chǎn)生的輸出數(shù)據(jù),不同團(tuán)隊(duì)的輸出數(shù)據(jù)也有顯著差異。研究人員統(tǒng)計(jì)了這22個(gè)團(tuán)隊(duì)的糖基化位點(diǎn)鑒定數(shù)目以及對(duì)陽(yáng)性對(duì)照位點(diǎn)的鑒定效率,并精心設(shè)計(jì)了六個(gè)?(N1–N6)?和五個(gè)?(O1–O5)?性能測(cè)試指標(biāo)進(jìn)行評(píng)分,以評(píng)估不同團(tuán)隊(duì)鑒定N-糖肽和O-糖肽的能力。該測(cè)試用于綜合評(píng)估糖肽識(shí)別準(zhǔn)確性(特異性)和糖蛋白質(zhì)組覆蓋率(敏感性),這是糖蛋白質(zhì)組學(xué)中兩個(gè)關(guān)鍵性能特征。結(jié)果表明在軟件開發(fā)者團(tuán)隊(duì)中,Protein Prospector和Byonic搜索引擎對(duì)于糖基化的鑒定具有更好的綜合表現(xiàn)。在使用者團(tuán)隊(duì)中,Byonic的表現(xiàn)也優(yōu)于其它引擎,表明這個(gè)傳統(tǒng)的糖蛋白質(zhì)學(xué)分析軟件仍具有一定的優(yōu)勢(shì)。

值得注意的是,使用相同軟件的參與者之間報(bào)告的糖肽高度不一致,證實(shí)了搜索引擎以外的搜索變量也對(duì)糖肽數(shù)據(jù)分析產(chǎn)生了重大影響。研究人員探討了不同搜索參數(shù)設(shè)置(SS1-SS13)對(duì)11個(gè)使用Byonic?軟件的團(tuán)隊(duì)的糖蛋白質(zhì)組學(xué)數(shù)據(jù)輸出的影響。通過對(duì)參數(shù)的設(shè)置比較,研究人員提出允許一條肽段上存在多個(gè)糖基化位點(diǎn);縮小質(zhì)量偏差容忍范圍;放寬蛋白酶切的特異性,有助于糖肽段鑒定的準(zhǔn)確性和特異性。
目前可用于糖蛋白質(zhì)組學(xué)數(shù)據(jù)分析的大多數(shù)軟件都參與了這項(xiàng)研究??偠灾?,這項(xiàng)研究表明該領(lǐng)域有多種高性能信息學(xué)解決方案可用于糖蛋白質(zhì)組學(xué)數(shù)據(jù)分析,并闡明了關(guān)鍵性能的相關(guān)搜索策略,對(duì)糖蛋白質(zhì)組學(xué)軟件的開發(fā)人員和用戶具有一定的指導(dǎo)意義。

圖3:Byonic軟件的糖蛋白質(zhì)組學(xué)數(shù)據(jù)分析的搜索策略
? ? ?
文中提到的使用范圍廣、搜索性能優(yōu)的Byonic軟件正是青蓮糖基化修飾產(chǎn)品的檢索軟件,Byonic有著強(qiáng)大的糖肽搜索功能并配合國(guó)內(nèi)最全的糖庫(kù)(70多種O-糖、150多種N-糖糖型),可以同時(shí)獲得糖蛋白量的變化、修飾位點(diǎn)的變化、糖型信息、糖型位點(diǎn)蛋白序列信息。

