蛋白質(zhì)從頭測序原理解析
導讀
? 蛋白質(zhì)從頭測序是什么?
? 蛋白質(zhì)從頭測序分析流程是什么?
? 蛋白質(zhì)從頭測序數(shù)據(jù)分析的理論基礎是什么?
一、蛋白質(zhì)從頭測序的原理
簡單來說蛋白質(zhì)從頭測序就是不依賴于任何現(xiàn)有的DNA或者蛋白質(zhì)的數(shù)據(jù)庫信息,直接對蛋白質(zhì)氨基酸序列進行測定。蛋白質(zhì)從頭測序的原理是基于蛋白酶切后的肽段分子在質(zhì)譜檢測中有規(guī)律性的斷裂,找到特定斷裂模式,再根據(jù)質(zhì)譜峰之間質(zhì)量差即可算出對應的氨基酸信息,以及氨基酸上的翻譯后修飾。
蛋白質(zhì)從頭測序的優(yōu)勢特點
蛋白質(zhì)從頭測序法的一大特點就是可以不借助任何蛋白質(zhì)或者DNA數(shù)據(jù)庫信息,直接對蛋白質(zhì)的序列進行分析。相比傳統(tǒng)的質(zhì)譜數(shù)據(jù)庫搜索法有著不可比擬的優(yōu)勢,那就是從頭測序法可以應用于分析新物種的蛋白質(zhì)序列,以及基因組未被測序的物種的蛋白質(zhì)序列。
二、蛋白質(zhì)從頭測序的分析流程

蛋白質(zhì)從頭測序的分析流程
1. 使用蛋白酶對分離純化后的待測蛋白質(zhì)樣品進行酶切,將蛋白質(zhì)剪切成一定大小的多肽片段。(可以分別選用多種蛋白酶進行酶切,以確保蛋白質(zhì)的全序列可以被鑒定分析到)
2. 使用高效液相色譜對肽段酶切產(chǎn)物進行分離純化,這樣有利于接下來更為高效準確的質(zhì)譜分析。
3. 被分離的肽段再經(jīng)由質(zhì)譜分析前首先經(jīng)過軟電離處理使肽段帶上一定量的電荷,接著飛行進入質(zhì)譜儀。首先經(jīng)過一級質(zhì)譜對肽段離子進行篩選。
4. 經(jīng)過一級質(zhì)譜篩選后的肽段分子,再進入碰撞室,與室內(nèi)的碰撞氣體(常用的碰撞氣體通常有He,Ar,Xe,CH4等惰性氣體)進行碰撞誘導肽段共價鍵斷裂,產(chǎn)生子離子,再經(jīng)由二級質(zhì)譜(MS2)分析肽段序列。
5. 借助特定軟件對各個肽段的二級質(zhì)譜峰進行從頭序列分析,再對肽段序列拼接獲得蛋白質(zhì)全長序列。
上面我們講到了蛋白質(zhì)從頭測序的分析流程,熟悉質(zhì)譜鑒定的同學能夠發(fā)現(xiàn),蛋白質(zhì)從頭測序的實驗流程與常見的串聯(lián)質(zhì)譜分析大同小異,那么大家看到這可能想要問了,那么蛋白質(zhì)從頭測序法究竟是如何實現(xiàn)直接對蛋白質(zhì)的序列進行分析的呢?其實,從頭測序分析的核心就在于對二級質(zhì)譜峰的數(shù)據(jù)分析上面。那么接下來,小編就給大家詳細地介紹從頭測序數(shù)據(jù)分析的基礎原理。
三、蛋白質(zhì)從頭測序數(shù)據(jù)分析原理
小編在文章前面介紹蛋白從頭測序的原理時,也提到過蛋白質(zhì)從頭測序分析的理論基礎是基于肽段在二級質(zhì)譜誘導碎裂時是有規(guī)律地斷裂的。根據(jù)肽段斷裂的位置,可以產(chǎn)生不同種類的離子,在靠近N端的地方斷裂產(chǎn)生的離子有a,b,c三種類型的離子,在靠近C端的地方斷裂產(chǎn)生的離子有x,y,z三種類型。以N端斷裂離子為例,其中a型離子由第一個氨基酸C=O前面的C-C鍵斷裂產(chǎn)生的N端離子,b型離子是由第一個氨基酸和第二個氨基酸之間的C-N鍵斷裂產(chǎn)生N端離子,c型離子是由第二個氨基酸的N-C鍵斷裂形成的(如圖2所示)。對于N端端裂的離子來說,斷裂的位置不同產(chǎn)生多種不同的a,b,c型離子,為了進一步對在不同的斷裂點產(chǎn)生的同一類型的離子進行區(qū)分,每個離子下方都標記了羅馬數(shù)字指代斷裂的位置。(如圖2,a1,a3指代斷裂位置不同的同一類a型離子)

介紹完肽段碎裂的規(guī)律后,我們可以發(fā)現(xiàn)每個肽段碎裂產(chǎn)生的離子都有各自的特點,其中b型離子較為特殊,因為b型離子斷鍵的位置位于兩個氨基酸殘基之間,因此每兩個相鄰的b離子的質(zhì)量差等于NH2C2O-R(如圖3所示)。不同的氨基酸的R基質(zhì)量是不同的,因此,如果能夠在二級質(zhì)譜的眾多質(zhì)譜峰中確定b離子的峰圖,根據(jù)出兩個相鄰的b型離子的質(zhì)量差,就可計算出R基的質(zhì)量大小,然后根據(jù)R基即可確定對應的氨基酸。除此之外,如果氨基酸殘基上有翻譯后修飾,也可以使用b型離子間的質(zhì)量差來計算翻譯后修飾的質(zhì)量,從而推算可能的翻譯后修飾。

由于經(jīng)過一次碎裂碰撞,大多數(shù)肽段只會有一處斷裂,因此,只要在二級譜圖中找到b型離子的分布圖譜,那么每兩個b型離子的質(zhì)量差就是氨基酸的質(zhì)量,我們可以使用這一信息找到質(zhì)量匹配的氨基酸。
但是從二級譜圖中眾多的離子峰來確定b型離子的質(zhì)譜峰,涉及到復雜的建模以及概率推算,因此,依靠人工的方法選擇b型離子的峰圖是不現(xiàn)實的,目前有許多從頭測序分析的軟件可以幫助我們完成這一步驟,例如, PEAKS和NovoHMM等。不同的軟件對b型離子圖譜推算原理各有不同,但都是推測的數(shù)據(jù)需要與實際測得的圖譜進行多次比對,才能實現(xiàn)對序列的精準無誤的分析。