突破代謝組學化合物鑒定技術(shù)瓶頸:標品庫管理背后的故事
關(guān)于代謝組學數(shù)據(jù)庫
代謝組學
代謝組學是近年來關(guān)注度持續(xù)高漲的組學技術(shù)方向,而代謝組公認目前最大的技術(shù)瓶頸就是——代謝物鑒定,尤其是對于非靶向代謝組學研究,如果鑒定不準確,即便檢測體系能檢測到的數(shù)據(jù)量再多、定量能力再靈敏、定量結(jié)果再精確,也沒有任何意義。
如何確保鑒定的準確性?
這就依賴于我們龐大的標準品數(shù)據(jù)庫。國際上的黃金標準就是:當代謝物的保留時間(RT)、一級質(zhì)譜圖(MS)和二級質(zhì)譜圖(MS/MS)與標準品一致時,才認為鑒定出的代謝物是完全可信的,實現(xiàn)代謝物完美的定性,從而才能對代謝物進行定量分析,篩選差異代謝物,并進行后續(xù)一系列的生物學驗證。因此代謝物的鑒定和功能注釋是離不開數(shù)據(jù)庫的支撐。
四大數(shù)據(jù)庫
國外已建立的代謝組學數(shù)據(jù)庫:HMDB、METLIN、Lipid Maps、KEGG是目前在背后支撐代謝組學的四大頂梁柱,HMDB是當前世界上較完整且較全面的人類代謝物和人類代謝數(shù)據(jù)精選收集。但是HMDB目前不支持批量搜索,僅限于單個代謝物搜索,搜索效率較低。另外,該庫也不支持代謝通路搜索、代謝化合物濃度搜索等功能。KEGG數(shù)據(jù)庫是一個整合了基因組、化學和系統(tǒng)功能信息的數(shù)據(jù)庫,它的圖形功能非常直觀形象,但是它有功能注釋的基因總量低,并且通路邊界定義主觀。METLIN數(shù)據(jù)庫主要側(cè)重用于液質(zhì)非靶向代謝組學代謝物鑒定領(lǐng)域,但是它更偏重于化學分析,且沒有代謝通路等信息。所以要玩轉(zhuǎn)“代謝組學”,僅僅站在前輩的肩膀上是沒用的。小分子代謝物的結(jié)構(gòu)類似度極高,區(qū)分鑒定難度就更大了。不同儀器平臺,不同分析條件,獲得的譜圖形形色色,因此標準品庫是較難通用的。
實際上,標準品數(shù)據(jù)庫的建設面臨著很多的問題:
01
標準品本身成本就比較高,而要做一個大而全的數(shù)據(jù)庫,所投入的成本就更大了,一些小機構(gòu)和團隊由于經(jīng)費有限,僅用網(wǎng)絡數(shù)據(jù)庫HMDB和一些商業(yè)數(shù)據(jù)庫進行峰型信息比對,不是自己通過標準品驗證的,就非常容易有定性不明確的結(jié)果,后期的靶向驗證是沒有辦法做的,甚至可能導致后續(xù)研究投入白費。
02
不同質(zhì)譜體系下建立的數(shù)據(jù)庫通用性一般,比如Qtof和Orbi之間,數(shù)據(jù)庫就無法完全通用,在高速增長的代謝組學發(fā)展歷程中,要保證同時有大量相同型號的色譜質(zhì)譜相對來說,成本耗費巨大,都是數(shù)以千萬計的質(zhì)譜投入!
03
在長期運營的過程中,如何保證保留時間偏移的穩(wěn)定性,保留時間偏移校正的客觀性,目前常用的液相梯度是否具有通用性,如果以后需要更換液相色譜體系以及梯度,如何通過一些介質(zhì)校正代謝物的保留時間呢?這些都會是我們需要思考和提前解決的問題!
縱使數(shù)據(jù)庫建設會面臨諸多的問題,但是本地數(shù)據(jù)庫建立之后的巨大潛能清晰可預見,因此其建立勢在必行!?
鹿明生物為此通過
百萬立項計劃之本地數(shù)據(jù)庫建設研發(fā)立項計劃!
而鹿明目前進行的自有Library的建立過程中,已采購匯總超1500+標準品,目前仍在采購匯總過程中,其包含了絕大多數(shù)內(nèi)源性代謝物(氨基酸,有機酸,核酸,脂肪酸,胺,糖,維生素等),有詳細的物質(zhì)分子量、化學式、化學結(jié)構(gòu)等信息,覆蓋了95%代謝通路,LM-Datebase 既包含了其他數(shù)據(jù)庫不具備的保留時間信息,又包含標準品物質(zhì)及其在不同基質(zhì)干擾下的質(zhì)譜碎片信息,有效提高了代謝物鑒定的特異性和準確性;避免了HMDB等數(shù)據(jù)庫中冗余信息(植物、藥物、食物和合成化合物信息)干擾造成的假陽性風險,充分保證非靶向代謝組學數(shù)據(jù)的可靠性。
身為少有在數(shù)據(jù)庫上有如此大投入的先鋒公司,標準品多了,隨之而來的使用混亂,尋找麻煩,反復整理等一系列管理問題也出現(xiàn),甚至一度讓使用者聞“標準品”色變。終于,經(jīng)歷了數(shù)次激烈的討論,思維的碰撞,集思廣益,我們建立了一套完整標準的標品管理流程:
我們按照標準品的儲存條件,將所有標準品統(tǒng)一命名,歸類,再劃分區(qū)域,做到每一個標品都有自己的“身份證”(??????)??,以后購買再多的標品也不怕了,也為后續(xù)數(shù)據(jù)庫的升級提供一個更好更便利的條件。
Tips
歡迎各位老師前來咨詢標準品數(shù)據(jù)庫相關(guān)事宜
我們也非常希望
能和老師們在標準品數(shù)據(jù)庫建設上達成一定的合作關(guān)系!
介紹完了我們的標準品
下一次就要進入數(shù)據(jù)庫建設的專題了
期待下一次的分享哦!
如對代謝組學及數(shù)據(jù)庫感興趣的老師
歡迎百度搜索鹿明生物——訪問鹿明生物官網(wǎng)——了解代謝組學數(shù)據(jù)庫
猜你還想看
◆Cancer cell | 樊嘉/周虎/高大明/高強又一力作:多組學聯(lián)合繪制肝內(nèi)膽管癌分子圖譜
◆R包不太冷之網(wǎng)絡圖繪制簡單方法,你值得擁有!
◆導師給你推薦了嗎?歷隔4年,HMDB數(shù)據(jù)庫5.0版強勢來襲!
◆植物生長專題 | 多組學研究在植物種子、根、莖、葉、花全生長周期中的應用
End本文系鹿明生物原創(chuàng)