「青蓮百奧干貨分享」蛋白質(zhì)組學(xué)原始數(shù)據(jù)上傳的那些事!

在蛋白質(zhì)組學(xué)如火如荼的今天,許多科研工作者在進(jìn)行涉及到蛋白質(zhì)組學(xué)的研究成果的投稿時,編輯一般會要求作者在第三方平臺上提交蛋白組學(xué)的原始數(shù)據(jù)(“Public availability of data”)。?因此客戶寶寶問題就來了:怎么上傳原始數(shù)據(jù),上傳到哪個數(shù)據(jù)庫,都需要上傳哪些數(shù)據(jù)?今天小編就給大家介紹一下原始數(shù)據(jù)上傳的那些事。
原始數(shù)據(jù)上傳到哪?
ProteomeXchange(簡稱PX),是應(yīng)用較為廣泛的蛋白質(zhì)組學(xué)質(zhì)譜數(shù)據(jù)存儲平臺(http://www.proteomexchange.org),旗下包括了PRIDE Archive, MassIVE, PeptideAtlas, and jPOST等平臺,研究者可以根據(jù)需要選擇通過ProteomeXchange客戶端直接上傳原始數(shù)據(jù)或通過旗下平臺進(jìn)行上傳。其中iProX是國內(nèi)的上傳蛋白質(zhì)學(xué)質(zhì)譜數(shù)據(jù)的存儲平臺(http://www.iprox.org),因服務(wù)器在國內(nèi),數(shù)據(jù)上傳的速度相對較快,國內(nèi)研究者可以選擇該平臺進(jìn)行數(shù)據(jù)提交。

上傳的原始數(shù)據(jù)包含哪些內(nèi)容?
上傳的數(shù)據(jù)集(dataset)一般包括搜索的結(jié)果文件、原始質(zhì)譜數(shù)據(jù)(Raw data)、實驗信息。其中搜索的結(jié)果文件為Peptide / protein identification files肽段蛋白質(zhì)鑒定文件,稱為“RESULTS”;原始質(zhì)譜數(shù)據(jù)為mass spectrometer output files質(zhì)譜輸出文件,稱為“RAW”,既可以是儀器直接輸出的raw文件,也可以是高度加工過的XML標(biāo)準(zhǔn)形式(mzXML或mzML)文件。另外還需要上傳一些其它參數(shù)文件,包括peaklist files文件(稱為“PEAK”),search engine output files文件(稱為“SEARCH”,是Partial submissions提交時所必須的),quantification files定量文件及其他的后加工的文件等。
數(shù)據(jù)提交的模式怎樣選擇?
IProX提供2種數(shù)據(jù)提交的方式:一種是依賴于搜索結(jié)果文件mzIdentML or PRIDE XML的完整提交方式complete submission(也稱 “supported”),對數(shù)據(jù)的格式有要求,適合部分?jǐn)?shù)據(jù);另一種是部分提交方式partial submission(也稱“unsupported”),雖然這種模式會明顯降低數(shù)據(jù)的可見度和重復(fù)利用度,但因PRIDE訪問權(quán)限問題及數(shù)據(jù)分析軟件查庫結(jié)果格式等影響,partial submission為實際數(shù)據(jù)上傳過程中更經(jīng)常用到的模式,適合所有數(shù)據(jù)的上傳。
數(shù)據(jù)上傳步驟說明
步驟一:注冊賬號和登錄
進(jìn)入官網(wǎng)https://www.iprox.org/,點擊右上角的注冊按鈕,填寫所需的賬號名稱、密碼、用戶單位和郵箱等信息,完成后,iProX系統(tǒng)將給用戶填寫的郵箱發(fā)送確認(rèn)郵件,點擊確認(rèn)鏈接激活后,即可以使用注冊的用戶名(UserName)和密碼(Password)登陸系統(tǒng)。
完成注冊后,點擊首頁“登錄”鍵進(jìn)入登錄頁面(圖2),使用注冊時填寫的用戶名和密碼,并輸入頁面顯示的驗證碼即可登錄。

步驟二:創(chuàng)建新項目
iProX提交系統(tǒng)以項目為數(shù)據(jù)管理單位的(相當(dāng)于一次完整的實驗研究),一個項目下可以有多個子項目(多次實驗結(jié)果)??梢哉J(rèn)為一個子項目為一個項目下面的一次實驗;如果沒有重復(fù)/對照等不同類型的實驗,一個項目下面可以只有一個子項目。
添加新項目的步驟如圖3所示。登錄系統(tǒng)后,用戶可以直接通過首頁上方“Project -> New Project”的方式創(chuàng)建新項目。

接著填寫創(chuàng)建項目所需的信息,頁面中有 “*”標(biāo)記的為必填項,其他內(nèi)容為選填項。填寫完信息后點“Continue”保存當(dāng)前填寫信息進(jìn)入下一步。

步驟三:創(chuàng)建子項目
子項目中大量實驗元信息需要通過標(biāo)準(zhǔn)的控制詞匯表(CV,Control Vocabulary)進(jìn)行填寫,包括Species、Tissue、Cell type等,點擊“Choose”鍵,在填出的控制詞匯表窗口進(jìn)行條目選擇,可以通過常用列表選擇條目或者搜索條目進(jìn)行填寫。

步驟四:上傳數(shù)據(jù)文件
iProX系統(tǒng)中數(shù)據(jù)文件在子項目下面上 傳。 完成子項目信息頁面填寫后點擊頁面下方的Continue進(jìn)入上傳文件頁面 。 iProX提供兩種上傳文件的方式: 通過網(wǎng)頁直接上傳(Upload by Browse),適合少量并且較小的文件(網(wǎng)頁上傳文件大小不能超過4Gb); 通過Aspera插件上傳(upload by Aspera),適合大量較大的文件(不受文件大小和數(shù)量的限制)。
選擇好提交數(shù)據(jù)的方式(Complete submission/Partial submission)和上傳文件方式(Browse/Aspera)后,點擊“Add file”選擇本地要上傳的數(shù)據(jù)文件,可以同時選擇多個文件;系統(tǒng)會根據(jù)文件名后綴自動判斷文件類型,對判斷不正確的文件類型,可以點擊文件后面的下拉菜單進(jìn)行修改,可為每個文件添加其一個多個關(guān)聯(lián)的文件。完成上述操作后請點擊“Start upload”進(jìn)行文件上傳,文件上傳完成后頁面上會出現(xiàn)提示,然后可以點擊“Continue”進(jìn)入提交頁面。

步驟五:提交項目和子項目
點擊下方“submit”鍵后項目(包括子項目)將提交給iProX數(shù)據(jù)管理員進(jìn)行發(fā)布前審核,審核通過后提交者郵箱和站內(nèi)信將收到相應(yīng)通知,此時用戶上傳的數(shù)據(jù)文件正式完成提交。審核通過后,就可以獲得IProX編號。

至此,蛋白質(zhì)組學(xué)的數(shù)據(jù)上傳工作就圓滿完成了,是不是沒有想象中的難 ~
數(shù)據(jù)集的引用
原始數(shù)據(jù)上傳完成后,可以在文章致謝后的"Data Availability"中或者其他位置寫明數(shù)據(jù)集的訪問信息(URL, project ID),保密的數(shù)據(jù)集需在郵件里告知編審數(shù)據(jù)訪問的賬號和密碼。
以上所需所有數(shù)據(jù)青蓮百奧均可提供哦~