不會(huì)使用MSigDB數(shù)據(jù)庫下載數(shù)據(jù)?快來看這這里
爾云間 一個(gè)專門做科研的團(tuán)隊(duì)
? ? ?

不知道小伙伴們有沒有知道要下載的數(shù)據(jù)名稱卻不知道在哪下手,或者知道是哪個(gè)數(shù)據(jù)庫但是就是不會(huì)使用的尷尬境地,生信分析的數(shù)據(jù)庫更是多種多樣,最近小果觀察到有小伙伴不會(huì)使用MSigDB數(shù)據(jù)庫下載想要的數(shù)據(jù),今天小果來教大家使用MSigDB數(shù)據(jù)庫進(jìn)行數(shù)據(jù)下載。
今天的分享有兩小部分
一部分是簡單認(rèn)識(shí)MSigDB數(shù)據(jù)庫
另一部分是使用MSigDB數(shù)據(jù)庫下載數(shù)據(jù)。
一、簡單認(rèn)識(shí)MSigDB數(shù)據(jù)庫
MSigDB全稱為The Molecular Signatures Database,中文翻譯過來是分子標(biāo)簽數(shù)據(jù)庫,是一個(gè)由數(shù)萬個(gè)注釋基因集的資源,用于GSEA軟件,分為人類和鼠的集合。
二、使用MSigDB數(shù)據(jù)庫下載數(shù)據(jù)
小果以下載內(nèi)質(zhì)網(wǎng)應(yīng)激相關(guān)基因集為例,進(jìn)行下載演示
GOBP_RESPONSE_TO_ENDOPLASMIC_RETICULUM_STRESS
1.進(jìn)入MSigDB官網(wǎng),網(wǎng)址為:https://www.gsea-msigdb.org/gsea/msigdb,看到下圖呢就是進(jìn)入到了MSigDB數(shù)據(jù)庫網(wǎng)站。

2.點(diǎn)擊search,在search頁面,此時(shí)會(huì)出現(xiàn)一個(gè)登錄頁面,需要填寫郵箱進(jìn)行登錄。在這里小果使用自己的郵箱進(jìn)行登錄,小伙伴們可以填寫自己的郵箱進(jìn)行登錄,但前提是已經(jīng)在此數(shù)據(jù)庫中注冊(cè)過才可以。

3.輸入郵箱登錄后,就能正常進(jìn)入search頁面,正常頁面是這樣的。

此時(shí)我們?cè)?strong>Keywords下的搜索框中輸入要查找的基因集名稱,在這里小果輸入GOBP_RESPONSE_TO_ENDOPLASMIC_RETICULUM_STRESS,點(diǎn)擊search,進(jìn)行查找。
4.查詢結(jié)果頁面如下

點(diǎn)擊基因集名稱,進(jìn)入基因集詳情頁面,點(diǎn)擊Download gene set條目,下載格式有g(shù)rp、gmp、xml、json和TSV metadata,這里小伙伴可以選擇xml和TSV metadata兩種格式,都可以用excel打開,這里小果下載TSV metadata格式,數(shù)據(jù)就自動(dòng)下載到本地了。

5.打開下載的文件,結(jié)果是這樣的:

好了,到這里呢小果的MSigDB數(shù)據(jù)庫數(shù)據(jù)下載演示就到此結(jié)束了,小伙伴快去試試看吧。
推薦閱讀
關(guān)注小果,小果將會(huì)持續(xù)為你帶來更多生信干貨哦。

生信果 生信入門、R語言、生信圖解讀與繪制、軟件操作、代碼復(fù)現(xiàn)、生信硬核知識(shí)技能、服務(wù)器等原創(chuàng)內(nèi)容