簡(jiǎn)單使用ICGC數(shù)據(jù)庫(kù)進(jìn)行數(shù)據(jù)查詢與下載
爾云間? 一個(gè)專門做科研的團(tuán)隊(duì)
? ? ?2
各位小伙伴大家好,今天小果給大家介紹一個(gè)非常有用的數(shù)據(jù)庫(kù)--ICGC數(shù)據(jù)庫(kù),這個(gè)數(shù)據(jù)可以幫助小伙伴解決在數(shù)據(jù)分析過(guò)程中驗(yàn)證數(shù)據(jù)集不太理想的問(wèn)題,今天的內(nèi)容大致分為兩塊:一是ICGC數(shù)據(jù)庫(kù)簡(jiǎn)介,二是數(shù)據(jù)查詢與下載。
1、ICGC數(shù)據(jù)庫(kù)簡(jiǎn)介
ICGC全稱為International Cancer Genome Consortium,中文翻譯過(guò)來(lái)是國(guó)際腫瘤基因組協(xié)作組,它的目標(biāo)是為全面闡明導(dǎo)致全球人類疾病負(fù)擔(dān)的多種癌癥中存在的基因組變化,該數(shù)據(jù)庫(kù)收錄了來(lái)自亞洲、澳大利亞、歐洲、北美和南美17個(gè)地區(qū)的89個(gè)項(xiàng)目,大約包括25000個(gè)癌癥基因組。
IGCG數(shù)據(jù)庫(kù)有50種不同癌癥類型(或亞型)的腫瘤數(shù)據(jù),其中包括基因異常表達(dá),體細(xì)胞突變,表觀遺傳修飾,臨床數(shù)據(jù)等。如果一般的癌癥基因組數(shù)據(jù)庫(kù)無(wú)法滿足小伙伴的需求,可以使用該數(shù)據(jù)庫(kù)作的數(shù)據(jù)來(lái)源做驗(yàn)證,以此來(lái)補(bǔ)充驗(yàn)證使用TCGA 和 GEO 的數(shù)據(jù)分析建立的模型。網(wǎng)址為:
https://icgcportal.genomics.cn/。

進(jìn)入主頁(yè)后可以看到網(wǎng)站主要有五個(gè)功能模塊,分別為Cancer Projects、Advanced Search、Data Analysis、DCC Data Releases、Data Repositories。小伙伴可以根據(jù)自己的需求自行選擇不同的模塊進(jìn)行使用。
2、數(shù)據(jù)查詢與下載
在這里呢小果以肝癌(LIHC)為例,進(jìn)行數(shù)據(jù)的查詢,然后下載對(duì)應(yīng)的臨床數(shù)據(jù)與基因表達(dá)數(shù)據(jù)。
1.進(jìn)入ICGC主頁(yè),在快速搜索框中輸入LIHC,點(diǎn)擊Search,數(shù)據(jù)庫(kù)就會(huì)自動(dòng)幫助我們檢索所有關(guān)于LIHC的信息。

2.查看查詢結(jié)果,選擇需要的數(shù)據(jù)點(diǎn)擊進(jìn)行查看,在這里小果選擇查看LIHC整個(gè)項(xiàng)目。?

點(diǎn)擊LIHC項(xiàng)目條目后,進(jìn)入到LIHC項(xiàng)目中,可以看到整個(gè)項(xiàng)目的數(shù)據(jù)的概況,如下圖

3.在Available Data Types目錄下, 點(diǎn)擊查看Clinical Data后的藍(lán)色字樣377 donors,此時(shí)會(huì)進(jìn)入到一個(gè)新的頁(yè)面,如下圖所示。

4.進(jìn)入新頁(yè)面后,點(diǎn)擊Download Donor Data,此時(shí)會(huì)出現(xiàn)彈窗,這里呢小果選擇選擇臨床數(shù)據(jù):Clinical Data和基因表達(dá)數(shù)據(jù):Sequence-based Gene Expression (EXP-S)數(shù)據(jù)進(jìn)行,點(diǎn)擊Download進(jìn)行數(shù)據(jù)下載。

以上就是小果今天的分享,小伙伴們有沒(méi)有學(xué)會(huì)呢,趕快去試試吧。
推薦閱讀