小云來教你巧妙利用Xena下載TCGA數(shù)據(jù)

各位小伙伴大家好,小云和大家又見面了,今天呢小云來教大家如何利用Xena下載TCGA數(shù)據(jù)。小云下面的內(nèi)容將從以下方面展開:什么是TCGA數(shù)據(jù)庫(kù),利用Xena下載TCGA數(shù)據(jù)。
1. 什么是TCGA數(shù)據(jù)庫(kù)?
TCGA全稱為The Cancer Genome Atlas,中文名稱為癌癥基因組圖集,它是一個(gè)具有里程碑意義的癌癥基因組學(xué)項(xiàng)目,對(duì)20,000多種原發(fā)性癌癥進(jìn)行了分子表征,并匹配了橫跨33種癌癥類型的正常樣本。除此之外還有多組學(xué)數(shù)據(jù),包括基因表達(dá)數(shù)據(jù)、拷貝數(shù)變異、DNA甲基化等數(shù)據(jù)數(shù)據(jù)庫(kù)地址為:https://www.cancer.gov/about-nci/organization/ccg/research/structural-genomics/tcga。

2. 利用Xena下載TCGA數(shù)據(jù)
關(guān)于TCGA數(shù)據(jù)下載,在這里小云以下載肝癌LIHC數(shù)據(jù)的基因表達(dá)數(shù)據(jù),臨床數(shù)據(jù)和生存數(shù)據(jù)為例進(jìn)行數(shù)據(jù)下載。
第一步:進(jìn)入Xena網(wǎng)站首頁,地址為:http://xena.ucsc.edu/,依次點(diǎn)擊launch Xena,DATA SETS,到達(dá)數(shù)據(jù)集頁面。

第二步:選取肝癌數(shù)據(jù)集,如下所示,點(diǎn)擊進(jìn)入TCGA Liver Cancer(LIHC)數(shù)據(jù)集。

第三步:在LIHC中選擇自己想要下載的數(shù)據(jù),比如說下載基因表達(dá)數(shù)據(jù),點(diǎn)擊gene expression RNAseq下的IlluminaHiSeq (n=423) TCGA Hub,數(shù)據(jù)就會(huì)自動(dòng)開始下載了。

再比如說下載臨床數(shù)據(jù)和生存數(shù)據(jù),找到phenotype,可以看到有生存數(shù)據(jù):Curated survival data (n=438) TCGA Hub和臨床數(shù)據(jù):Phenotypes (n=438) TCGA Hub,點(diǎn)擊就可以直接下載。

以上呢就是小云使用Xena下載TCGA數(shù)據(jù)的分享,小伙伴們快去試試吧。
