還在為缺少正常樣本發(fā)愁嗎,試試GTEX數(shù)據(jù)庫(kù)吧
爾云間? 一個(gè)專(zhuān)門(mén)做科研的團(tuán)隊(duì)
? ?

小伙伴們好啊,小果今天遇到了見(jiàn)麻煩事,這件事就是小果辛辛苦苦找到了需要的癌癥數(shù)據(jù)集,但是沒(méi)有正常樣本,而小果的這個(gè)分析是離不開(kāi)正常樣本的,那這應(yīng)該怎么辦呢?

小果不能卡在這里啊,于是小果找到了一個(gè)專(zhuān)門(mén)有正常樣本的數(shù)據(jù)庫(kù),這就是GTEX數(shù)據(jù)庫(kù)
GTEx,全稱(chēng)Genotype-Tissue Expression。這個(gè)數(shù)據(jù)庫(kù)和TCGA和ICGC不同的是,TCGA和ICGC更多的還是腫瘤相關(guān)的數(shù)據(jù),而GTEx收集的是正常人身上的組織來(lái)進(jìn)行的測(cè)序,所以GTEx數(shù)據(jù)庫(kù)包括的就只是 正常人的數(shù)據(jù)。
這個(gè)數(shù)據(jù)集的用處呢,一方面是可以研究正常人不同組織之間的基因表達(dá)的區(qū)別。另外的一個(gè)呢,就是和TCGA聯(lián)合使用。由于TCGA重點(diǎn)收集的還是癌癥組織的數(shù)據(jù),對(duì)于其正常的數(shù)據(jù)收集的相對(duì)來(lái)說(shuō)較少,由于正常樣本少所以對(duì)于差異表達(dá)的結(jié)果可能就不是很準(zhǔn)確。這個(gè)時(shí)候如果我們把GTEx的數(shù)據(jù)納入進(jìn)來(lái)。這樣分析的結(jié)果就會(huì)準(zhǔn)確一些了。
那么如何獲取數(shù)據(jù)呢,一個(gè)比較簡(jiǎn)便的方法,就是通過(guò)http://xena.ucsc.edu/這個(gè)數(shù)據(jù)庫(kù)下載,這里的DATA SETS里有GETX這個(gè)數(shù)據(jù)鏈接。

一般我們需要的是表型和表達(dá)量,我們拿到的數(shù)據(jù)是整個(gè)的數(shù)據(jù)集,里面有各個(gè)組織,需要根據(jù)需要來(lái)選擇。

這個(gè)數(shù)據(jù)庫(kù)還是比較簡(jiǎn)單的,把需要的數(shù)據(jù)集文件下載下來(lái)就可以了,USCS Xena有整理好的文件,很是方便。

好了,今天的內(nèi)容就是這樣了,有什么問(wèn)題歡迎來(lái)和小果分享討論啊。
shengxinguoer
生信果
生信硬核知識(shí)解答
和小果一起學(xué)生信