還在為缺少正常樣本發(fā)愁嗎,試試GTEX數(shù)據(jù)庫吧
?

? 小伙伴們好啊,小云今天遇到了見麻煩事,這件事就是小云辛辛苦苦找到了需要的癌癥數(shù)據(jù)集,但是沒有正常樣本,而小云的這個(gè)分析是離不開正常樣本的,那這應(yīng)該怎么辦呢,小云不能卡在這里啊,于是小云找到了一個(gè)專門有正常樣本的數(shù)據(jù)庫,這就是GTEX數(shù)據(jù)庫
?
? ? GTEx,全稱Genotype-Tissue Expression。這個(gè)數(shù)據(jù)庫和TCGA和ICGC不同的是。TCGA和ICGC更多的還是腫瘤相關(guān)的數(shù)據(jù),而GTEx收集的是正常人身上的組織來進(jìn)行的測序,所以GTEx數(shù)據(jù)庫包括的就只是 正常人的數(shù)據(jù)。
?
? ? 這個(gè)數(shù)據(jù)集的用處呢,一方面是可以研究正常人不同組織之間的基因表達(dá)的區(qū)別。另外的一個(gè)呢,就是和TCGA聯(lián)合使用。由于TCGA重點(diǎn)收集的還是癌癥組織的數(shù)據(jù),對(duì)于其正常的數(shù)據(jù)收集的相對(duì)來說較少,由于正常樣本少所以對(duì)于差異表達(dá)的結(jié)果可能就不是很準(zhǔn)確。這個(gè)時(shí)候如果我們把GTEx的數(shù)據(jù)納入進(jìn)來。這樣分析的結(jié)果就會(huì)準(zhǔn)確一些了。
?
? ? 那么如何獲取數(shù)據(jù)呢,一個(gè)比較簡便的方法,就是通過http://xena.ucsc.edu/這個(gè)數(shù)據(jù)庫下載,這里的DATA SETS里有GETX這個(gè)數(shù)據(jù)鏈接。

? ? 一般我們需要的是表型和表達(dá)量,我們拿到的數(shù)據(jù)是整個(gè)的數(shù)據(jù)集,里面有各個(gè)組織,需要根據(jù)需要來選擇

這個(gè)數(shù)據(jù)庫還是比較簡單的,把需要的數(shù)據(jù)集文件下載下來就可以了,USCS Xena有整理好的文件,很是方便。好了,今天的內(nèi)容就是這樣了,有什么問題歡迎來和小云分享討論啊。
