生信分析中不可忽視的GTEx數(shù)據(jù)庫
爾云間? 一個專門做科研的團隊
? ?

小伙伴們,大家好呀,很高興和大家見面,最近看到有果粉提問關(guān)于TCGA數(shù)據(jù)沒有正常組數(shù)據(jù)的問題,大部分的癌癥數(shù)據(jù)的分組均是完整的,即均有腫瘤與正常組,對于有些特殊的疾病它僅保存了腫瘤分組數(shù)據(jù),這時就需要用到另一個數(shù)據(jù)庫:GTEx。今天呢我們來聊聊小伙伴們關(guān)于TCGA與GTEx數(shù)據(jù)庫的疑惑。
走神的小伙伴,還沒有準備好的小伙伴,此時可千萬不能打瞌睡,說不定你的幾秒鐘的專注一不小心就能解決你心中的疑惑,快快來看這吧。

疑惑一:什么是GTEx數(shù)據(jù)庫?
答:GTEx全稱是Genotype-Tissue Expression,稱為基因型組織表達。GTEx首次出現(xiàn)是2013年在Nature?Genetics雜志上發(fā)表的文章The Genotype-Tissue Expression (GTEx) project中,該文中首次介紹了Genotype-Tissue Expression,并成立了Genotype-Tissue Expression Consortium。2015年發(fā)表在Science上標題為The Genotype-Tissue Expression (GTEx) pilot analysis: Multitissue gene regulation in humans文章中。
為了檢查個體內(nèi)組織之間的遺傳表達如何變化,基因型組織表達(GTEx)聯(lián)盟收集了1641個尸檢樣本,涵蓋了175個個體的54個體位點。2017年在Nature上發(fā)表了4篇文章,其中標題為Landscape of X chromosome inactivation across human tissues的文章,指出GTEx整合來自449個個體的5500多個轉(zhuǎn)錄組,29個組織的940個單細胞轉(zhuǎn)錄組,并結(jié)合基因組序列數(shù)據(jù)。我們可以使用該數(shù)據(jù)庫進行查詢幾乎所有轉(zhuǎn)錄基因的基因表達數(shù)據(jù)。
疑惑二:什么時候用到GTEx數(shù)據(jù)庫?
答:在使用TCGA數(shù)據(jù)庫的時候,有些癌癥的項目收納的正常組織數(shù)據(jù)是非常少的,換句話說就是有很多病人,但是這些病人的正常組織的轉(zhuǎn)錄組測序結(jié)果沒有。比如說卵巢癌,乳腺癌,這些疾病的正常組樣本非常少。此時我們就要去想辦法從其他數(shù)據(jù)庫著手找到正常組織的樣本數(shù)據(jù),此時GTEx數(shù)據(jù)庫就是不錯的選擇,這樣在與TCGA數(shù)據(jù)整合到一起,樣本量就比較多一些了。
至此,今天的答疑就結(jié)束了,小伙伴們有疑問可以給小果留言,小果期待與各位伙伴的交流。

推薦閱讀
? 生信果? 生信入門、R語言、生信圖解讀與繪制、軟件操作、代碼復現(xiàn)、生信硬核知識技能、服務(wù)器等原創(chuàng)內(nèi)容