利用R語言進(jìn)行Ensembl ID轉(zhuǎn)換為Gene name
爾云間 一個(gè)專門做科研的團(tuán)隊(duì)
? ?
歡迎點(diǎn)贊+收藏+關(guān)注

今天在做ssGESA分析的時(shí)候發(fā)現(xiàn),TCGA下載的基因ID為Ensembl ID,下載的基因集為Gene name,在做分析之前要做一下基因ID轉(zhuǎn)化,代碼如下:
01? 安裝需要的R包
install.packages(“tidyverse”)
02? 導(dǎo)入需要的R包
library(tidyverse)
03? 數(shù)據(jù)下載
在Xena數(shù)據(jù)庫下載表達(dá)矩陣和ID對(duì)應(yīng)表格
#表達(dá)矩陣下載
wget?https://gdc-hub.s3.us-east-amazonaws.com/download/TCGA-KIRC.htseq_fpkm.tsv.gz
#基因ID轉(zhuǎn)化列表
wget?
https://gdc-hub.s3.us-east-amazonaws.com/download/gencode.v22.annotation.gene.probeMap
04? 代碼展示



最終將Ensembl ID轉(zhuǎn)化為gene name,有需要的可以借鑒學(xué)習(xí),在這里需要注意的是多個(gè)Ensembl ID對(duì)應(yīng)一個(gè)Gene name。
小果今天的分享就到這里。

生信人R語言學(xué)習(xí)必備
立刻擁有一個(gè)Rstudio賬號(hào)
開啟升級(jí)模式吧
(56線程,256G內(nèi)存,個(gè)人存儲(chǔ)1T)

“生信果”,生信入門、R語言、生信圖解讀與繪制、軟件操作、代碼復(fù)現(xiàn)、生信硬核知識(shí)技能、服務(wù)器、生物信息學(xué)的教程,以及基于R的分析和可視化等原創(chuàng)內(nèi)容,一起見證小白和大佬的成長。