散文網(wǎng) » 科技 »學(xué)習(xí) » 利用R語言進(jìn)行Ensembl ID轉(zhuǎn)換為Gene name

利用R語言進(jìn)行Ensembl ID轉(zhuǎn)換為Gene name

2023-05-31 09:06 作者:小云愛生信 0人讀過 | 我要投稿

爾云間一個(gè)專門做科研的團(tuán)隊(duì)

原創(chuàng)?小果?生信果

歡迎點(diǎn)贊+收藏+關(guān)注

今天在做ssGESA分析的時(shí)候發(fā)現(xiàn)，TCGA下載的基因ID為Ensembl ID,下載的基因集為Gene name,在做分析之前要做一下基因ID轉(zhuǎn)化，代碼如下：

01? 安裝需要的R包

install.packages(“tidyverse”)

02? 導(dǎo)入需要的R包

library(tidyverse)

03? 數(shù)據(jù)下載

在Xena數(shù)據(jù)庫下載表達(dá)矩陣和ID對(duì)應(yīng)表格

#表達(dá)矩陣下載

wget?https://gdc-hub.s3.us-east-amazonaws.com/download/TCGA-KIRC.htseq_fpkm.tsv.gz

#基因ID轉(zhuǎn)化列表

wget?

https://gdc-hub.s3.us-east-amazonaws.com/download/gencode.v22.annotation.gene.probeMap

04? 代碼展示

最終將Ensembl ID轉(zhuǎn)化為gene name,有需要的可以借鑒學(xué)習(xí)，在這里需要注意的是多個(gè)Ensembl ID對(duì)應(yīng)一個(gè)Gene name。

小果今天的分享就到這里。

生信人R語言學(xué)習(xí)必備

立刻擁有一個(gè)Rstudio賬號(hào)

開啟升級(jí)模式吧

（56線程，256G內(nèi)存，個(gè)人存儲(chǔ)1T）

“生信果”，生信入門、R語言、生信圖解讀與繪制、軟件操作、代碼復(fù)現(xiàn)、生信硬核知識(shí)技能、服務(wù)器、生物信息學(xué)的教程，以及基于R的分析和可視化等原創(chuàng)內(nèi)容，一起見證小白和大佬的成長。