最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

一把鑰匙配一把鎖,專屬GPL16686芯片的ID轉(zhuǎn)換

2023-01-05 09:50 作者:小云愛生信  | 我要投稿

爾云間? 一個專門做科研的團隊

原創(chuàng)?小果?生信果

小果今天遇到了一個特別的事情,就是找數(shù)據(jù)的時候,發(fā)現(xiàn)GPL16686的探針號不能直接轉(zhuǎn)換為基因symbol,小果去搜了一下,發(fā)現(xiàn)原來這個芯片需要專門的轉(zhuǎn)換方式


下面就讓我們一起來看一下這個代碼吧

代碼如下:


rm(list = ls())
options(stringsAsFactors = F)

#讀入soft文件
library(GEOquery)
gse83452 <- getGEO(filename = "GSE83452_family.soft.gz",destdir = ".") #這個文件需要自己去手動下載,一般會比較大,小云的這個是75.9M,這是壓縮后的體積呦。
dim(gse83452) #這里小云在做的時候,得到的其實是NULL,但是不影響后面的結(jié)果

y <- gse83452@gpls$GPL16686@dataTable@table #這一步就是把需要的部分提取出來。
dim(y)

head(y)
y[1:4,1:8]

#### id conversion
library(org.Hs.eg.db) #啟動程序包,ID轉(zhuǎn)換的信息就是從這里來的。
library(clusterProfiler)
ENTREZID<- bitr(y[,6], fromType = "ACCNUM",
??????????????? toType=c("SYMBOL","ENSEMBL","ENTREZID"),
??????????????? OrgDb = org.Hs.eg.db) #這一步就是在進行ID轉(zhuǎn)換了。
ls(package:clusterProfiler)

dim(ENTREZID)
ENTREZID[1:5,1:4]

save(y,ENTREZID,file = "ids.Rdata") #保存一下我們的結(jié)果

#ids過濾探針
table(y$GB_ACC %in% ENTREZID$ACCNUM)
y1 <- y[y$GB_ACC %in% ENTREZID$ACCNUM,]
y1[1:5,1:8]
y2 <- y1[,c(1,6)]
names(y2) <- c("probe_id","ACCNUM")

#合并y2與ENTREZID
ids <- merge(y2,ENTREZID,by ="ACCNUM",all=F) #繼續(xù)合成新文件

ids[1:5,1:5]

dim(ids)

這個是ENTREZID,它們長下面這樣,這一步是把原文件里的注釋轉(zhuǎn)換成了symbol這種大家都能看得懂的通用ID

圖片

這個是ids,這一步加上的是表達矩陣里的ID號,這樣就可以直接進行ID的轉(zhuǎn)換了。


這就是今天的主要內(nèi)容了,雖然比較有局限性,但是也能反應我問處理ID轉(zhuǎn)換時的一些規(guī)則,雖然不一定用得到,但也可以先了解一下,畢竟技多不壓身嘛。小伙伴們有什們問題歡迎來和小果交流討論啊。




shengxinguoer

生信果


生信硬核知識解答

和小果一起學生信


一把鑰匙配一把鎖,專屬GPL16686芯片的ID轉(zhuǎn)換的評論 (共 條)

分享到微博請遵守國家法律
上栗县| 英德市| 桐城市| 五原县| 景谷| 芷江| 兴山县| 汝城县| 湘潭县| 关岭| 郎溪县| 泾阳县| 东山县| 江津市| 清远市| 新巴尔虎右旗| 宣城市| 卢氏县| 舞钢市| 凤台县| 罗山县| 濮阳县| 通化市| 青海省| 青川县| 鄯善县| 南澳县| 镇赉县| 宁波市| 丰城市| 株洲县| 界首市| 策勒县| 中超| 长宁县| 太湖县| 留坝县| 宁乡县| 蒙山县| 涞水县| 嘉鱼县|