一種簡單的進行探針I(yè)D轉(zhuǎn)換的方法
爾云間? 一個專門做科研的團隊
? ? ?
在使用芯片數(shù)據(jù)時經(jīng)常遇到提取后表達矩陣的探針是全數(shù)字的或者字母加數(shù)字的,最近小果也遇到同樣的問題,如何轉(zhuǎn)換以ILMN_開頭的探針I(yè)D,這種類型的探針是由Illumina平臺產(chǎn)生的,對于小白來說不用進行過多的R語言操作也可進行id轉(zhuǎn)換。小果的操作步驟如下,僅供大家參考:

代碼如下:
eSet3 <- getGEO("GSE89632",
??????????????? destdir = '.',
??????????????? getGPL = F)
View(eSet3)
exp3 <- exprs(eSet3[[1]])
exp3[1:4,1:4]
dim(exp3)
write.table(exp3, file = "exp3.txt", quote = F, sep="\t")
查看提取到的表達矩陣的結(jié)果,探針I(yè)D格式均以ILMN_開頭

2.?提取表達矩陣的行名,并保存成a.txt文件
代碼如下:
a=rownames(exp3)
write.table(a, file = "a.txt", quote = F, sep="\t")
然后用excel打開a.txt文件,觀察文件格式(如下圖),可以看到文章有兩列,B列是我們需要的。

3.?打開gprofiler網(wǎng)站
(https://biit.cs.ut.ee/gprofiler/convert),復制B列數(shù)據(jù),粘貼到query框中,選擇需要的物種與Target namespace,點擊Run query。

4. 運行完成后的導出運行結(jié)果,保存為list.txt。

5. 用excel打開list.txt和exp3.txt,使用VLOOKUP函數(shù),用list.txt中轉(zhuǎn)換后的ID匹配到exp3.txt中,最終得到選轉(zhuǎn)換后的表達矩陣。


好了,今天小果的分享就到這里,大家快去實踐吧。