GEO數(shù)據(jù)中探針I(yè)D的轉(zhuǎn)換
爾云間? 一個(gè)專門做科研的團(tuán)隊(duì)
? ?

在使用GEO數(shù)據(jù)的過程中,經(jīng)常會遇到表達(dá)矩陣是探針I(yè)D不是我們分析所需要的gene symbol,這時(shí)候就需要去對表達(dá)數(shù)據(jù)的探針I(yè)D進(jìn)行轉(zhuǎn)換。接下來我們我們以GSE63067為數(shù)據(jù)為例進(jìn)行數(shù)據(jù)探針I(yè)D轉(zhuǎn)換。

1、下載GEO數(shù)據(jù),提取表達(dá)矩陣,觀察表達(dá)矩陣中行名是否為探針I(yè)D。
通過查看我們發(fā)現(xiàn)該表達(dá)矩陣的行名為1007sat,1053at,117at,它們是探針I(yè)D,不是gene symbol。
通過命令我們可以查看提取的idprob文件中每個(gè)探針I(yè)D都有對應(yīng)的gene symbol,idprob文件的ID列正好與第一步中表達(dá)矩陣的行名一致接下來就可以進(jìn)行ID轉(zhuǎn)換了。
通過查看生成的expr_1文件,現(xiàn)在的表達(dá)矩陣的行名已經(jīng)變成了gene symbol,至此探針I(yè)D轉(zhuǎn)換就完成了。

推薦閱讀
關(guān)注小果,小果將會持續(xù)為你帶來更多生信干貨哦。

“生信果”,生信入門、R語言、生信圖解讀與繪制、軟件操作、代碼復(fù)現(xiàn)、生信硬核知識技能、服務(wù)器、生物信息學(xué)的教程,以及基于R的分析和可視化等原創(chuàng)內(nèi)容,一起見證小白和大佬的成長。