GEO數(shù)據(jù)到底需不需要標(biāo)準(zhǔn)化,看這里

爾云間? 一個(gè)專(zhuān)門(mén)做科研的團(tuán)隊(duì)
? ?
最近收到果粉的一些私信,對(duì)GEO數(shù)據(jù)標(biāo)準(zhǔn)化提出了一些問(wèn)題,今天小果就果粉提出的幾個(gè)主要些問(wèn)題進(jìn)行答疑。

問(wèn)題一
是不是所有的GEO數(shù)據(jù)都需要標(biāo)準(zhǔn)化,芯片數(shù)據(jù)標(biāo)準(zhǔn)化的方法有哪些?
答:不是所有的GEO數(shù)據(jù)都需要標(biāo)準(zhǔn)化。數(shù)據(jù)標(biāo)準(zhǔn)化數(shù)據(jù)四分位數(shù)標(biāo)準(zhǔn)化,均值標(biāo)準(zhǔn)化,log2標(biāo)準(zhǔn)化和TMM標(biāo)準(zhǔn)化。
問(wèn)題二
哪些GEO數(shù)據(jù)不需要進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化?
答:GEO數(shù)據(jù)庫(kù)有些數(shù)據(jù)是進(jìn)行標(biāo)準(zhǔn)化的數(shù)據(jù),比如說(shuō)Series Matrix File(s)格式的文件和MINiML formmatted family file就是標(biāo)準(zhǔn)化之后的文件。這里小果分別對(duì)兩個(gè)數(shù)據(jù)進(jìn)行了截圖。Series Matrix File(s)格式文件的表達(dá)矩陣:

MINiML formmatted family file格式文件的表達(dá)矩陣:

小伙伴可以觀察到這兩種數(shù)據(jù)的基因表達(dá)矩陣中的表達(dá)豐度值均在50之內(nèi),可以判斷為是經(jīng)過(guò)標(biāo)準(zhǔn)化的結(jié)果。
問(wèn)題三
哪些GEO數(shù)據(jù)需要進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化?
答:上述說(shuō)的這個(gè)標(biāo)準(zhǔn)不是絕對(duì)的,有時(shí)會(huì)遇到的基因表達(dá)矩陣是未經(jīng)過(guò)標(biāo)準(zhǔn)化的,需要查看基因表達(dá)矩陣的表達(dá)豐度值來(lái),有的基因表達(dá)矩陣中的表達(dá)豐度值在大于50,或者幾百之間,甚至更大,此時(shí)就需要進(jìn)行標(biāo)準(zhǔn)化。比如下面小果附上一個(gè)MINiML formmatted family file格式的基因矩陣,如下圖

這時(shí)可以看到基因表達(dá)矩陣中的表達(dá)豐度值均在幾千之間,這時(shí)就需要進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化。
另外就是對(duì)于原始的GEO數(shù)據(jù),必須要進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化??傮w來(lái)說(shuō),GEO數(shù)據(jù)標(biāo)準(zhǔn)具體要視情況而定,不能一概而論。
好了,至此答疑就結(jié)束了。小伙伴快去學(xué)起來(lái)吧。