GEO數(shù)據(jù)庫(kù)使用之?dāng)?shù)據(jù)集下載
爾云間? 一個(gè)專門做科研的團(tuán)隊(duì)
原創(chuàng) 小果 生信果

在GEO數(shù)據(jù)庫(kù)檢索到我們需要的某個(gè)疾病的數(shù)據(jù)集時(shí),往往需要去下載這些數(shù)據(jù)集,在這里用了三種方法來下載數(shù) ?據(jù)。這里我們以GSE70493為數(shù)據(jù)為例進(jìn)行下載
一、網(wǎng)頁直接下載
1、首先登錄到GEO數(shù)據(jù)庫(kù)首頁(Home - GEO - NCBI (nih.gov) ),然后再搜索框輸入GSE70493,進(jìn)行數(shù)據(jù)檢索, 檢索結(jié)果如下:

2、在檢索界面中拉動(dòng)右側(cè)滾動(dòng)條,可看到Platforms 與Download family關(guān)節(jié)詞條,這些詞條底下紅色方框圈住的區(qū)域的數(shù)據(jù)就是我們需要下載的數(shù)據(jù)。

3、下載platform數(shù)據(jù),點(diǎn)擊上圖中紅色方框圈住的GPL17586,進(jìn)入到平臺(tái)信息界面,在界面下拉找到Download ?? full table...,點(diǎn)擊即可下載到本地。

4、在下載完platform數(shù)據(jù)信息后,返回GSE70493的搜索界面,在Download family詞條下找到Series Matrix File(s)?文件,點(diǎn)擊下載保存到本地即可。

二、利用ftp下載
1、進(jìn)入ftp,Index of /geo (nih.gov)?,找到并點(diǎn)擊geo目錄,就可以看到有對(duì)應(yīng)的GEO相關(guān)的數(shù)據(jù)目錄。

2、在geo目錄下,點(diǎn)擊platform進(jìn)去查找對(duì)應(yīng)的GPL編號(hào),點(diǎn)擊該編號(hào)就可看到所需要下載的文件的格式,點(diǎn)擊需 ???要的格式進(jìn)行下載,這里我們選soft格式的文件,點(diǎn)擊后選取對(duì)應(yīng)的文件進(jìn)行下載。



3、在geo目錄下,點(diǎn)擊series目錄,進(jìn)去查找對(duì)應(yīng)的GEO編號(hào),就可以找到對(duì)應(yīng)的文件類型,我們需要matrix文 ???件,點(diǎn)擊就該目錄進(jìn)去選擇對(duì)應(yīng)的文件下載即可


三、使用R命令下載
library(GEOquery)
eSet1 <- getGEO("GSE70493",
destdir = '.', getGPL = F)
gpl <- getGEO("GPL17586", destdir= ".")
等待命令運(yùn)行結(jié)束就可看到需要i愛在的文件了,下載的文件如下圖所示:

至此,我們GEO數(shù)據(jù)的下載就結(jié)束了。
shengxinguoer
生信果
生信硬核知識(shí)解答
和小果一起學(xué)生信