爾云間生信代碼|自行構(gòu)建CDF包解決讀取CEL文件報錯

遇到問題
在讀取GEO數(shù)據(jù)庫的CEL文件時,出現(xiàn)了報錯,無法找到包pd.hursta.2a520709,命令如下:
rm(list=ls());gc();
setwd("C:/22SHB021F/"
)
library(GEOquery)
library(affyPLM)
library(affy)
library(oligo)
gse="GSE72094_RAW"
baseDir <- "C:/22SHB021F/"
workDir <- file.path(baseDir, gse)
celfiles <- list.files(workDir, "\\.CEL$")
? # 匹配以.CEL 結(jié)尾的文件。
data.raw <- read.celfiles(filenames = file.path(workDir, celfiles))
因為之前別的數(shù)據(jù)集是正常讀取的,而按照通常的解決思路的話,直接把這個包安裝上即可。沒怎么想就用BiocManager試了下
BiocManager::install("pd.hursta.2a520709")
結(jié)果BiocManager并不存在這個包。
后經(jīng)搜索引擎查找發(fā)現(xiàn)需要自己創(chuàng)建這個包,這類包是CDF包,開始操作
構(gòu)建CDF包
查找GSE72094_series_matrix.txt文件發(fā)現(xiàn)測序芯片為GPL15048

進入GEO數(shù)據(jù)庫,
下載CDF文件
https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GPL15048
下載第一個

使用makecdfenv包創(chuàng)建CDF包pd.hursta.2a520709,代碼如下
BiocManager::install('makecdfenv')
library(makecdfenv)
make.cdf.package("GPL15048_HuRSTA_2a520709.CDF.gz", "pd.hursta.2a520709",
? ? ? ? ? ? ? ? species = "Homo sapiens", compress = TRUE)
install.packages("pd.hursta.2a520709", repos = ?NULL, type="source")
再次讀取GEO數(shù)據(jù)庫的CEL文件,就可以正常運行了。

兜兜轉(zhuǎn)轉(zhuǎn)終于把問題解決了,希望小云能幫大家少走彎路。
特別說明:本代碼經(jīng)申請軟件著作權(quán),僅轉(zhuǎn)讓使用權(quán),不轉(zhuǎn)讓所有權(quán)
如需代碼及示例數(shù)據(jù)等文件,請掃碼聊天框回復 “代碼”領(lǐng)?。?/span>

寫在文末:
如果您近期想做生信方面的文章而苦于沒有思路,或者不知道如何來入手生信分析,或者兌具體的某一個圖有作圖需求,都可以掃碼咨詢小云,我們有專業(yè)的技術(shù)團隊,生信熱點思路設(shè)計、生信分析、熱點方向生信挖掘等,如有需要,可掃碼下方二維碼了解詳情 !?
