小果發(fā)現(xiàn)用SRA Toolkit工具下載轉(zhuǎn)錄組數(shù)據(jù)很好用!
爾云間? 一個(gè)專門做科研的團(tuán)隊(duì)
歡迎點(diǎn)贊+收藏+關(guān)注
生信人R語言學(xué)習(xí)必備
立刻擁有一個(gè)Rstudio賬號(hào)
開啟升級(jí)模式吧
(56線程,256G內(nèi)存,個(gè)人存儲(chǔ)1T)

有時(shí)候我們想要下載別人的轉(zhuǎn)錄組數(shù)據(jù)進(jìn)行練習(xí)或分析,可能會(huì)突然發(fā)現(xiàn)無從下手,巧婦難為無米之炊啊,這可怎么辦?

小果本期來分享用SRA Toolkit工具在NCBI的SRA數(shù)據(jù)庫下載擬南芥的轉(zhuǎn)錄組數(shù)據(jù)Run Selector :: NCBI (nih.gov)。
SRA Toolkit是由美國(guó)國(guó)家生物技術(shù)信息中心(NCBI)開發(fā)的一款用于高通量測(cè)序數(shù)據(jù)處理的軟件包,主要用于存儲(chǔ)和分析NCBI Sequence Read Archive(SRA)中的測(cè)序數(shù)據(jù)。該工具包提供了多個(gè)命令行工具,支持從SRA下載數(shù)據(jù)、將SRA轉(zhuǎn)換為常見的FASTQ格式、將FASTQ文件轉(zhuǎn)換為SRA格式等多種功能。
SRA Toolkit不僅適用于NCBI SRA數(shù)據(jù)庫,也可用于處理其他來源的高通量測(cè)序數(shù)據(jù)。使用SRA Toolkit可以實(shí)現(xiàn)高效的數(shù)據(jù)下載、數(shù)據(jù)格式轉(zhuǎn)換、數(shù)據(jù)處理和分析等多個(gè)步驟,并且支持多線程和分布式處理,能夠加快數(shù)據(jù)處理速度和提高數(shù)據(jù)處理效率。下面我們一起來看看這個(gè)工具如何使用吧~

1. 安裝SRA Toolkit
2.下載數(shù)據(jù)ls
激活sratollkit環(huán)境,然后就可以用它批量下載數(shù)據(jù)了,因?yàn)閿?shù)據(jù)量太大,而小果只是想作為練習(xí),因此只下載了9個(gè) 樣本的測(cè)序數(shù)據(jù),具體方法如下:
(1)查找需要下載的SRA數(shù)據(jù)的訪問號(hào)(Accession Number)
(2)下載Accession?List,會(huì)下載一個(gè)包含所有Run編號(hào)的文本文檔
?

?

小果這里只保留了9個(gè)樣本(在文檔里刪除其他不需要的run編號(hào)就可以了),需要的話可以全部下載。
(3)在終端中切換到要將SRA文件下載到的目錄
nohup prefetch -O . $(<srr_acc_list.txt) &<="" span="">###將文件下載到當(dāng)前目錄并作為后臺(tái)進(jìn)程運(yùn)行

?

當(dāng)然了,你也可以這樣下載,不過會(huì)比較麻煩:
a?year?later……
好啦,可以看到文件已經(jīng)下載完成了。
?
3.轉(zhuǎn)換格式
如果你下載的文件在同一個(gè)目錄下:
以上就是全部?jī)?nèi)容啦,我們下期見!
歡迎使用:云生信??- 學(xué)生物信息學(xué)?(biocloudservice.com)

“生信果”,生信入門、R語言、生信圖解讀與繪制、軟件操作、代碼復(fù)現(xiàn)、生信硬核知識(shí)技能、服務(wù)器、生物信息學(xué)的教程,以及基于R的分析和可視化等原創(chuàng)內(nèi)容,一起見證小白和大佬的成長(zhǎng)。