Linux系統(tǒng)上安裝aspera并用其批量高速下載轉(zhuǎn)錄組數(shù)據(jù)

#使用aspera能夠幫助我們批量高速下載轉(zhuǎn)錄組等數(shù)據(jù),現(xiàn)在使用conda進(jìn)行安裝
conda install -c hcc aspera-cli -y
#檢查是否安裝成功,有東西出來就行
ascp -h
#另外看看asperaweb_id_dsa.openssh文件是不是在miniconda3/etc文件夾中,務(wù)必確認(rèn)該文件的位置。
#我們看看NCBI上面有什么樣的轉(zhuǎn)錄組,在官網(wǎng)上打好毛果楊拉丁名,選擇SRA搜索,我選了這個,點(diǎn)進(jìn)去看看

#看到工程號,復(fù)制這個號,順便看看別的一些信息,了解該轉(zhuǎn)錄組,看到這個是過表達(dá)了個PtrVCS2,在PUBMED搜下,文章發(fā)表在IJMS,DOI: 10.3390/ijms24054458。

#復(fù)制工程號后,在ENA網(wǎng)站(https://www.ebi.ac.uk/ena/browser/home),搜索

#往下拉,找到TSV,下載文件

#看見文件里面有每個SRR的下載地址,如果是單個文件下載的話,命令如下,下載到當(dāng)前文件夾,速度居然有280Mb/s,學(xué)校服務(wù)器真強(qiáng):
ascp -vQT -l 500m -P33001 -k 1 -i \
~/miniconda3/etc/asperaweb_id_dsa.openssh \
era-fasp@fasp.sra.ebi.ac.uk:/vol1/fastq/SRR229/051/SRR22954651/SRR22954651_1.fastq.gz ./

#但是不可以這么笨笨哦,要學(xué)會批量下載。將剛剛下載的TSV文件整理成以下的樣子,每行后面留一個空格,并且最后留一行空行出來,命名為id.txt:

#將id.txt傳到linux系統(tǒng)中,批量生成命令行,輸出文件command_ascp.sh:
awk '{print "ascp -vQT -l 500m -P33001 -k 1 -i ~/miniconda3/etc/asperaweb_id_dsa.openssh era-fasp@"$1" ./ &"}' id.txt > command_ascp.sh
#查看一下這個command_ascp.sh文件:

#在工作文件夾中,運(yùn)行這個腳本,并掛載后臺,記得兩次enter:
nohup sh command_ascp.sh &

#最后看看結(jié)果,3個實(shí)驗(yàn)組,3個對照組,雙端測序,共12個文件

#一定要自己看懂理解代碼,不可以照抄,aspera的教程有很多,有問題就百度吧。
#這兩天突然高產(chǎn)