安裝生信軟件及數(shù)據(jù)庫
? ? 上節(jié)課我們初步學(xué)會了如何使用Linux系統(tǒng),一些基本的命令以及參數(shù),那么這節(jié)課開始學(xué)會如何安裝生信分析的軟件
????軟件安裝的步驟包括:下載→配置→編譯→安裝。Bioconda是一款類似AppStore的生物信息軟件管理工具,可以實(shí)現(xiàn)軟件的自動(dòng)化安裝全過程。建議首先選擇自動(dòng)化安裝,如果不成功再手動(dòng)安裝:Bioconda自動(dòng)安裝→下載預(yù)編譯版本→手動(dòng)安裝。
軟件的幾種安裝方式
1、二進(jìn)制:下載之后,可直接運(yùn)行;
2、需要自行編譯;
3、解決環(huán)境依賴之后編譯;
4、利用bioconda安裝;
5、利用docker安裝;
6、利用yum,apt安裝;
1.1使用apt安裝
1.2手動(dòng)安裝
1、安裝預(yù)編譯版本
如果自動(dòng)化安裝不成功,首選安裝作者預(yù)先編譯的版本。選擇時(shí)候自己操作系統(tǒng)的版本,通常下載后就可以直接使用。
2、從源代碼安裝
不同軟件安裝方法不同,先看說明文件常用:
1.3配置環(huán)境變量 PASH
bashrc配置文件非常重要,相當(dāng)于圖形化界面的設(shè)置選項(xiàng)。很多時(shí)候,命令找不到,缺少XXX,都可能與這個(gè)有關(guān)。如果bashrc修改錯(cuò)誤,會造成嚴(yán)重的影響。
bashrc:為每一個(gè)運(yùn)行bash shell的用戶執(zhí)行此文件。當(dāng)bash shell被打開時(shí),該文件被讀取,其中rc是“run configure”的簡寫。
1、Alias部分
例如“less -S”,每次要敲七個(gè)字符,簡寫成 le,兩個(gè)字符就夠了。
2.PS 部分
修改命令行的小標(biāo)標(biāo)~
修改前:

修改后:

3.export 部分
export 是最重要的一部分,這部分內(nèi)容是修改系統(tǒng)一些默認(rèn)變量的行為,例如敲 env 命令會顯示出當(dāng)前賬戶所有環(huán)境變量,其中比較重要的就是 PATH 變量,export 之后,每次登錄之后,系統(tǒng)會重新配置默認(rèn)環(huán)境變量。除了 PATH,也可以修改 perl 模塊目錄,python 模塊目錄以及其他一些配置等。
4.PATH 部分
PATH 變量是 Linux 系統(tǒng)默認(rèn)程序路徑,當(dāng)在命令行敲命令時(shí),系統(tǒng)會從 PATH 變量中設(shè)定的目錄中查找程序,which 命令搜索時(shí)也會從 PATH 變量中進(jìn)行搜索。Linux 系統(tǒng)中常見的軟件找不到“command not found...”多是因?yàn)?PAHT 變量沒有設(shè)置成功引起的。PATH 變量可以極大的方便軟件的使用,無需使用全路徑,在任何目錄下直接使用軟件名即可運(yùn)行,否則需要一直使用全路徑。
最后的最后,大家修改完bashrc后記得刷新一下,同時(shí)也要對bashrc做好備份哦~
1.4使用conda自動(dòng)安裝
1、安裝conda
2、配置chanels
chanels理解成軟件倉庫。conda默認(rèn)是不包含生物信息軟件倉庫的,所以需要添加。
方法是修改 ~/.condarc
3.使用 conda安裝軟件
4.虛擬環(huán)境
有的軟件在安裝的時(shí)候,會有環(huán)境沖突,比如 orthofinder依賴python2.7,但是 conda主環(huán)境安裝的是 python3.7。這種情況可以新建一個(gè)新的環(huán)境。
2.數(shù)據(jù)庫下載
使用 Linux 系統(tǒng)下的下載命令,直接下載到服務(wù)器里。Linux 命令行下載的工具其實(shí)有很多,系統(tǒng)自帶 wget 和 curl 命令,也可以自行下載 axel 等命令。wget 非常方便,給定鏈接地址,就可以直接 wget 下載了。wget 和 curl 都支持 http,ftp 等多種協(xié)議。
2.ftp 下載
FTP 是 File Transfer Protocol(文件傳輸協(xié)議)的英文簡稱,相比于 http 協(xié)議,更加穩(wěn)定,傳輸速度也更快。很多網(wǎng)站提供 ftp 協(xié)議的數(shù)據(jù)下載。?
ncbi 的 ftp 地址為:ftp://ftp.ncbi.nlm.nih.gov/embl 的 ftp 地址為:ftp://ftp.ensembl.org/pub/
3.高速下載
Asprea 是一款非常神奇的工具,它可以極大的提高數(shù)據(jù)傳輸?shù)男省?/p>
4.批量下載序列:Batchentrez
總之,自己需要什么數(shù)據(jù)庫就去下載對應(yīng)的數(shù)據(jù)。例如:
NT庫:ftp.ncbi.nlm.nih.gov:/blast/db/nt*.tar.gz
NR庫:ftp.ncbi.nlm.nih.gov:/blast/db/nr*.tar.gz?
COG/KOG:ftp://ftp.ncbi.nlm.nih.gov/pub/COG/
Swissprot:ftp://ftp.ncbi.nlm.nih.gov/blast/db/FASTA/swissprot.gz?
等等
