基因家族的鑒定-基于windows系統(tǒng)上的本地blast

文章首發(fā)于CSDN,B站,簡(jiǎn)書(shū)等。先吐槽一句,簡(jiǎn)書(shū)應(yīng)該快倒閉了。
基因組的序列提取,詳情請(qǐng)看我之前的教程https://www.jianshu.com/p/211a262aebc4
下面講如何在windows系統(tǒng)上用blast做基因家族的鑒定:
1,下載
在NCBI網(wǎng)站上下載blast工具“https://blast.ncbi.nlm.nih.gov/Blast.cgi?CMD=Web&PAGE_TYPE=BlastDocs&DOC_TYPE=Download”

點(diǎn)擊進(jìn)入ftp下載地址,選擇自己電腦合適版本的blast工具,這下載好慢呀

2,安裝并準(zhǔn)備好文件
安裝好后,進(jìn)入名為“bin”的文件夾,我用2.11版本的blast舉例,由前人的文獻(xiàn)我們知道了擬南芥的全部bZIP轉(zhuǎn)錄因子,我們想要知道毛果楊中的bZIP轉(zhuǎn)錄因子,其中一種方法就用擬南芥的bZIP成員進(jìn)行blast比對(duì)。首先將這些擬南芥的bZIP轉(zhuǎn)錄因子的蛋白序列提取整理好成fasta格式的文件,將提取好的毛果楊4.0版本的全部蛋白質(zhì),二者都拷貝一份到這個(gè)bin文件夾,文件命名不要有空格和中文。

3,操作
在電腦的左下方,輸入cmd,進(jìn)入命令提示符:

我的bin文件夾的地址是D:\ncbi-blast-2.11.0\blast-2.11.0+\bin,所以我先進(jìn)入D盤(pán),輸入命令:
D:

再輸入命令,進(jìn)入bin文件夾:
cd ncbi-blast-2.11.0\blast-2.11.0+\bin

再對(duì)毛果楊的全部蛋白建庫(kù),生成dbname中間文件,命令:
makeblastdb -in Ptrichocarpa_533_v4.1.protein.fasta -dbtype prot -out dbname

再用擬南芥的bZIP轉(zhuǎn)錄因子的作為比對(duì)序列,進(jìn)行blast比對(duì),并輸出seq.blast的結(jié)果文件:
blastp -query Arabidopsis_bzip.fasta -out seq.blast -db dbname -outfmt 6 -evalue 1e-5 -num_threads 4
等待約20s,結(jié)束了

我們看回bin文件夾,會(huì)多出一些文件,包括seq.blast結(jié)果文件,用excel打開(kāi)并保存為excel的格式

結(jié)果:

更多關(guān)于blast的教程和結(jié)果解讀分析,可以自行百度,網(wǎng)上的教程非常多。