Seqkit:強(qiáng)大的序列處理工具
Seqkit是一款專門處理fsata/q序列文件的軟件。
github地址:
https://github.com/shenwei356/seqkit
下載地址:
https://bioinf.shenwei.me/seqkit/download/
選擇適合自己的版本

tar -zxvf seqkit_linux_amd64.tar.gz,解壓后只有一個(gè)seqkit程序。
發(fā)現(xiàn)有很多的功能,多到自己曾經(jīng)遇到過(guò)的所有的序列處理問(wèn)題(相見(jiàn)恨晚),從序列查看到提取序列、拆分、處理、排序等等,實(shí)在是序列處理居家必備良藥,思緒兩秒鐘,加入自己環(huán)境變量。
這次檢索到這個(gè)工具,的因?yàn)橄朐u(píng)估一下我用Hifiasm組裝出來(lái)的序列堿基數(shù),剩下的功能幾乎涉及了我能想到的所有的序列處理工作,在CSDN社區(qū)中,作者“生信寶典”幾乎闡述了所有的功能(Ref1),時(shí)間原因,我就不探索了。
seqkit stat 統(tǒng)計(jì)序列信息
$ seqkit stats *.f{a,q}.gz #統(tǒng)計(jì)序列信息
$ seqkit stats *.f{a,q}.gz -T #用tab分割
$ seqkit stats *.f{a,q}.gz -a # 統(tǒng)計(jì)更多信息
$ seqkit stats -j 10 refseq/virual/*.fna.gz #多文件統(tǒng)計(jì)( -j:使用多線程)
補(bǔ)充37個(gè)工具:

上圖參考生信寶典的帖子。
Ref1:
https://blog.csdn.net/qazplm12_3/article/details/115535361
Ref2: https://www.jianshu.com/p/471283080bd6?utm_campaign=hugo
本文使用 文章同步助手 同步