linux 003
理解基本內(nèi)容之后就是使用,每遇到一個(gè),就把他記住,堅(jiān)持半年再來看
以下是文本處理相關(guān)內(nèi)容
一、三駕馬車
https://mp.weixin.qq.com/s/w1nGKH-_hv5YSmAcRQFIcA
grep -f :將id中的內(nèi)容在info中查找
grep -c:將結(jié)果進(jìn)行wc
grep -w:必須一樣的,不模糊
grep -v:反選
二、馬哥linux及練習(xí)題,來自生信技能樹
如果只是生物信息學(xué)需要,請不要全部看完,太復(fù)雜了,看第2~9章節(jié)即可。 https://www.bilibili.com/video/av40331948/ 就是到P30即可,視頻可能難度超綱,畢竟是程序員的知識點(diǎn)。
其實(shí)你應(yīng)該是學(xué)習(xí)的是我的生物信息學(xué)之linux,視頻鏈接在 https://www.bilibili.com/video/av28813815 學(xué)完應(yīng)該可以完成 LINUX的練習(xí)題:
最低要求是完成我的 linux 20題 http://www.bio-info-trainee.com/2900.html
其次完成生物信息學(xué)數(shù)據(jù)格式的習(xí)題(blast/blat/fa-fq/sam-bam/vcf/bed/gtf-gff),收集這些格式的說明書。
fasta和fastq格式文件的shell小練習(xí) http://www.bio-info-trainee.com/3575.html
sam和bam格式文件的shell小練習(xí) http://www.bio-info-trainee.com/3578.html
VCF格式文件的shell小練習(xí) http://www.bio-info-trainee.com/3577.html
三、sort?
1、sort -u:去重
cut -f1 gtf | sort -u
2、-k field1[,field2] 按指定的列進(jìn)行排序
四、paste
awk '{print $1}' tmp | paste -s -d + | bc
-s是把列放在一行,默認(rèn)用????分隔
bc為任意精度算術(shù)語言提供解釋器。BC的含義是:Binary Calculator,用于實(shí)現(xiàn)任意精度計(jì)算(往往是高精度計(jì)算),如echo 2*2|bc
四、查看使用命令的頻率,并排序

history | awk '{print $2}'|sort |uniq -c|awk '{print $1"\t"$2}'|sort -k 1,1 -n
五、Tee是Linux命令,用于顯示程序的輸出并將其復(fù)制到一個(gè)文件中
六、查看系統(tǒng)版本: cat /etc/issue
https://blog.csdn.net/suma110/article/details/54382862