CNV變異檢測軟件cnvnator
爾云間? 一個專門做科研的團隊

拷貝數(shù)變異(Copy number variation, CNV),一般指長度1KB以上的基因組大片段的拷貝數(shù)增加或者減少, 是基因組結(jié)構(gòu)變異(Structural variation, SV) 的重要組成部分,也是染色體病的另一種重要致病機制。

人類基因組上5%~10% 的區(qū)域存在CNV,遠高于其他遺傳變異形式。每個人基因組中都攜帶有一定數(shù)量的 CNV,絕大部分為良性,并不會對機體造成影響,多數(shù) CNV 低于 500kb。有致病意義的CNV 是造成自然流產(chǎn)和出生缺陷(致死)的重要遺傳因素,在智力發(fā)育障礙和自閉癥等神經(jīng)系統(tǒng)異常中尤其扮演重要角色。
CNV的發(fā)生機制就是非等位基因重組,第一次是在減數(shù)第一次分裂前期,一對同源染色體染色體上的非姐妹染色單體交叉互換,第二次是在減數(shù)第一次分裂后期,同源色體分離,非同源染色體自由組合。基因組上非等位的兩個高度同源的DNA序列在減數(shù)分裂或者有絲分裂的過程中發(fā)生錯誤的配對,并發(fā)生序列交換,從而導(dǎo)致缺失、重復(fù)的出現(xiàn)。
小果今天給大家介紹一款可用于分析全基因組的軟件CNVnator。

軟件依賴于root框架以及samtools。最終的可視化也是依賴于root軟件,另外還有衍生的拓展程序CNVpytor,CNVpytor能更好的出圖。
軟件可以通過conda直接安裝:
conda install cnvnator
提取mapping reads,這一步會生成root文件。以下命令同時提取多個染色體的reads數(shù),也可以只提取單個染色體。
代碼如下:
cnvnator -root test.root -tree test.bam -chrom $(seq 1 22) X Y # 如果包含chr cnvnator -root test.root -tree test.bam -chrom $(seq -f 'chr%g' 1 22) chrX chrY
劃分bin統(tǒng)計:
cnvnator -root test.root -his 1000 -chrom $(seq 1 22) X Y -fasta reference.fa
區(qū)域統(tǒng)計:
cnvnator -root test.root -stat 1000
區(qū)域計算:
cnvnator -root test.root -partition 1000
分析獲得CNV:
cnvnator -root test.root -call 1000 > test.cnvnator.txt
轉(zhuǎn)換為vcf格式結(jié)果,其中individual fasta可參考control-free使用中的拆分開fasta。
cnvnator2VCF.pl -prefix test -reference reference test.cnvnator.txt /path/to/individual/fasta_files

關(guān)注小云,小云將會持續(xù)為您帶來更多生信干貨哦。

推薦閱讀
shengxinguoer
生信果
生信硬核知識解答
和小果一起學(xué)生信