基因組重要疾病相關,拷貝數變異的概念及檢測方法

基本概念:
? ? 拷貝數變異(Copy number variation, CNV),一般指長度1KB以上的基因組大片段的拷貝數增加或者減少, 是基因組結構變異(Structural variation, SV) 的重要組成部分,也是染色體病的另一種重要致病機制。

? ? 人類基因組上5%~10% 的區(qū)域存在CNV,遠高于其他遺傳變異形式。每個人基因組中都攜帶有一定數量的 CNV,絕大部分為良性,并不會對機體造成影響,多數 CNV 低于 500kb。有致病意義的CNV 是造成自然流產和出生缺陷(致死)的重要遺傳因素,在智力發(fā)育障礙和自閉癥等神經系統(tǒng)異常中尤其扮演重要角色。
? ? CNV的發(fā)生機制就是非等位基因重組,第一次是在減數第一次分裂前期,一對同源染色體染色體上的非姐妹染色單體交叉互換,第二次是在減數第一次分裂后期,同源色體分離,非同源染色體自由組合。基因組上非等位的兩個高度同源的DNA序列在減數分裂或者有絲分裂的過程中發(fā)生錯誤的配對,并發(fā)生序列交換,從而導致缺失、重復的出現。
? ? 小云今天給大家介紹一款可用于分析全基因組的軟件CNVnator。
軟件依賴于root框架以及samtools。最終的可視化也是依賴于root軟件,另外還有衍生的拓展程序CNVpytor,CNVpytor能更好的出圖。
軟件可以通過conda直接安裝:
提取mapping reads,這一步會生成root文件。以下命令同時提取多個染色體的reads數,也可以只提取單個染色體。
cnvnator -root?test.root -tree?test.bam -chrom?$(seq 1 22)?X Y # 如果包含chr?cnvnator -root?test.root -tree?test.bam -chrom?$(seq?-f?'chr%g'?1 22)?chrX chrY
?
劃分bin統(tǒng)計:
cnvnator -root?test.root -his?1000 -chrom?$(seq 1 22)?X Y -fasta?reference.fa
?
區(qū)域統(tǒng)計:
cnvnator -root?test.root -stat?1000
區(qū)域計算:
cnvnator -root?test.root -partition?1000
?
分析獲得CNV:
cnvnator -root?test.root -call?1000 >?test.cnvnator.txt
轉換為vcf格式結果,其中individual fasta可參考control-free使用中的拆分開fasta。
cnvnator2VCF.pl -prefix?test?-reference?reference test.cnvnator.txt /path/to/individual/fasta_files

? ? 關注小云,小云將會持續(xù)為你帶來更多生信干貨哦。

