喜報(bào) | 青島歐易基因組服務(wù)再添一項(xiàng)軟件著作
近期青島歐易基因組學(xué)在證書授權(quán)上又迎來好消息啦~此項(xiàng)授權(quán)軟件為SNP一致性比較工具軟件,這標(biāo)志著青島歐易在基因組技術(shù)的專業(yè)性更進(jìn)一步,同時(shí)意味著青島歐易將能更好的為廣大科研工作者服務(wù)~
SNP一致性比較工具軟件
單核苷酸多態(tài)性(single nucleotide polymorphism,簡(jiǎn)稱SNP)主要是指在基因組水平上由單個(gè)核苷酸的變異所引起的DNA序列多態(tài)性,它在基因組中廣泛存在。SNP是一種二態(tài)的標(biāo)記,由單個(gè)堿基的轉(zhuǎn)換或顛換所引起,也可由堿基的插入或缺失所致。SNP既可能在基因序列內(nèi),也可能在基因以外的非編碼序列上。用于存儲(chǔ)基因分型變異位點(diǎn)的標(biāo)準(zhǔn)格式是Variant Call Format(簡(jiǎn)稱VCF)。
現(xiàn)在測(cè)序技術(shù)飛速發(fā)展,新的測(cè)序平臺(tái)不斷涌出,評(píng)價(jià)新測(cè)序平臺(tái)檢測(cè)出SNP的穩(wěn)定性、準(zhǔn)確性等指標(biāo)極為重要。同一樣品通過待評(píng)價(jià)的新測(cè)序平臺(tái)和“金標(biāo)準(zhǔn)”的測(cè)序平臺(tái)分別檢測(cè)出的SNP同時(shí)儲(chǔ)存在VCF格式的文件中,本軟件可以分別比較兩者間純合位點(diǎn)和雜合位點(diǎn)的一致性,從而間接性評(píng)估待評(píng)價(jià)的新測(cè)序平臺(tái)的可靠性,為下一步是否可替換為價(jià)格更低的新測(cè)序平臺(tái)提供依據(jù)。
使用說明
01 核心功能
本軟件可以計(jì)算重復(fù)樣品、實(shí)驗(yàn)對(duì)照樣品及任何兩個(gè)樣品之間SNP的一致位點(diǎn)數(shù)和不一致位點(diǎn)數(shù),并對(duì)所有位點(diǎn)進(jìn)行分類統(tǒng)計(jì),從而確定優(yōu)化后的實(shí)驗(yàn)流程、分析流程以及測(cè)序平臺(tái)等是否有較好的效果。
02 基本說明
軟件需要有格式正確的輸入文件方可正常執(zhí)行。
其使用樣例如下:
必要參數(shù):
-i 輸入基因分型VCF格式數(shù)據(jù),支持gzip壓縮格式
-s 兩兩樣品比較分組列表,使用tab分割
-o 輸出信息統(tǒng)計(jì)表
03 使用示例
perl SNP_consistency_comparison.pl -i AN03.imp_hap.vcf.gz -s sample_compare.list -o result.txt
其中,-i AN03.imp_hap.vcf.gz 為基因分型VCF格式數(shù)據(jù)(輸入文件);-s sample_compare.list為需要比較的兩兩樣品名稱列表文件(輸入文件);-o result.txt 為輸出統(tǒng)計(jì)表文件
軟件輸出結(jié)果展示
信息統(tǒng)計(jì)表文件(-o參數(shù)),如下圖。
結(jié)果格式說明:
sample1列:第一個(gè)樣品名稱;
sample2列:第二個(gè)樣品名稱;
miss_genotype列:第一個(gè)樣品沒有分型且第二個(gè)樣品有分型的位點(diǎn)數(shù),如“.”與“AA”;
genotype_miss列:第一個(gè)樣品有分型且第二個(gè)樣品沒有分型的位點(diǎn)數(shù),如“AA” 與“.”;
miss_miss列:兩個(gè)樣品都沒有分型的位點(diǎn)數(shù),如“.” 與“.”;
homo_homo_identical列:兩個(gè)樣品分型均為純合且一致的位點(diǎn)數(shù),如“AA”與“AA”;
homo_homo_discordance列:兩個(gè)樣品分型均為純合且不一致的位點(diǎn)數(shù),如“AA”與“TT”;
hete_homo_include列:第一個(gè)樣品為雜合,第二個(gè)樣品為純合且純合堿基包含于雜合中的位點(diǎn)數(shù),如“AT”與“AA”;
hete_homo_notin列:第一個(gè)樣品為雜合,第二個(gè)樣品為純合且純合堿基不包含于雜合中的位點(diǎn)數(shù),如“AT”與“CC”;
homo_hete_include列:第一個(gè)樣品為純合,第二個(gè)樣品為雜合且純合堿基包含于雜合中的位點(diǎn)數(shù),如“AA”與“AT”;
homo_hete_notin列:第一個(gè)樣品為純合,第二個(gè)樣品為雜合且純合堿基不包含于雜合中的位點(diǎn)數(shù),如“CC”與“AT”;
hete_hete_identical列:兩個(gè)樣品均為雜合且一致的位點(diǎn)數(shù),如“AT”與“AT”;
hete_hete_include列:兩個(gè)樣品均為雜合且只有一個(gè)堿基一致的位點(diǎn)數(shù),如“AC”與“AT”;
hete_hete_notin列:兩個(gè)樣品均為雜合且兩個(gè)堿基均不一致的位點(diǎn)數(shù),如“AC”與“GT”;
下圖可輔助理解,“+”前后分別為第一個(gè)樣品和第二個(gè)樣品
青島歐易
青島歐易生物科技有限公司多年來,立足于生命科學(xué),聚焦基因組學(xué)、分子育種、微生物等領(lǐng)域。公司現(xiàn)擁有2b-RAD、MethylRAD、Super-GBS、LcWGS、2bRAD-M微生物五項(xiàng)特色技術(shù),經(jīng)過多年努力,人才隊(duì)伍更加壯大、團(tuán)隊(duì)管理經(jīng)驗(yàn)更加豐富、技術(shù)服務(wù)工作更加精準(zhǔn)高效,積極參與并推動(dòng)科技服務(wù)產(chǎn)業(yè)發(fā)展,致力于成為受人尊敬的生物科技公司。
END
青島歐易? 撰文
本文系歐易生物原創(chuàng)
轉(zhuǎn)載請(qǐng)注明文本轉(zhuǎn)自歐易生物