最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

關(guān)于sam轉(zhuǎn)bam遇到的錯誤解決方法記錄

2023-07-31 17:06 作者:薇港  | 我要投稿

在用samtools?view?的時候出現(xiàn) Duplicate entry "k127_110300" in sam headersamtools view: failed to add PG line to the header 經(jīng)查看"k127_110300"在ZH9_FDSW220008792-2r.sam中,通過查閱https://github.com/samtools/samtools/issues/1217這篇帖子看到了解決辦法。

先找出重復(fù)的header: awk '/^@/ && /:k127_110300/ { print } /^[^@]/ { exit }' ZH9_FDSW220008792-2r.sam 再除掉重復(fù): awk 'BEGIN { i = 0; } /^@/ { if (/:k127_110300/) { if (i++ < 1) { print; } } else { print } } /^[^@]/ { print }' ZH9_FDSW220008792-2r.sam > ZH9_FDSW220008792-2r.sam 但是再次運行samtools?view還是出現(xiàn)同樣問題還多了一行 [main_samview] fail to read the header from "ZH9_FDSW220008792-2r.sam" 后來發(fā)現(xiàn)原來我是多條重復(fù)(lll¬ω¬),決定用bamutil試一下。

參考一下https://blog.csdn.net/weixin_51192038/article/details/124994097 直接用conda安裝就可以。 bam convert ?--in *.sam ?--out *.bam samtools sort *.bam -o *_sorted.bam bam dedup --in *_sorted.bam --out ./*.bam 然后現(xiàn)在又要用bamM,,,發(fā)現(xiàn)是合并后的fa文件里有序列id重復(fù)的,打算將不同樣地的序列id前加上樣地名。(這個最好!!不依賴軟件) 先將id提取出來得到id.txt,參考https://www.jianshu.com/p/a0c3c8f96b1f,得到一個rename.txt,第一列是原id,第二列是加了樣地名的id。 用excel處理:將id.txt用excel打開,在第二列第一行輸入樣地例如BH,再將第一列第一行的id復(fù)制粘貼到BH后,再點擊第二列第二行,ctrl+e,就完成了。 用seqkit處理:seqkit replace --ignore-case --kv-file rename.txt --pattern "^(\w+)" --replacement "{kv}" genome.fa -o genome.new.fa

關(guān)于sam轉(zhuǎn)bam遇到的錯誤解決方法記錄的評論 (共 條)

分享到微博請遵守國家法律
古丈县| 枞阳县| 日照市| 定陶县| 海晏县| 镇江市| 大埔区| 年辖:市辖区| 长治市| 洛川县| 库车县| 德惠市| 偏关县| 奉化市| 洪泽县| 繁昌县| 桦南县| 保定市| 隆化县| 迭部县| 琼结县| 神农架林区| 思南县| 鱼台县| 来宾市| 阜南县| 娱乐| 犍为县| 泗洪县| 新巴尔虎右旗| 郸城县| 揭东县| 洪泽县| 石狮市| 鄂托克旗| 赫章县| 南华县| 当涂县| 屏南县| 台北县| 广昌县|