最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

【電子筆記】基因組共線性分析簡單流程

2023-03-31 23:49 作者:駭浪_黃團(tuán)子  | 我要投稿

* 本電子筆記內(nèi)容僅用于記錄個人學(xué)習(xí)過程并為將來失憶的自己提供參考,歡迎討論指正。

主要使用MCScanX軟件進(jìn)行基因組共線性分析,以及后續(xù)下游分析。

原始數(shù)據(jù):

????基因組蛋白質(zhì)序列 .faa文件

????基因組注釋信息 .gff文件

p.s.據(jù)說一次最多只能做5個物種的共線性比較,需注意。


基本使用流程:

????0. 原始數(shù)據(jù)處理

????MCScanX讀取的gff文件與一般的九列g(shù)ff文件不同,是只有四列的縮略版本。每一列內(nèi)容分別是:染色體編號、基因編號、基因起始位置,基因終止位置(以tab分割)。

? ? 可使用awk命令進(jìn)行轉(zhuǎn)換:



????通常同時進(jìn)行組內(nèi)和組間的共線性比較,方便后續(xù)下游分析,因此需先將基因組文件和注釋文件合并:

????p.s.其實也可以一對一進(jìn)行共線性比較,所以faa文件不一定需要合并。但是gff文件必須要合并,否則后續(xù)MCScanX步驟得到的collinearity文件會沒有結(jié)果。


????1. BLASTP聯(lián)配

??? 這里使用速度更快的diamond:


????2. MCScanX分析

????需要.blast文件和.gff文件。注意這兩個文件名需要一致且放在同一目錄下,否則會報錯。

? ??

.collinearity文件內(nèi)容


????3. 后續(xù)分析

????MCScanX自帶了一些作圖java腳本,但是做的圖比較粗糙。如果后續(xù)學(xué)了怎么用別的軟件作圖再補(bǔ)充。

????自帶的幾個作圖腳本需要.ctl文件指定作圖大小和染色體參數(shù),默認(rèn).ctl文件位于MCScanX/downstream_analyses/文件夾內(nèi),共有五個。(bar.ctl,?circle.ctl, dot.ctl, dual_synteny.ctl, family.ctl)

????1) dot_plotter 點陣圖,最直觀的共線性可視化結(jié)果

點陣圖示例


? ? 2)?circle_plotter 很漂亮的circos圖

circos圖示例


? ? 3) bar_plotter 直觀展示參考基因組在目標(biāo)基因組上的共線性組成

bar圖示例


? ? 4)?dual_synteny_plotter 感覺和circos圖差不多,但是不太好看

dual_synteny圖示例


可能會補(bǔ)充一些其他的共線性作圖方案。


參考文章:

http://chibba.pgml.uga.edu/mcscan2/documentation/manual.pdf(為啥這兩天MCScanX官網(wǎng)一直登不上去...)

https://blog.csdn.net/u012110870/article/details/102804418

https://blog.csdn.net/hs6605015/article/details/108887241

希望再也不要碰到102條染色體的基因組了,我真的會謝。

【電子筆記】基因組共線性分析簡單流程的評論 (共 條)

分享到微博請遵守國家法律
河源市| 密云县| 巴林左旗| 龙泉市| 旬阳县| 克拉玛依市| 澄迈县| 乾安县| 鄱阳县| 鹤庆县| 旌德县| 房产| 泊头市| 涡阳县| 衡东县| 建水县| 东乡族自治县| 金坛市| 来凤县| 海南省| 化州市| 大竹县| 乃东县| 子洲县| 三原县| 六盘水市| 同仁县| 吉隆县| 通海县| 泸定县| 阳新县| 东山县| 齐齐哈尔市| 瓮安县| 天津市| 银川市| 金堂县| 孝昌县| 清镇市| 莱阳市| 丰台区|