手把手教你基因進(jìn)化樹(shù)的構(gòu)建(二)
在這一篇中,小云將帶大家學(xué)習(xí)如何去使用Mega軟件做多序列的比對(duì)和構(gòu)建基因進(jìn)化樹(shù)。 首先,先和大家介紹下。MEGA(Molecular Evolutionary Genetics Analysis)軟件是一種常用的生物信息學(xué)工具,主要用于分析和推斷生物序列(如DNA、蛋白質(zhì)序列)的進(jìn)化關(guān)系和親緣關(guān)系。通過(guò)構(gòu)建進(jìn)化樹(shù),可以幫助研究人員了解不同生物種群之間的演化歷程和分類關(guān)系。那么接下來(lái)就開(kāi)始比對(duì)和建樹(shù)吧!
一、多序列比對(duì)
首先,我們現(xiàn)在mega的首頁(yè)選擇"ALIGN",點(diǎn)擊 "Edit/Build Alignment" ,會(huì)彈出一個(gè)對(duì)話框,選擇"Create a new alignment",根據(jù)需要比對(duì)的序列 (
氨基酸序列或核苷酸序列
),選擇"DNA"或"Protein"。由于我們上一篇下載的數(shù)據(jù)為Synaptophysin蛋白序列,所以我們可以選擇Protein。
緊接著,我們可以點(diǎn)擊"Edit",選擇"Insert Sequence From File"導(dǎo)入我們需要比對(duì)的序列,序列文件格式為
.fasta
格式。
打開(kāi)在上一篇中下載的sequence.fasta,導(dǎo)入到mega軟件中,可以得到的序列情況如下所示:
接著我們要對(duì)目標(biāo)序列進(jìn)行多序列比較,我們選擇ClustalW,調(diào)整參數(shù)(一般用默認(rèn)參數(shù)),即可完成多序列比對(duì)。
然后我們可以再看到序列這邊,為了使進(jìn)化樹(shù)不會(huì)構(gòu)建失敗,我們需要?jiǎng)h掉兩端差異較大的地方,留下基因保守的地方,使得兩端對(duì)齊。因?yàn)槿绻蛄械南嗨菩蕴畹脑?,進(jìn)化樹(shù)就很可能構(gòu)建失敗。具體的步驟就是看看序列兩端的對(duì)齊情況是否差異性較大,如圖所示我們將這段刪除。先選中此段序列,點(diǎn)擊鼠標(biāo)右鍵,選擇"Delete"。
緊接著,我們點(diǎn)擊"Data",選擇"Phylogenetic Analysis"進(jìn)行系統(tǒng)發(fā)育分析。
二、基因進(jìn)化樹(shù)的構(gòu)建
接著,我們返回主頁(yè)面,點(diǎn)擊"PHYLOGENY",構(gòu)建系統(tǒng)發(fā)育樹(shù)主要有三種方法,分別是最大似然法 (Maximum Likelihood)、鄰接法 (Neighbor-Joining) 和最小進(jìn)化法 (Minimum Evolution)。 其中: 1.?最大似然法(Maximum Likelihood): 最大似然法是基于概率統(tǒng)計(jì)原理的一種方法。它通過(guò)計(jì)算給定數(shù)據(jù)集的多個(gè)進(jìn)化樹(shù)模型中最大化似然函數(shù)的樹(shù)結(jié)構(gòu),從而找到最可能的進(jìn)化樹(shù)。最大似然法考慮了每個(gè)進(jìn)化樹(shù)模型中觀察到的序列數(shù)據(jù)出現(xiàn)的概率,并根據(jù)最佳擬合的模型參數(shù)進(jìn)行優(yōu)化。 2.?鄰接法(Neighbor-Joining): 鄰接法是一種啟發(fā)式的方法,它基于序列數(shù)據(jù)的相似性來(lái)構(gòu)建進(jìn)化樹(shù)。鄰接法首先計(jì)算序列之間的距離矩陣,然后根據(jù)距離矩陣中的最小距離,將序列一對(duì)一對(duì)地合并為一個(gè)節(jié)點(diǎn),直到構(gòu)建出一棵完整的進(jìn)化樹(shù)。鄰接法適用于較大的序列數(shù)據(jù)集,計(jì)算速度相對(duì)較快。 3.?最小進(jìn)化法(Minimum Evolution): 最小進(jìn)化法是一種基于樹(shù)長(zhǎng)度的方法。它嘗試尋找一棵進(jìn)化樹(shù),使所有序列之間的進(jìn)化步驟總和最小。最小進(jìn)化法通過(guò)優(yōu)化樹(shù)的拓?fù)浣Y(jié)構(gòu)和分支長(zhǎng)度來(lái)求解最小進(jìn)化樹(shù)。這種方法在序列數(shù)據(jù)短小且進(jìn)化關(guān)系較簡(jiǎn)單的情況下效果較好。 為了能夠更快地得到匹配結(jié)果,我們采用鄰接法,其中的方法將選用Bootstrap method。因?yàn)猷徑臃ㄍǔEcBootstrap方法結(jié)合使用,以評(píng)估構(gòu)建的進(jìn)化樹(shù)的可靠性。Bootstrap方法是一種重采樣技術(shù),用于生成多個(gè)數(shù)據(jù)集的重復(fù)樣本,從而通過(guò)多次構(gòu)建進(jìn)化樹(shù)來(lái)估計(jì)結(jié)果的可靠性。
最終得到的基因進(jìn)化樹(shù)結(jié)果如下:
相信通過(guò)這篇的講解,大家也會(huì)對(duì)基因進(jìn)化樹(shù)的構(gòu)建軟件的使用有了大概的了解了吧!接下來(lái)可以自己實(shí)操一下,然后對(duì)基因進(jìn)化樹(shù)進(jìn)行構(gòu)建!