秋天來了,不用MEGA種棵樹嗎?

秋天來了,不用MEGA種棵樹嗎?
一、什么是系統(tǒng)發(fā)育樹?
????????演化是指,生物特征代代相傳,略有改變。即生物在形態(tài)結(jié)構(gòu)、生理行為等方面發(fā)生的世代間緩慢可遺傳的改變。其中不包含“進(jìn)步”的意味。
????????系統(tǒng)發(fā)育樹(演化樹)是指,用分支圖像概括物種間的遠(yuǎn)近親疏,從而反映物種間的演化關(guān)系的可視化圖片。系統(tǒng)發(fā)育樹包括分子樹與物種樹。
1.分子樹:
????????依據(jù)一個或多個基因或蛋白序列構(gòu)建的反映分子系統(tǒng)演化的發(fā)育樹,如16/18S rRNA、血紅蛋白、磷酸果糖激酶等。
????????分子樹并不必然反映物種親緣關(guān)系的遠(yuǎn)近。物種間親緣關(guān)系過近或過遠(yuǎn)都不利于建樹。
2.物種樹:
????????反映物種實(shí)際種系的發(fā)育樹?;蚪M水平(相信我不要輕易在筆記本上跑基因組)。

二、如何看系統(tǒng)發(fā)育樹?
表1 系統(tǒng)發(fā)育樹的結(jié)構(gòu)


三、如何繪制系統(tǒng)發(fā)育樹?
1.MEGA——Molecular Evolutionary Genetics Analysis
(1)?百度MEGA官網(wǎng)下載 or 公眾號后臺回復(fù)工具,自行下載MEGA7.0,據(jù)說現(xiàn)在已經(jīng)出到MEGAX了,確定不是某瘋?不同版本的MEGA功能上其實(shí)大同小異,以下未經(jīng)注明均使用MEGA7.0。
(2)?所謂MEGA主要三大看點(diǎn):
????????①Sequence Analyses——序列分析
????????②Statistical Methods——統(tǒng)計(jì)方法
????????③Powerful Visual Tools——可視化
2.處理流程
(1)?導(dǎo)入fasta格式文件
(2)?多序列比對——生成meg格式文件
(3)?繪制發(fā)育樹——生成newick格式文件
3.具體步驟:以分子樹為例
(1)?序列的獲得:NCBI
????????所需序列文件儲存格式為fasta,這是一種基于文本,用于表示核苷酸或氨基酸序列的文件格式。氨基酸或核苷酸均用單字母表示,允許在序列前添加注釋。MEGA中,F(xiàn)ile→Edit a Text File提供fasta格式編輯界面。
????????一條有效的fasta格式序列包括兩行,第一行是序列注釋,第二行是序列信息,具體編輯格式如下:
????????①第一行必須以“>”開頭,表示下一個序列的開始與上一個序列的結(jié)束。
????????②第二行為序列信息,允許空格、換行、空行等,直到下一個大于號結(jié)束。
????????例如:通過NCBI獲取以下12個物種的MYB轉(zhuǎn)錄因子mRNA序列的fasta格式文件。

(1)?多序列比對:Align
????????Align→Edit/Build Alignment→create a new alignment,對比序列選擇DNA,將并歸完成的fasta格式文件導(dǎo)入其中(直接拖入或在M7:Alignment Explorer中打開)。
????????Ctrl+A→Align selected block by ClustalW(圖標(biāo)也是一個W),默認(rèn)選項(xiàng)對比。對比結(jié)束后刪掉首尾沒有對齊的堿基。
????????Data→Export Alignment→MEGA Format,生成meg格式文件。
(2)?發(fā)育樹構(gòu)建:phylogeny
????????MEGA→phylogeny提供5種建樹方法,具體算法筆者表示暫不詳述(不懂啊啊),總結(jié)起來應(yīng)用時大概下面幾種類型:
????????①距離法:通過比較待測物種,依據(jù)演化距離模型,推導(dǎo)各分類群間的距離矩陣,據(jù)此建樹。
????????非加權(quán)分組平均法:UPGMA
????????最小演化法:ME
????????鄰位歸并法:NJ(通常適用于種內(nèi))
????????②特征法:基于序列差異而非演化距離建樹。
????????最大簡約法:MP
????????最大似然法:ML(通常適用于種間)
(3)?發(fā)育樹評估:bootstrap
????????理論上要求自展值bootstrap為1000,自展值大于95%時表示可信。
????????實(shí)際上當(dāng)相似度大的物種比較時,通常認(rèn)為自展值大于50%時可信,小于50%時隱去。
????????當(dāng)?shù)妥哉怪悼拷?jié)點(diǎn)時,可能由于基因相似度太高難以區(qū)分;
????????當(dāng)?shù)妥哉怪悼拷鶗r,可能由于基因相似度太低難以區(qū)分。
(4)?發(fā)育樹美化:iTOL
????????丑樹生成之后,F(xiàn)ile→Export current tree(newick)→Export→save,將構(gòu)建的發(fā)育樹保存為newick格式。
????????然后網(wǎng)頁打開https://itol.embl.de/,注冊賬號并登陸后,My tree→Upload tree flies上傳保存的樹文件,一陣卡頓后,可進(jìn)行美化。
????????以下為對比圖,當(dāng)筆者學(xué)會如何編寫注釋文件后,估計(jì)能有質(zhì)的提高。Orz......以下也可以看出物種樹與單基因分子樹之間巨大的差異……對這就是反例!好好學(xué)習(xí)……


