神器 | 快速開(kāi)發(fā)分子標(biāo)記引物,輸入兩個(gè)親本基因組,輸出變異位點(diǎn)。
寫(xiě)在前面
「育種」是目前大多關(guān)心的事情。雜交育種仍然是目前最為常用的育種手段。任何方法創(chuàng)新的優(yōu)異材料,下一步都可能應(yīng)用于雜交育種。反過(guò)來(lái),「基因定位」則是基于雜交群體,開(kāi)發(fā)分子標(biāo)記,定位到關(guān)鍵性狀的關(guān)聯(lián)區(qū)間,并試圖確定Casual Variants。兩者都會(huì)涉及到兩個(gè)親本和他們的子代。當(dāng)我們有兩個(gè)親本的基因組序列時(shí),完全可以基于這兩個(gè)序列,直接確定差異位點(diǎn),進(jìn)而相對(duì)有方向的設(shè)計(jì)引物,用于快速定位,更或者,鑒定雜種后代。相對(duì)于簡(jiǎn)單的單個(gè)物種基因組序列鑒定 SSR,隨后設(shè)計(jì)引物。這一操作,顯得更為高效且靠譜。
當(dāng)然,事實(shí)上,這個(gè)需求黎老板早前也有與我提到,對(duì)應(yīng)的,那么這個(gè)需求在「作物學(xué)」相關(guān)科研工作,必然是存在且重要。于是,有了今天這個(gè)插件「Genome VarScan」。
插件簡(jiǎn)介
「Genome VarScan」只需要用戶輸入兩個(gè)基因組序列文件,設(shè)置一個(gè)輸出目錄,點(diǎn)擊「Start」,等待即可。邏輯上,對(duì)于水稻,我這邊只需要不到10分鐘。

直接上示例

大概 10 分鐘搞定。
輸出文件如下

對(duì)于其中的paf
文件,可以直接用 TBtools 的?Paf Viz
?功能查看

但是事實(shí)上,我會(huì)更關(guān)心下面這個(gè)文件

雖然比較大,但是信息比較全,默認(rèn)輸出是包括所有 SNP,考慮限制變異位點(diǎn)的寬度為大于0,也就是至少是1bp長(zhǎng)度變化,那么就只有插入缺失。

可以看到這是一個(gè)大片段的缺失

當(dāng)然,很多時(shí)候,我們最喜歡的還是大于30bp,但是又小于200bp的變異位點(diǎn),那么我會(huì)建議,用這個(gè)

如此,我們會(huì)得到一個(gè)相對(duì)較小的文件。
當(dāng)我們得到這個(gè)文件,那么其實(shí)接下來(lái)的事情就比較簡(jiǎn)單:

簡(jiǎn)單篩選一下,保留感興趣的行
使用「Batch Target Region Primer Design」,使用參考基因組序列進(jìn)行批量引物設(shè)計(jì)
使用「Primer Check」分別對(duì)兩個(gè)物種進(jìn)行批量引物篩選,找到材料內(nèi)特異的位點(diǎn)
簡(jiǎn)單比較統(tǒng)一引物在不同材料中是否確實(shí)有長(zhǎng)度差異
用于實(shí)驗(yàn)驗(yàn)證
用于選育種
大體如下,首先是批量引物設(shè)計(jì)


復(fù)制引物之后轉(zhuǎn)換成 Fasta 格式,檢測(cè)在一個(gè)材料中的特異性

可以同時(shí)檢測(cè)在另一個(gè)材料中的特異性

一共是 5000對(duì) 引物左右,所以咱們就慢慢先等著結(jié)果。估計(jì)至少要等上一段時(shí)間吧。具體沒(méi)測(cè)試。建議過(guò)夜培養(yǎng)。晚上沒(méi)吃飯,剛才去吃了宵夜回來(lái)。沒(méi)想到就過(guò)了12點(diǎn)。似乎還是跑了很久,必須過(guò)夜培養(yǎng)了。也罷,只選幾個(gè)引物看看。

隨便選兩對(duì)引物,都可以直接用于跑標(biāo)記....

寫(xiě)在最后
很多時(shí)候,你只需要知道自己在干什么就行。其他人常常只能看到他們能看到的東西,而你不一樣。