教程 | “美好體驗”本地 BLAST 基因功能鑒定

我突然覺得,TBtools 應(yīng)該有一個愿景,亦即:讓數(shù)據(jù)分析成為一種享受,而不是折磨。
寫在前面
在過去的一個月內(nèi),TBtools每天都在更新。而幾乎所有更新都只有一個目的,那么就是進(jìn)一步支持“BLAST Zone”。詳細(xì)更新細(xì)節(jié),可以在這一教程中體現(xiàn)出來。而教程的主題,我還是稍微想了一下,盡量貼合了具體數(shù)據(jù)分析常常出現(xiàn)的場景。
在我們拿到一個基因序列時,我們最感興趣的或許就是這個基因到底具有什么功能,而對于編碼基因,那么就是具體編碼具有什么功能的蛋白。
要開展這一分析,最常規(guī)有效的做法就是,直接到 Uniprot 或者 NCBI ,隨后 BlastP 或者 BlastX 到 Swissprot 數(shù)據(jù)庫。
這兩個平臺一個在北美一個在歐洲,我們常常需要等待等待再等待,也不一定進(jìn)得去。所以最好的做法就是,直接本地 BLAST 數(shù)據(jù)庫。
整體操作步驟如下:
下載Swissprot的蛋白序列文件;
打開 TBtools 的 BLAST Zone 功能,導(dǎo)入該文件;
搞定,后續(xù)有待查的蛋白或者核酸序列,直接填入,點 Start 即可分析。
可以發(fā)現(xiàn),非常簡單。下面逐步詳解。
下載Swissprot的蛋白序列文件
直接打開鏈接
可以看到 Swiss-Prot 字樣,直接下載即可。

文件不大,大概是 86Mb,無需解壓。

從 BLAST Zone 功能導(dǎo)入
打開 TBtools 并跳轉(zhuǎn)到 BLAST Zone 功能(注意:建議更新到 TBtools v1.098668 或以上)

進(jìn)入之后,按照下圖新建一個數(shù)據(jù)庫即可,

等待建庫完成,即可看到

注:BLAST Zone 詳細(xì)功能與具體使用可參考前述推文。
序列功能注釋
接下來的內(nèi)容就非常簡單,只要想進(jìn)行序列功能注釋,無論是 1 個 還是 10000 個,直接放到 TBtools 里面,點擊 Start 即可。(10以上的建議用文件模式輸入)。
操作簡單,如下圖。幾個序列,運行起來非??欤ǘ沂?BLAST 原生,非常準(zhǔn)確)

得到結(jié)果后

關(guān)于BLAST結(jié)果的快速文本瀏覽
事實上,過去一個月,在TBtools開發(fā)上投入的時間,基本就是在優(yōu)化 Big Text View。這個功能看起來和 TBtools 沒半毛錢關(guān)系,但是他卻是重點。往往我們 BLAST得到的文件不一定很小。要快速打開和檢索,事實上是需要時間的(后續(xù)會有更方便了完美的BLAST結(jié)果分析功能推出)。這里支持了一個文本檢索操作。如下

我們只需要簡單的雙擊該項目,文檔會自動跳轉(zhuǎn)到對應(yīng)行

寫在最后
咋說呢?有時候我們確實可能很長時間看不到進(jìn)步,因為每一次進(jìn)步,都很微小。但是呢,久而久之,就是很大的進(jìn)步。如果用四字成語來說:滴水石穿,繩鋸木斷。