NCBI BLAST結(jié)果解讀
最近通過Sanger測(cè)序擴(kuò)了一些序列,然后通過BLAST進(jìn)行比對(duì),后面如何處理這些序列雖然不是啥難事,但實(shí)驗(yàn)室老師問了我一些BLAST結(jié)果的信息當(dāng)時(shí)沒回答上來(lái),覺得還是不能就這么迷迷糊糊的過去了,再整理一下BLAST的結(jié)果。
1. Basic BLAST 包含 5 個(gè)常用的 Blast:
BLASTP 是蛋白序列到蛋白庫(kù)中的一種查詢;
BLASTX 是核酸序列到蛋白庫(kù)中的一種查;
BLASTN 是核酸序列到核酸庫(kù)中的一種查詢;
TBLASTN 是蛋白序列到核酸庫(kù)中的一種查詢。與 BLASTX 相反,它是將庫(kù)中的核酸序列翻譯成蛋白序列,再同所查序列作蛋白與蛋白的比對(duì)。
TBLASTX 是核酸序列到核酸庫(kù)中的一種查詢。此種查詢將庫(kù)中的核酸序列和所查的核酸序列都翻譯成蛋白(每條核酸序列會(huì)產(chǎn)生6 條可能的蛋白序列)。
Specialized BLAST:是一些特殊目的的 Blast,如 Primer-BLAST、IgBLAST。
2. BLAST比對(duì)基本過程:
BLAST比對(duì)的基本過程是它首先找出查詢序列和目標(biāo)序列間所有匹配程度超過一定閾值的片段對(duì),然后對(duì)片段對(duì)根據(jù)給定的相似性閾值進(jìn)行延伸,得到一定長(zhǎng)度的相似性片段,最后給出高分值片段對(duì)。
3. BLAST結(jié)果的描述區(qū)域。
我用Guc的樣本ITS2序列進(jìn)行了blast,


Score: 序列比對(duì)過程中計(jì)算的得分值,得分越高,序列匹配結(jié)果越好;
E值:表示隨機(jī)匹配的可能性。E值越小,序列越相似,E值接近0或?yàn)?時(shí),基本上就是完全匹配了。E值越大,隨機(jī)匹配的可能性也就越大;
Identities:序列相似性,匹配上的堿基數(shù)占總序列長(zhǎng)的百分?jǐn)?shù)。如圖所示:比對(duì)上的序列長(zhǎng)度為1959bp, 我的序列長(zhǎng)度為1585bp,其中1581個(gè)堿基匹配上了,
我是序列和比對(duì)到序列比起來(lái),兩端都少了一些堿基。此外有兩個(gè)Gaps ,如下圖:

?
Query: 自己的序列;
Sbjct:比對(duì)上的序列;
下一步把這些序列都下載下來(lái),看看這些gap是不是穩(wěn)定存在。
本文使用 文章同步助手 同步