基因組學(xué)重點(diǎn)整理
生物五界:動(dòng)物、植物、真菌、原生生物和原核生物;生物三界:真細(xì)菌、古細(xì)菌、真核生物
具有催化活性的RNA分子稱為核酶(ribozyme)核酶催化的生化反應(yīng)有:自我剪接 、催化切斷其它RNA、合成多肽鍵 、催化核苷酸的合成
新基因的產(chǎn)生:基因與基因組加倍1)整個(gè)基因組加倍; 2)單條或部分染色體加倍;3)單個(gè)或成群基因加倍。
DNA水平轉(zhuǎn)移:原核生物中的DNA水平轉(zhuǎn)移可通過接合轉(zhuǎn)移,噬菌體轉(zhuǎn)染,外源DNA的攝取等不同途徑發(fā)生,水平轉(zhuǎn)移的基因大多為非必須基因。動(dòng)物中由于種間隔離不易進(jìn)行種間雜交,但其主要來源于真核細(xì)胞與原核細(xì)胞的內(nèi)共生。動(dòng)物種間基因轉(zhuǎn)移主要集中在逆轉(zhuǎn)錄病毒及其轉(zhuǎn)座成分。
外顯子洗牌與蛋白質(zhì)創(chuàng)新:產(chǎn)生全新功能蛋白質(zhì)的方式有二種:功能域加倍,功能域或外顯子洗牌
基因冗余:一條染色體上出現(xiàn)一個(gè)基因的很多復(fù)份(復(fù)本)當(dāng)人們分離到某一新基因時(shí),為了鑒定其生物學(xué)功能,常常使其失活,然后觀察它們對(duì)表型的影響。許多場合,由于第二個(gè)重復(fù)的功能基因可取代失活的基因而使突變型表型保持正常。這意味著,基因組中有冗余基因存在??醇一蚝苌僦貜?fù),它們之間必需保持劑量平衡,因此重復(fù)的拷貝很快被淘汰。與個(gè)體發(fā)育調(diào)控相關(guān)的基因表達(dá)為轉(zhuǎn)錄因子,具有多功能域的結(jié)構(gòu)。這類基因重復(fù)拷貝變異可使其獲得不同的表達(dá)控制模式,促使細(xì)胞的分化與多樣性的產(chǎn)生,并導(dǎo)致復(fù)雜形態(tài)的建成,具有許多冗余基因。
非編碼序列擴(kuò)張方式:滑序復(fù)制、轉(zhuǎn)座因子
模式生物海膽、果蠅、斑馬魚、線蟲、蟾蜍、小鼠、酵母、水稻、擬南芥等。模式生物基因組中G+C%含量高, 同時(shí)CpG 島的比例也高。進(jìn)化程度越高, G+C 含量和CpG 島的比例就比較低
如果基因之間不存在重疊順序,也無基因內(nèi)基因(gene-within-gene),那么ORF閱讀出現(xiàn)差錯(cuò)的可能只會(huì)發(fā)生在非編碼區(qū)。細(xì)菌基因組中缺少內(nèi)含子,非編碼序列僅占11%, 對(duì)閱讀框的排查干擾較少。細(xì)菌基因組的ORF閱讀相對(duì)比較簡單,錯(cuò)誤的機(jī)率較少。高等真核生物DNA的ORF閱讀比較復(fù)雜:基因間存在大量非編碼序列(人類占70%);絕大多數(shù)基因內(nèi)含有非編碼的內(nèi)含子。高等真核生物多數(shù)外顯子的長度少于100個(gè)密碼子
內(nèi)含子和外顯子序列上的差異:內(nèi)含子的堿基代換很少受自然選擇的壓力,保留了較多突變。由于堿基突變趨勢大多為C-T,故A/T的含量內(nèi)含子高于外顯子。由于終止密碼子為TAA\TAG\TGA,如果以內(nèi)含子作為編碼序列,3種讀碼框有很高比例的終止密碼子。
基因注釋程序編寫的依據(jù):1)信號(hào)指令,包括起始密碼子,終止密碼子,終止信號(hào),剪接受體位和供體位,多聚嘧啶序列,分支點(diǎn)保守序列2)內(nèi)容指令,密碼子偏好,內(nèi)含子和外顯子長短
基因功能的檢測:基因失活、基因過表達(dá)、RNAi干涉
雙鏈DNA的測序可從一端開始,亦可從兩端進(jìn)行,前者稱單向測序,后者稱雙向測序。
要獲得大于50 kb的DNA限制性片段必需采用稀有切點(diǎn)限制酶。
酵母人工染色體(YAC)1)著絲粒 在細(xì)胞分裂時(shí)負(fù)責(zé)染色體均等分配。2)端粒 位于染色體端部的特異DNA序列,保持人工染色體的穩(wěn)定性3)自主復(fù)制起始點(diǎn)( ARS)在細(xì)胞中啟動(dòng)染色體的復(fù)制
合格的STS要滿足2個(gè)條件:它應(yīng)是一段序列已知的片段,可據(jù)此設(shè)計(jì)PCR反應(yīng)來檢測不同的DNA片段中是否存在這一順序;STS必需在染色體上有獨(dú)一無二的位置。如果某一STS在基因組中多個(gè)位點(diǎn)出現(xiàn),那么由此得出的作圖數(shù)據(jù)將是含混不清的。
遺傳圖繪制主要依據(jù)由孟德爾描述的遺傳學(xué)原理,第一條定律為等位基因隨機(jī)分離,第二條定律為非等位基因自由組合,顯隱性規(guī)律/不完全顯性、共顯性、連鎖
衡量遺傳圖譜的水平 覆蓋程度 飽和程度
基因類型:transcribed, translatable gene (蛋白基因 ) ; transcribed but non-translatable gene ( RNA基因 )Non- transcribed, non-translatablegene ( promoter, operator ) rRNA基因,tRNA基因, scRNA基因, snRNA基因, snoRNA基因, microRNA基因
基因組(genome):生物所具有的攜帶遺傳信息的遺傳物質(zhì)總和。
基因組學(xué)(genomic):用于概括涉及基因作圖、測序和整個(gè)基因功能分析的遺傳學(xué)分支。
染色體組(chromosome set):不同真核生物核基因組均由一定數(shù)目的染色體組成,單倍體細(xì)胞所含有的全套染色體。
比較基因組學(xué)(comparative genomics):比較基因組學(xué)是基因組學(xué)與生物信息學(xué)的一個(gè)重要分支。通過模式生物基因組與人類基因組之間的比較與鑒別,為分離重要的候選基因,預(yù)測新的基因功能,研究生物進(jìn)化提供依據(jù)。(目標(biāo))
RNA世界:RNA不僅可以是信息的攜帶者,而且還可以是功能的執(zhí)行者,這使科學(xué)家們想到了原始的生物世界可能是一個(gè)只由RNA組成的“RNA世界”
外顯子洗牌:由不同基因中編碼不同結(jié)構(gòu)域的片段彼此連接形成的全新編碼順序稱為功能域或外顯子洗牌。
水平基因轉(zhuǎn)移:是指在差異生物個(gè)體之間,或單個(gè)細(xì)胞內(nèi)部細(xì)胞器之間所進(jìn)行的遺傳物質(zhì)的交流。
基因共線性(syteny/colinearity):不同基因組中,基因排列順序的一致性更能夠體現(xiàn)基因組的共同起源,這種基因排列順序的一致性稱為共線性。破壞基因組共線性的因素很多, 包括轉(zhuǎn)座、插入、染色體重排、區(qū)段加倍和缺失。染色體重排可造成大范圍基因位置的改變,但不打亂基因組某些區(qū)段的微觀共線性。
宏觀共線性系指遺傳連鎖圖上錨定標(biāo)記排列次序的一致性。
微觀共線性(microsynteny)則指物理圖上基因順序的一致排列。在多數(shù)情況下, 只有在進(jìn)化距離非常近的物種間才能保持很好的微觀共線性。
基因島(gene island):某些區(qū)段基因密度比全基因組的平均密度高很多,形成基因島。
直系同源集簇(clusters of orthologous groups,COG):由一個(gè)共同的祖先基因衍生的一組基因。包括:
不同基因組中執(zhí)行同一生物學(xué)功能的種間同源物 (ortholog);同一基因組中因基因加倍產(chǎn)生的種內(nèi)同源物 (paralog),或平行基因。
基因的協(xié)同丟失和協(xié)同進(jìn)化:執(zhí)行同一生物學(xué)功能的基因有相伴丟失的趨勢。與此同時(shí),為了補(bǔ)償丟失基因所執(zhí)行的功能,導(dǎo)致其它具有類似功能的基因群高度分化。 這就是基因的協(xié)同丟失和協(xié)同進(jìn)化。
開放讀框(open reading frames, ORFs)所有編碼蛋白質(zhì)的基因都含有開放讀框,它們由一系列指令氨基酸的密碼子組成。開放讀框有一個(gè)起點(diǎn),又稱起譯密碼,一般為ATG,還有一個(gè)終點(diǎn),又稱終止密碼,分別為TAA,TAG和TGA,三者含義相同。
同義密碼子(synonym):編碼同一氨基酸的不同密碼子稱為同義密碼子,其差別僅在密碼子的第三位堿基不同。
同源查詢(homology search)利用已存入數(shù)據(jù)庫中的基因順序與待查的基因組序列進(jìn)行比較,從中查找可與之匹配的堿基順序用于界定基因,這種方法稱為同源查詢。同源查詢的依據(jù):生物的不同種屬之間具有功能或結(jié)構(gòu)相似的直系基因成員,它們?cè)谄鹪瓷弦幻}相承,其間存在保守的順序組成。待注釋的DNA順序與已報(bào)道的其它基因序列對(duì)比,可發(fā)現(xiàn)其中的相似性: 1)存在某些完全相同的序列; 2)ORF讀框的排列類似,如等長的外顯子;3)ORF指令的氨基酸順序相同;4)模擬的多肽高級(jí)結(jié)構(gòu)相似
孤獨(dú)基因(orphan gene)在基因分類時(shí),缺少同源順序的ORF被稱為孤獨(dú)基因。
同源性(homology): 起源于同一祖先序列發(fā)生變異的序列。直向同源基因(orthologous ~)不同物種間的同源基因。
共生同源基因(paralogous ~)同一物種的同源基因。
相似性(similarity): 同源蛋白質(zhì)的氨基酸序列中一致性氨基酸和可取代氨基酸所占比例。可取代氨基酸:具有相同性質(zhì)(極性)的氨基酸,代換不影響蛋白質(zhì)的生物學(xué)功能
一致性(identity): 同源DNA(蛋白質(zhì))序列中同一堿基(氨基酸)位置上相同的堿基(氨基酸)成員
動(dòng)物園雜交(Zoo-blotting)如果某一物種的DNA順序與來自另一親緣種的DNA片段雜交產(chǎn)生陽性信號(hào),該區(qū)段可能含有一個(gè)或多個(gè)基因,這種方法稱為動(dòng)物園雜交。
結(jié)構(gòu)域(domain):指蛋白質(zhì)高級(jí)結(jié)構(gòu)中具有相對(duì)獨(dú)立的亞結(jié)構(gòu)區(qū),通常含有數(shù)個(gè)二級(jí)結(jié)構(gòu)基序,具有相對(duì)獨(dú)立的功能。
蛋白質(zhì)域結(jié)構(gòu)(domain architecture):又稱蛋白質(zhì)指紋,指蛋白質(zhì)成員中結(jié)構(gòu)域的組合形式及排列順序。
直系同源(orthologous)這是指不同物種之間的同源基因,它們來自物種分隔之前的同一祖先。
平行同源(paralogous)同一種生物內(nèi)部的同源基因,它們常常是多基因家族的不同成員, 其共同的祖先基因可能存在于物種形成之后,也可能出現(xiàn)于物種形成之前。
基因剔除(knock-out)將一段無關(guān)的DNA片段用來取代某一特定的基因,是最簡便的使基因失活的方法。主要原理是,在一段無關(guān)片段的兩側(cè)連接與代換基因兩側(cè)相同的順序,將這一構(gòu)建導(dǎo)入目的細(xì)胞,由于同源片段之間的重組,可使無關(guān)片段取代靶基因整合到染色體中。
覆蓋面:指隨機(jī)測序獲得的序列總長與單倍體基因組序列總長之比。
染色體步移(chormosome walking) 從第一個(gè)重組克隆插入片段的一端分離出一個(gè)片段作為探針從文庫中篩選第二個(gè)重組克隆,該克隆插入片段含有與探針重疊順序和染色體的其他順序。從第二個(gè)重組克隆的插入片段再分離出末端小片段篩選第三個(gè)重組克隆,如此重復(fù),得到一個(gè)相鄰的片段,等于在染色體上移了一步,故稱之為染色體步移
順序標(biāo)簽位點(diǎn)(Sequence tagged site, STS)是一小段長度在100到500 bp的DNA順序,每個(gè)基因組僅一份拷貝,很易分辨。順序標(biāo)簽位點(diǎn)作圖 通過PCR或分子雜交將小段DNA順序定位在基因組的DNA區(qū)段中。
表達(dá)順序標(biāo)簽(EST): 從cDNA克隆中找到的小段順序,cDNA代表了mRNA所在細(xì)胞中表達(dá)的基因。EST可轉(zhuǎn)變?yōu)镾TS,條件是這個(gè)EST來自單拷貝基因而非基因家族成員。
RFLP標(biāo)記 限制性片段長度多態(tài)性,是指用某一種限制性內(nèi)切酶來切割來自不同個(gè)體的DNA分子,內(nèi)切酶的識(shí)別序列有差異,即是由限制性酶切位點(diǎn)上堿基的插入、缺失、重排或點(diǎn)突變所引起的。這種差異反映在酶切片段的長度和數(shù)目上
SSLP(Simple sequence length polymorphisms) 簡單序列長度多態(tài)性,產(chǎn)于重復(fù)順序的可變排列,同一位點(diǎn)重復(fù)順序 的重復(fù)次數(shù)不同,表現(xiàn)出DNA序列的長度變化。SSLP有些場合又稱SSR。
SSR標(biāo)記:簡單序列重復(fù),微衛(wèi)星DNA標(biāo)記,它是指基因組中存在的由2-5個(gè)核苷酸為重復(fù)單位組成的長達(dá)幾十個(gè)核苷酸的串聯(lián)重復(fù)序列,廣泛分布于真核生物基因組中。
單核苷酸多態(tài)性(single nucleotide polymorphisms, SNP):2個(gè)同源DNA順序中同一堿基位置含有不同的核苷酸
作圖試劑(mapping reagent):覆蓋整條染色體或整個(gè)基因組的DNA片段群體,用于STS作圖。
厘鐳(centiRay,cR),其定義是DNA分子暴露在N拉德X射線劑量下兩個(gè)分子標(biāo)記之間發(fā)生1%斷裂的頻率。
C值(C value)是指一個(gè)單倍體基因組中DNA的總量,一個(gè)特定的種屬具有特征的C值。
C值悖理(C value paradox)生物的復(fù)雜性與基因組的大小并不完全成比例增加
為什么說RNA分子起主導(dǎo)地位?
RNA不僅可以是信息的攜帶者,而且還可以是功能的執(zhí)行者,這使科學(xué)家們想到了原始的生物世界可能是一個(gè)只由RNA組成的“RNA世界”。
首先,在人工模擬的原始地球的條件下,核糖核苷酸或RNA要比脫氧核糖核苷酸或DNA相對(duì)容易形成一些。其次、在現(xiàn)代的生物系統(tǒng)中,合成核苷酸過程是先從糖、氨基酸、二氧化碳等小分子物質(zhì)合成出RNA的前體;再由核糖核苷酸經(jīng)還原反應(yīng)去氧生成DNA的前體。因此,認(rèn)為RNA比DNA先出現(xiàn)是合理的。RNA能貯存遺傳信息,在現(xiàn)代生物中,仍然有少數(shù)病毒的基因組完全由RNA組成。從而,認(rèn)為最早的遺傳物質(zhì)是RNA也是合理的。
RNA一般以單鏈的形式存在,而單鏈的RNA可以折疊成多種多樣的結(jié)構(gòu),這為RNA可以具有多種功能提供了結(jié)構(gòu)上的基礎(chǔ)?,F(xiàn)代的蛋白質(zhì)酶也正是靠有多種多樣的立體結(jié)構(gòu)才可以擔(dān)當(dāng)催化生物體內(nèi)眾多的新陳代謝過程的重任。另一方面,在模擬原始地球的條件下很容易產(chǎn)生類蛋白,但不能通過模擬的途徑來形成具某種功能的簡單蛋白質(zhì)。因此,RNA是先于蛋白質(zhì)的生物催化劑。
單獨(dú)由RNA組成的原始生命的進(jìn)化以不完全精確的RNA自復(fù)制為基礎(chǔ)。從大量的RNA變異體中,通過不斷的選擇,可以使RNA的某種催化功能得到大大的強(qiáng)化,甚至產(chǎn)生出具有新催化功能的RNA分子。因此,只由RNA構(gòu)成的生命系統(tǒng)是可以進(jìn)化的。
在RNA世界中,RNA本身能自我復(fù)制,并且能進(jìn)行一些十分簡單的生命活動(dòng):RNA分子內(nèi)或分子間的重組(RNA自剪接)、催化一些早期的生物化學(xué)反應(yīng)、RNA還有可能促進(jìn)DNA和蛋白質(zhì)的產(chǎn)生
RNA如何把其長期貯存遺傳信息的功能移交給DNA,把它的大部分催化功能移交給蛋白質(zhì)?
為什么會(huì)出現(xiàn)RNA向蛋白質(zhì)的轉(zhuǎn)變?
一方面,蛋白質(zhì)的多樣性遠(yuǎn)遠(yuǎn)超過RNA,因?yàn)槎嚯逆溨杏?0種氨基酸,RNA只有4種核苷酸,前者的排列組合的方式比后者大得多,可以催化范圍更廣的反應(yīng); 另一方面,蛋白質(zhì)的催化更為成功。因?yàn)槎嚯逆溣懈蟮目伤苄裕鳵NA分子中堿基配對(duì)區(qū)段則有較強(qiáng)物理剛性。第三,RNA分子的長度有限,限制了它們的催化反應(yīng)活性。
RNA原始基因組仍處在十字路口
一方面,RNA扮演的主要角色是催化各種生化反應(yīng),這一點(diǎn)它們做得不錯(cuò)。另一方面,RNA行使編碼功能,但顯得不太適合。由于受2‘-OH基團(tuán)的影響,RNA的磷酸脂鍵穩(wěn)定性較差,無法勝任建立穩(wěn)定遺傳系統(tǒng)的重任。RNA的編碼功能轉(zhuǎn)移到更為穩(wěn)定的DNA是一種必然的趨勢。
RNA世界向DNA世界的轉(zhuǎn)變
尿苷酸由其甲基化的衍生物胸腺嘧啶取代,使DNA順序具有更高的穩(wěn)定性;DNA損傷修復(fù)系統(tǒng)的誕生進(jìn)一步奠定了雙鏈DNA作為編碼分子的地位,使遺傳信息更忠實(shí)地傳遞。
基因組的起源
最初,DNA基因組由許多分散的分子組成,每一個(gè)指令單個(gè)蛋白質(zhì),相當(dāng)于一個(gè)基因。這些基因彼此連接成染色體,它們可能在編碼的RNA轉(zhuǎn)變?yōu)镈NA之前或之后出現(xiàn)。 由于組成了含許多基因的染色體,在細(xì)胞分裂時(shí)基因的分配要比分散的類型更加有效、精確而方便,在競爭中占有優(yōu)勢。
概括:地球上最早出現(xiàn)的生物大分子為RNA,RNA同時(shí)具有催化與編碼兩種功能。RNA可以催化肽鍵形成并合成蛋白質(zhì),此后RNA與蛋白質(zhì)聯(lián)手以RNA為模板合成DNA。RNA的編碼功能由DNA取代,催化功能轉(zhuǎn)移到蛋白質(zhì),RNA自身則成為傳達(dá)遺傳信息的中介分子.
生物為什么能忍受如此之多的無用DNA?
非編碼DNA可能具有某種尚未識(shí)別的功能,如果沒有這些DNA細(xì)胞將不能存活。 基因的調(diào)控順序雖然沒有編碼蛋白的功能,但仍有重要的控制基因表達(dá)的作用。多數(shù)轉(zhuǎn)座因子特別是逆轉(zhuǎn)錄轉(zhuǎn)座因子含有控制基因表達(dá)的順序,當(dāng)它們插入到基因附近時(shí)有可能成為增強(qiáng)子的組成元件,為基因表達(dá)多樣性提供分子基礎(chǔ)。
基因功能比基因數(shù)量更重要
并非每種生物的基因數(shù)量與其基因組尺寸成正比??傮w上說,高等動(dòng)物的基因組大, 基因排列得也稀疏, 也就意味著不必要的重復(fù)序列和基因內(nèi)區(qū)多。大的基因組并不意味著更多的基因, 甚至高等動(dòng)物并不一定比低等動(dòng)物的基因多。 例如果蠅比低等的線蟲少5,000個(gè)基因。這就是說, 基因功能比基因數(shù)量更重要。 如果去掉與原核細(xì)胞共有的基因, 就可以發(fā)現(xiàn)真核細(xì)胞獨(dú)有的決定其特異性的基因
搜索基因的方式
根據(jù)已知的順序人工判讀或計(jì)算機(jī)分析尋找與基因有關(guān)的序列
原理:如果一段DNA順序中含有編碼基因,那么這段順序的堿基序列就不會(huì)是隨機(jī)排列的,一定存在某些可以辨別的特征。
方法:開放讀框、同源查詢、EST篩選全長cDNA
根據(jù)實(shí)驗(yàn)分析確認(rèn)基因
原理:任何基因都可轉(zhuǎn)錄為RNA拷貝,這是實(shí)驗(yàn)確證基因的依據(jù)。真核生物中許多編碼蛋白質(zhì)的基因其轉(zhuǎn)錄的初級(jí)產(chǎn)物都有內(nèi)含子,剪切加工后成為mRNA。根據(jù)mRNA的順序可以找到外顯子的位置以及整個(gè)基因的組成
ESTs與基因預(yù)測
由于EST來源于cDNA,因此每一條EST均代表了的一個(gè)基因的部分序列。
使用合適的比對(duì)參數(shù),大于90%的已經(jīng)注釋的基因都能在EST庫中檢測到。
ESTs可作為其它基因預(yù)測算法的補(bǔ)充。
ESTs可以發(fā)現(xiàn)基因不同的可變剪接,為蛋白質(zhì)組學(xué)研究提供參考
ESTs具有特定的時(shí)空表達(dá),依據(jù)來源可判斷表達(dá)場所,有利于功能研究
實(shí)驗(yàn)分析確認(rèn)基因(論述)
任何基因都可轉(zhuǎn)錄為RNA拷貝,這是實(shí)驗(yàn)確證基因的依據(jù)。真核生物中許多編碼蛋白質(zhì)的基因其轉(zhuǎn)錄的初級(jí)產(chǎn)物都有內(nèi)含子,剪切加工后成為mRNA。 根據(jù)mRNA的順序可以找到外顯子的位置以及整個(gè)基因的組成。
分子雜交可確定DNA片段是否含表達(dá)順序
在進(jìn)行分子雜交實(shí)驗(yàn)時(shí),從樣品中純化的RNA經(jīng)電泳分離,然后轉(zhuǎn)移到雜交膜上。將待測DNA樣品標(biāo)記后與RNA雜交(Northern blotting), 如果RNA中含有DNA的轉(zhuǎn)錄產(chǎn)物,會(huì)給出明顯的信號(hào)。
對(duì)那些Northern雜交不易檢測到的基因還可用另一種途徑驗(yàn)證。 一些親緣關(guān)系相近的物種,其基因的編碼區(qū)相似性較高,而非編碼區(qū)的同源性很低。 如果某一物種的DNA順序與來自另一親緣種的DNA片段雜交產(chǎn)生陽性信號(hào),該區(qū)段可能含有一個(gè)或多個(gè)基因,這種方法稱為動(dòng)物園雜交。
DNA順序中基因位置的確定
Northern分析和動(dòng)物園雜交可判斷某一DNA區(qū)段是否含有基因,但不能給出基因在DNA順序中的確切位置。
EST和cDNA的測序可以解決這一問題。cDNA是mRNA 的反轉(zhuǎn)錄拷貝,與基因的編碼區(qū)對(duì)應(yīng),并含有非轉(zhuǎn)譯的5’引導(dǎo)順序以及3’ 結(jié)尾順序。將cDNA 與基因組的DNA比較,不僅可以發(fā)現(xiàn)漏注的基因,還可確定基因所在的區(qū)域并找到外顯子和內(nèi)含子的邊界
化學(xué)降解法原理
在選定的核苷酸堿基中引入化學(xué)基團(tuán)使DNA分子在被修飾的核苷酸位置降解。
4種核苷酸A,C,G和T均可分別修飾,分別降解,形成只差一個(gè)核苷酸的降解DNA群體。
起始DNA樣品為雙鏈DNA,測序前要將其轉(zhuǎn)變?yōu)閱捂湣?/p>
每個(gè)單鏈的同一方向末端都結(jié)合了放射性同位素標(biāo)記,經(jīng)電泳分林后可顯示DNA條帶的位置。
每組反應(yīng)只針對(duì)特定堿基,共有四組反應(yīng),可分別顯示G(硫酸二甲酯),A+G(哌啶甲酸),C(肼)和C+T(1.5M NaCl肼)的終止位置。
鏈終止法原理
制備相同的單鏈模板DNA,將其與一小段稱為引物的寡聚核苷酸退火,形成雙鏈后起始新鏈合成。反應(yīng)由DNA多聚酶催化,底物是4種脫氧核苷酸。在鏈終止反應(yīng)中加入了少量的雙脫氧核苷酸( dd NTP ),由于DNA多聚酶不能區(qū)分dNTPs和ddNTPs,ddNTP可摻入新生的單鏈中。ddNTP的核糖基3-碳原子上連接的是氫原子而不是羥基,因而不能與下一個(gè)核苷酸聚合延伸,合成的新鏈在此終止。
鏈終止法對(duì)DNA多聚酶的要求
1)高酶活性 指多聚酶在終止合成前多聚核苷酸分子可延伸的有效長度。如果測序所用的多聚酶與模板結(jié)合能力強(qiáng),在終止核苷酸摻入新鏈之前不會(huì)脫離模板,即不會(huì)提前終止反應(yīng)。
2)無5’—3’外切核酸酶活性 大多數(shù)DNA多聚酶都有外切核酸酶活性,5’?3’核酸酶活性可將新合成DNA鏈的5’末端除去核苷酸從而改變鏈的長度,給順序的閱讀造成困難與誤差。
3)無3'—5'外切核酸酶活性 可使DNA多聚酶校正 3 ' 端錯(cuò)配的核苷酸。
鏈終止法測序要求單鏈作為模板,制備單鏈DNA的方法有 :
1)質(zhì)粒載體克隆單鏈DNA
2)以M13載體克隆單鏈DNA
3)以噬粒(phagemid)克隆DNA
4)PCR產(chǎn)生單鏈DNA
噬粒(phagemid)克隆DNA
一種改造過的質(zhì)粒克隆載體,含有2個(gè)復(fù)制起始點(diǎn):1、質(zhì)粒自身的復(fù)制起始點(diǎn)2、來自M13或其他單鏈DNA噬菌體基因組的復(fù)制起始點(diǎn)。
熒光標(biāo)記測序的優(yōu)點(diǎn)
1)免除了同位素標(biāo)記必需同時(shí)進(jìn)行四組反應(yīng)的麻煩,簡化為由一個(gè)泳道同時(shí)判讀四種堿基;
2)自動(dòng)化熒光測序系統(tǒng)極大地提高了測序的效率,為基因組大規(guī)模測序提供了可能。
3)避免肉眼分辨減少了差錯(cuò),閱讀信號(hào)與計(jì)算機(jī)相連后可直接對(duì)數(shù)據(jù)進(jìn)行電腦處理,加快了基因組測序的進(jìn)程。
序列間隙
概念:測序時(shí)遺漏的序列,本身仍保留在尚未挑選到的克隆中。
填補(bǔ)方法:測序時(shí)遺漏的順序,通過相鄰已知順序作為探針篩選已有的基因組文庫,通過挑選陽性克隆解決遺漏的間隙。---PCR擴(kuò)增
物理間隙
概念:指構(gòu)建文庫時(shí)被丟失的DNA序列,在克隆群體中永久的消失。
填補(bǔ)方法:利用其它載體或宿主菌重新構(gòu)建一個(gè)基因組文庫。然后以間隙兩側(cè)的順序?yàn)樘结槒男碌奈膸熘泻Y選陽性克??;或制成相應(yīng)的PCR引物兩兩配組從新的文庫中篩選陽性克隆。
物理間隙產(chǎn)生的原因: ⑴ 由于特殊的堿基組成,如高度重復(fù)序列,缺少合適的酶切位點(diǎn),難以獲得大分子克?、?高度重復(fù)序列的克隆載體很不穩(wěn)定,在擴(kuò)增中容易丟失⑶ 某些基因的表達(dá)產(chǎn)物對(duì)宿主菌具有毒性,可將宿主菌殺死,隨之克隆DNA本身也消失
隨機(jī)測序與序列組裝
直接鳥槍法的順序組裝是直接從已測序的小片段中尋找彼此重疊的測序克隆,然后依次向兩側(cè)鄰接的序列延伸。
不需預(yù)先了解任何基因組的情況,即使缺少遺傳圖或物理圖也可完成整個(gè)基因組順序的組裝。流感嗜血桿菌、果蠅。
定位克隆
基因已經(jīng)定位在染色體的連鎖圖上,但并不知道它們的具體產(chǎn)物,也不知道它們的表達(dá)場所。
先找到與靶基因連鎖的分子標(biāo)記,然后構(gòu)建基因組文庫。通過與靶基因連鎖的分子標(biāo)記篩選陽性克?。辉俑鶕?jù)克隆插入子兩端的DNA順序查找與之連接的克隆建立重疊群(contig),直到覆蓋整個(gè)靶基因位點(diǎn)。
限定測序和序列組裝
限定測序和序列組裝與定位克隆類似,但前者的目標(biāo)不在分離基因,而是將一段染色體區(qū)段的DNA順序進(jìn)行組裝。 使用這一方法,先要建立基因組的物理圖;再從物理圖中選出完全覆蓋了基因組的彼此最少重疊的克隆,對(duì)這些克隆進(jìn)行測序后,便完成了整個(gè)基因組的測序。已經(jīng)繪制了遺傳圖與物理圖的微生物、線蟲、擬南芥、水稻、人類基因組測序采用這一方法。
遺傳圖譜(genetic map):是以遺傳距離表示基因組內(nèi)基因座位相對(duì)位置的圖譜。
遺傳作圖(Genetic mapping)采用遺傳學(xué)分析方法將基因或其它DNA順序標(biāo)定在染色體上構(gòu)建連鎖圖。
遺傳圖譜有什么作用?
人類基因組有30億個(gè)堿基對(duì),含有大量重復(fù)序列。要在這樣大的序列中確定某一基因的位置,如同大海中撈針。
染色體標(biāo)志:長臂、短臂、區(qū)、帶、亞帶等。但是每一條染色體亞帶通常包含幾百萬個(gè)堿基。
因此基因定位需要更細(xì)致的劃分和標(biāo)記。就好像對(duì)一個(gè)街區(qū)中的每一條小巷,甚至每一個(gè)院落都給予編號(hào)一樣。
遺傳作圖標(biāo)記:形態(tài)標(biāo)記(morphological marker)細(xì)胞學(xué)標(biāo)記(cytological marker)生化標(biāo)記(biochemical marker)免疫標(biāo)記(Immune marker)分子標(biāo)記(molecular marker)
分子(DNA)標(biāo)記優(yōu)點(diǎn):中性、共顯性、多態(tài)性高、數(shù)量多、分布均勻、不受環(huán)境影響;多基因影響的同一性狀遺傳分析可以將一個(gè)數(shù)量性狀分解為多個(gè)QTL(Quantitative traits loci),通過分析數(shù)量性狀的基因位點(diǎn),估算每個(gè)QTL的遺傳效應(yīng)及貢獻(xiàn)率。
三代DNA標(biāo)記
(1)是以Southern雜交技術(shù)為核心的分子標(biāo)記,(如RFLP),這類分子標(biāo)記被稱為第代分子標(biāo)記。
(2)是以PCR技術(shù)為核心的分子標(biāo)記,(如STS、RAPD、AFLP、SSR)等,這類分子標(biāo)記被稱為第二代分子標(biāo)記;
(3)單核苷酸多態(tài)性(SNP)標(biāo)記被稱為第三代分子標(biāo)記 。它也是以以PCR技術(shù)為基礎(chǔ)的分子標(biāo)記技術(shù)。
物理圖譜
物理圖譜(physical map)指表示DNA序列上DNA標(biāo)記之間實(shí)際距離的圖。
物理作圖(physical mapping)采用分子生物學(xué)技術(shù)直接將DNA分子標(biāo)記、基因或克隆標(biāo)定在基因組的實(shí)際位置。輻射雜種、限制性片段作圖、熒光原位雜交(FISH)、序列標(biāo)簽位點(diǎn)(STS)、克隆作圖等。
物理圖的重要意義
利用物理圖可獲得預(yù)期有用的基因;物理圖為測定全基因組DNA全序列提供了必要的“骨架”;基因組DNA全序列的測定,就能使人們最終可以在分子(核苷酸)認(rèn)知水平上解開生命的遺傳奧秘
為何要繪制物理圖?遺傳分析繪制的基因組圖為何不能指導(dǎo)基因組計(jì)劃的測序?
遺傳圖的分辨率有限:人類及大多數(shù)高等真核生物由于不可能獲得大量的子代,只有少數(shù)的減數(shù)分裂事件可供研究,連鎖分析的分辨力受到很大限制。人類遺傳圖其標(biāo)記密度平均為599 kb,離每100 kb一個(gè)標(biāo)記的要求仍差距甚遠(yuǎn),后者是進(jìn)入基因組全面測序的前提。這種高密度基因組圖僅僅采用遺傳作圖技術(shù)是無法完成的,必須借助于其他非遺傳分析的方法
遺傳圖的精確性較低(覆蓋面較低):連鎖分析中重組熱點(diǎn)的存在使染色體某一區(qū)段的交換頻率高于其他區(qū)段。特別是倒位區(qū)段,由于受到交換限制,無法繪制精細(xì)遺傳圖。
遺傳圖分子標(biāo)記的排列有時(shí)會(huì)出現(xiàn)差錯(cuò):遺傳作圖的依據(jù)主要是子代個(gè)體的基因型重組及其分離比,由于環(huán)境和抽樣誤差,可能存在非隨機(jī)的群體組成,這種條件下,用不同的雜交組合會(huì)出現(xiàn)不同結(jié)果,相同分子標(biāo)記在聯(lián)鎖圖位置不同。
遺傳圖與物理圖并不完全一致:
1.基因座位之間的相對(duì)距離不同。遺傳作圖受重組頻率的影響,熱點(diǎn)重組區(qū)比其它區(qū)段圖距更長
2.相對(duì)位置可能有點(diǎn)偏差,例如一對(duì)基因座位chal和glk1的相對(duì)位置在遺傳圖與物理圖中正好相反
限制性作圖的基本原理
最簡單的方法是比較不同限制酶產(chǎn)生的DNA片段的大?。?/p>
首先用一種限制酶處理樣品,電泳分離可見大小確定的DNA片段。然后用第二種限制酶處理獲得第二組片段。最后用2種酶混合處理,獲得第三組片段。收集所有上述資料進(jìn)行對(duì)比組裝,對(duì)2種酶切位點(diǎn)交替出現(xiàn)的區(qū)段,用加減法確定酶切位點(diǎn)的相對(duì)位置。
克隆載體應(yīng)具備的條件
(1)有多種限制性內(nèi)切酶切點(diǎn),每種切口最好只有1個(gè)(2)有選擇標(biāo)記,例如抗藥性標(biāo)記,藍(lán)白斑試驗(yàn);
(3)有一定載體容量;(4)有相當(dāng)?shù)目截悢?shù),每個(gè)宿主菌可能容納最多數(shù)。
YAC的弊端:
(1)
在 YAC 載體的插入片段會(huì)出現(xiàn)缺失和基因重排(2)容易形成嵌合體 (3)YAC 染色體與宿主細(xì)胞的染色體大小相近,影響了 YAC 載體的廣泛應(yīng)用。
突出優(yōu)點(diǎn):酵母細(xì)胞比大腸桿菌對(duì)不穩(wěn)定的、重復(fù)的和極端的 DNA 有更強(qiáng)的容忍性