基因是什么?它都有哪些類型?

基因(gene)是DNA表達(dá)遺傳信息的功能單位,以一段或一組特定的核苷酸序列為載體,通過表達(dá)功能產(chǎn)物RNA和蛋白質(zhì),控制著各種生命活動,從而控制著生物的遺傳性狀。一個(gè)基因除了含有決定功能產(chǎn)物一級結(jié)構(gòu)的編碼序列外,還含有表達(dá)該編碼序列所需的調(diào)控元件等非編碼序列。

?
人類對基因的認(rèn)識經(jīng)歷了一個(gè)漫長過程,在20世紀(jì)50年代之前,基本局限在邏輯概念階段,對其化學(xué)本質(zhì)一無所知。
1944年,Avery等通過肺炎鏈球菌轉(zhuǎn)化實(shí)驗(yàn)證明DNA是細(xì)菌的遺傳物質(zhì);1952年,Hershey和Chase通過大腸桿菌T2噬菌體感染實(shí)驗(yàn)進(jìn)一步證明DNA也是DNA病毒的遺傳物質(zhì)。遺傳物質(zhì)有兩個(gè)特點(diǎn):一是能自我復(fù)制,從而維持生物體的基本性狀;二是會發(fā)生突變,從而賦予生物體新的性狀,使生命得以進(jìn)化。

?
1.結(jié)構(gòu)基因和調(diào)控基因這兩類基因的產(chǎn)物都可以是RNA和蛋白質(zhì),但有不同的功能:結(jié)構(gòu)基因(structural gene)產(chǎn)物的功能是參與代謝活動或維持組織結(jié)構(gòu)。調(diào)控基因(regulatory gene)產(chǎn)物的功能是調(diào)控其他基因的表達(dá)。
2.斷裂基因在20世紀(jì)70年代之前,人們一直以為基因的編碼序列是連續(xù)的。1977年,Roberts和Sharp(1993年諾貝爾生理學(xué)或醫(yī)學(xué)獎獲得者)發(fā)現(xiàn)真核生物有些基因(如胰島素基因)的編碼序列是不連續(xù)的,被一些稱為內(nèi)含子的非編碼序列分割成稱為外顯子的片段,因此這些基因稱為斷裂基因(split gene)。斷裂基因在分子生物學(xué)的基礎(chǔ)研究和腫瘤等疾病的醫(yī)學(xué)研究中具有重要意義。

?
不同真核生物基因組中斷裂基因所占的比例不同:釀酒酵母的基因僅有3.5%~4%是斷裂基因;果蠅的基因有83%是斷裂基因;哺乳動物的基因有94%是斷裂基因(組蛋白、α干擾素、β干擾素基因不是斷裂基因)。葉綠體、植物和其他低等真核生物線粒體基因組存在斷裂基因。原核生物和噬菌體基因組中也存在個(gè)別斷裂基因。
3.重疊基因如果兩個(gè)或兩個(gè)以上基因的DNA序列存在重疊,它們就是重疊基因(overlapping gene)。重疊基因之間有多種重疊方式,以ΦX174噬菌體為例:
(1)大基因序列完全包含小基因,例如A基因內(nèi)包含B基因,D基因內(nèi)包含E基因,被包含的基因稱為基因內(nèi)基因、嵌套基因、套疊基因(nested gene)。

?
(2)兩個(gè)基因序列首尾重疊,有的甚至只重疊一個(gè)堿基,例如D基因終止密碼子的第三堿基是J基因起始密碼子的第一堿基,這一現(xiàn)象稱為讀框重疊(reading-frame overlapping)。
(3)多個(gè)基因存在重疊序列,例如A基因、A*基因、B基因、K基因。
(4)反向重疊。
此外,重疊序列中不僅有編碼序列也有調(diào)控元件,說明基因重疊不只是為了利用有限的核苷酸序列攜帶更多的編碼信息,還可能涉及基因表達(dá)調(diào)控。

?
重疊基因的DNA序列雖然存在重疊,但是其轉(zhuǎn)錄產(chǎn)物mRNA的閱讀框不同,因而翻譯合成的蛋白質(zhì)并無同源序列。
重疊基因存在于病毒、原核生物、真核生物(包括人類)及線粒體DNA中。
4.轉(zhuǎn)座子1944年,McClintock(1983年諾貝爾生理學(xué)或醫(yī)學(xué)獎獲得者)在研究玉米基因時(shí)發(fā)現(xiàn),有些DNA片段可以自主復(fù)制和在染色體DNA中移動位置?,F(xiàn)已闡明:基因組DNA中存在一些非游離的、能自主復(fù)制或自我剪切并以相同或不同拷貝在基因組中或基因組間移動位置的功能性片段,稱為轉(zhuǎn)座子(transposon)、轉(zhuǎn)座元件(transposable element)、轉(zhuǎn)座因子。

?
5.順反子1955年,Benzer從遺傳學(xué)角度提出了基因的順反子概念:順反子(cistron)是基因的基本功能單位,基因組序列中不同突變之間沒有互補(bǔ)關(guān)系的功能區(qū),也是基因表達(dá)的最小單位。一個(gè)順反子編碼一條肽鏈。真核生物的基因都是單順反子,其轉(zhuǎn)錄產(chǎn)物稱為單順反子mRNA;原核生物的基因大多數(shù)是多順反子,其轉(zhuǎn)錄產(chǎn)物稱為多順反子mRNA。國際純粹與應(yīng)用化學(xué)聯(lián)合會(IUPAC)推薦基因與順反子兩個(gè)術(shù)語通用。

?
6.基因家族同一物種中,結(jié)構(gòu)與功能相似、進(jìn)化起源上密切相關(guān)的一組基因,被定義為一個(gè)基因家族(gene family),又稱多基因家族(multigene family)。同一個(gè)基因家族的基因具有同源性,即它們來自同一個(gè)祖先基因,有相似的結(jié)構(gòu)和功能。
人類基因組中有1.5萬個(gè)基因家族,例如rRNA基因及以下蛋白基因組成各自的基因家族:組蛋白、珠蛋白(分為α珠蛋白、β珠蛋白亞家族)、生長激素、肌動蛋白、絲氨酸蛋白酶、主要組織相容性抗原?;蚣易逯型耆嗤幕虺蓡T稱為重復(fù)基因、多拷貝基因。重復(fù)基因主要存在于真核生物基因組中,如人類rRNA基因有數(shù)百個(gè)拷貝。原核生物除了rRNA基因有1~7個(gè)拷貝(大腸桿菌有7個(gè))之外,蛋白基因大多數(shù)只有一個(gè)拷貝。

?
(1)超基因家族(supergene family)又稱基因超家族(gene superfamily)是DNA序列相似、但功能不一定相關(guān)的若干個(gè)單拷貝基因或若干個(gè)基因家族的總稱。例如以下蛋白基因組成各自的超基因家族:免疫球蛋白、細(xì)胞因子、細(xì)胞因子受體、G蛋白、G蛋白偶聯(lián)受體。珠蛋白、肌紅蛋白、豆血紅蛋白組成珠蛋白超家族。
(2)假基因(ψ)基因組中存在的一種DNA序列,與正?;蚍浅O嗨疲槐磉_(dá)有功能產(chǎn)物。假基因的祖先基因是有功能的,但由于發(fā)生突變導(dǎo)致序列異常,不能轉(zhuǎn)錄,或者轉(zhuǎn)錄產(chǎn)物不能翻譯,所以假基因功能缺失。假基因在哺乳動物基因組中普遍存在,可以視為進(jìn)化的遺跡。例如,小鼠有400多個(gè)3-磷酸甘油醛脫氫酶基因拷貝,但其中只有一個(gè)功能基因,其余都是假基因。
?
(3)基因簇(gene cluster)多數(shù)基因家族成員分布在染色體的不同部位,甚至分布在不同染色體上。有些基因家族的成員在染色體上緊密連鎖甚至串聯(lián)排列,它們稱為基因簇,例如人6號染色體上的主要組織相容性復(fù)合體(MHC)、16號染色體上的α珠蛋白基因簇(約30kb)、11號染色體上的β珠蛋白基因簇(約60kb)?;虼乜捎糜谘芯课锓N的進(jìn)化關(guān)系,甚至鑒定人類血統(tǒng)。

?