【學習筆記】遺傳變異的基本類型

遺傳變異(genetic variation)是指在種群中個體之間的DNA序列的差異。遺傳變異可以發(fā)生在生殖細胞(germ cells)中,也可以發(fā)生在體細胞中(somatic cells),但只有發(fā)生在生殖細胞中的變異可以遺傳給子代。
遺傳變異的主要來源是突變(mutations)和重組(recombination)。
突變是遺傳變異的原始來源。DNA復制的時候常常會發(fā)生錯誤,在一般的情況下,這些錯誤會被DNA修復酶(DNA repair enzymes)所修復。當這些錯誤沒有被修復而在DNA中保存下來時,這種錯誤就被稱為新的突變(de novo mutation)。

突變實際上是一種中性的概念,大部分突變對機體不會有任何影響。
重組是遺傳變異中另一種重要的來源。我們每個人都擁有來自父親和母親的遺傳資料。重組是染色體的物理交換,多發(fā)生于二倍體生物的減數分裂期。重組可以產生與親本不同的染色體。


一、遺傳變異的類型
在學習遺傳變異的類型之前,我們需要先區(qū)別幾個概念
突變mutation和多態(tài)性polymorphisms和變異variant
一般而言,在全球所有人群中小于1%的變異被稱為突變,大于1%的稱為多態(tài)性,這實際上是一種人為的界定。變異則是二者的統(tǒng)稱。
(一) 單堿基對替換(single base-pair substitution),單核苷酸多態(tài)性(single nucleotide polymorphisms,SNPs)和單核苷酸位點變異(single nucleotide variant,SNV)
不論是SNP或是SNV都有以下兩種形式:
1.????? 轉換(transition)是指嘧啶與嘧啶,或嘌呤與嘌呤之間的替換
2.????? 顛換(transversions)是指嘧啶與嘌呤之間的替換
個人認為,SNP與SNV實際上是同一種遺傳變異形式在不同的對象人群中的名稱。
SNP,即單核苷酸/堿基多態(tài)性是一個群體概念,是指某種基因的差異在整個群體中的占比大于1%以上時,則將其稱為單核苷酸多態(tài)性。這種變異大多是發(fā)生在生殖細胞上的,人基因組上平均約每1000個核苷酸即可能出現1個單核苷酸多態(tài)性的變化,其中有些單核苷酸多態(tài)性可能與疾病有關,但可能大多數與疾病無關。
SNV,即單核苷酸位點變異。例如在研究癌癥基因組變異時,相對于正常組織,癌癥中特異的單核苷酸變異是一種體細胞突變(somatic mutation),稱做SNV。實際上,我們常說的點突變,其概念在狹義上就等同于單核苷酸位點變異。
SNV可能會導致以下幾種改變:

1.? ? ? Stop gain(nonsense):即無義突變,突變后變成一個終止密碼子,使得多肽鏈的合成提前終止,肽鏈長度變短而成為無活性的截短蛋白。
2.? ? ? Stop loss:終止密碼子缺失,導致本應該終止的肽鏈繼續(xù)延伸。
3.????? Non-synonymous(missense):即錯義突變,改變翻譯成的氨基酸類型。
4.????? Synonymous(silent):即同義突變,由于密碼子存在簡并性,雖然堿基發(fā)生改變,但是不改變翻譯出來的氨基酸類型。
5.????? Affect splicing:影響剪切。

(二)插入(insertion)與缺失(deletion),也被統(tǒng)稱為“indel”
插入或刪除單個DNA序列片段,長度范圍從一個到數百個堿基對不等。

當Indel發(fā)生在基因間區(qū)或內含子區(qū)時,對基因表型沒有影響。
當發(fā)生在編碼區(qū)(coding regions)時,又分為以下兩種方式:
1.????? 移碼突變(frameshifting)
由非三的倍數個核苷酸的插入或刪除造成,因基因表達時密碼子是由三個核苷酸組成,此類插入或刪除會改變閱讀框架,進而使mRNA在此突變以后翻譯出完全不同的蛋白質??蛞仆蛔冊陂_放閱讀框越上游的區(qū)域發(fā)生,對蛋白質的影響越大,且因框移突變可能會改變終止密碼子出現的位置,也會改變翻譯出蛋白質的大小,一般會使其完全失去功能。

2.????? 非移碼突變(non-frameshifting)
非移碼插入/缺失突變是指可被三整除的核苷酸的插入或缺失,mRNA的讀取框不會被破壞。由此產生的突變蛋白序列與野生型不同,一般為增加或刪除一個或多個氨基酸殘基。

?(三)結構變異(structural variation)
主要是指大段的DNA序列發(fā)生變異的情況,一般是指大于1kb的序列(隨著測序技術的發(fā)展,現在定義已經被延伸到大于50bp的序列)。包括大段的缺失、插入、重復、拷貝數變異(copy number variation)和染色體重排(chromosomal rearrangement)。

二、 染色體數量異常
最常見的例子就是21三體綜合征,即唐氏綜合征。這里不做過多贅述。

【參考文獻】
Alkan C, Coe BP, Eichler EE. Genome structural variation discovery and genotyping. Nat Rev Genet. 2011 May;12(5):363-76. doi: 10.1038/nrg2958. Epub 2011 Mar 1. PMID: 21358748; PMCID: PMC4108431.
Pagel KA, Antaki D, Lian A, Mort M, Cooper DN, Sebat J, Iakoucheva LM, Mooney SD, Radivojac P. Pathogenicity and functional impact of non-frameshifting insertion/deletion variation in the human genome. PLoS Comput Biol. 2019 Jun 14;15(6):e1007112. doi: 10.1371/journal.pcbi.1007112. PMID: 31199787; PMCID: PMC6594643.
北京大學,生物信息學導論網絡課,2013.