易基因: DNA甲基化差異水平分析中的DMC、DMR、DMG鑒定 | 干貨分享
大家好,這里是專注表觀組學(xué)十余年,領(lǐng)跑多組學(xué)科研服務(wù)的易基因。
DNA甲基化(DNA methylation)為DNA化學(xué)修飾的一種形式,能夠在不改變DNA序列的前提下,改變遺傳表現(xiàn)。所謂DNA甲基化是指在DNA甲基化轉(zhuǎn)移酶的作用下,在基因組CpG二核苷酸的胞嘧啶5號碳位共價鍵結(jié)合一個甲基基團(tuán)。大量研究表明,DNA甲基化能引起染色質(zhì)結(jié)構(gòu)、DNA構(gòu)象、DNA穩(wěn)定性及DNA與蛋白質(zhì)相互作用方式的改變,從而調(diào)控基因表達(dá)。
DNA甲基化一般遵循三個步驟進(jìn)行數(shù)據(jù)挖掘。
首先,進(jìn)行整體全基因組甲基化變化的分析,包括平均甲基化水平變化、甲基化水平分布變化、降維分析、聚類分析、相關(guān)性分析等。
其次,進(jìn)行甲基化差異水平分析,篩選具體差異基因,包括DMC/DMR/DMG鑒定、DMC/DMR在基因組元件上的分布、DMC/DMR的TF結(jié)合分析、時序甲基化數(shù)據(jù)的分析策略、DMG的功能分析等。
最后,將甲基化組學(xué)&轉(zhuǎn)錄組學(xué)關(guān)聯(lián)分析,包括Meta genes整體關(guān)聯(lián)、DMG-DEG對應(yīng)關(guān)聯(lián)、網(wǎng)絡(luò)關(guān)聯(lián)等。
那么甲基化差異水平分析,篩選具體差異基因中的DMC、DMR、DMG怎么做呢?
一、差異甲基化位點/區(qū)域分析DMC/DMR分析
(1)DMC/DMR鑒定
差異甲基化位點:DMC
差異甲基化區(qū)域:DMR
(甲基化位點一般是與附近的位點一起起作用的)
鑒定實驗組與對照組甲基化圖譜的具體差異。
如果實驗設(shè)計包括多個時間節(jié)點,也可以比較相鄰時間節(jié)點/感興趣的時間節(jié)點之間的甲基化圖譜的差異。





主要關(guān)注Promoter和Enhancer等調(diào)控區(qū)域DMC/DMR的TF結(jié)合位點。


(3)時序甲基化數(shù)據(jù)的分析策略(Time Course)
比較相鄰時間點的差異
直接篩選時間階段相關(guān)的DMC和DMR
線性模型/混合線性模型
(可以排除混雜因素干擾,如性別)
共甲基化模式分析(階段特異性Cluster篩選)
WGCNA(權(quán)重基因共表達(dá)網(wǎng)絡(luò)分析)
MEGENA(多尺度嵌入式基因共表達(dá)網(wǎng)絡(luò)分析)
mfuzz
... ...


(4)DMC/DMR在基因元件上的分布
TE(轉(zhuǎn)座元件):影響基因組穩(wěn)定性
Promoter:影響基因表達(dá)
Genebody


二、差異甲基化基因(DMG)的功能分析
將有至少一個 DMR 注釋到其 promoter 或 genebody 的基因稱之為差異甲基化基因。 有研究表明 promoter 區(qū)域甲基化提高具有潛在抑制基因轉(zhuǎn)錄的功能;而 genebody 區(qū)域 與表達(dá)具有正相關(guān)關(guān)系。所以研究這兩個區(qū)域發(fā)生差異甲基化的基因,可以幫助我們研 究受甲基化調(diào)控的細(xì)胞功能的變化規(guī)律。
分析策略:
可以分為Hyper-DMG和Hypo-DMG
可以分為Promoter-DMG和Genebody-DMG
Gene Ontology
KEGG pathway
Reactome pathway
DisGeNET disease
Disease Ontology


三、易基因差異甲基化水平檢測
(1)差異甲基化區(qū)域(DMR)檢測
DMR檢測使用權(quán)威期刊發(fā)表的metilene 軟件,該軟件利用二元分隔算法(binary segmentation algorithm)結(jié)合雙重統(tǒng)計學(xué)檢驗(MWU-test和2D KS-test),可快速實現(xiàn)成對樣本或兩組樣品間的DMR 重頭檢測(de novo)。最后,通過多重檢驗校正,進(jìn)而得到差異甲基化區(qū)域。使用CpG 位點來尋找差異甲基化區(qū)域。
DMR 檢測規(guī)則:
每個CpG 位點測序深度>=5x;
CpG 位點的甲基化差異>=0.2;
該區(qū)域的差異甲基化 CpG 位點個數(shù)>=5;
相鄰差異甲基化CpG 位點的距離<=300bp;
MWU-test p-value < 0.05。
(2)差異甲基化區(qū)域(DMR)的注釋
將 DMR 分別注釋到genebody和 promoter 區(qū)。

(3)差異性甲基化基因(DMG)的功能分析?
GO、KEGG 富集分析。為了研究DMG的功能,采用超幾何分布檢驗(Hypergeometric distribution test)分析 DMG在GO term和KEGG pathway中的富集情況。
(4)差異性甲基化區(qū)域(DMR)的可視化
由于DMR 數(shù)量太多,篩選 Q-value top20 的差異甲基化區(qū)域進(jìn)行可視化繪圖。下圖為例,黃色部分為 DMR 區(qū)域。橫坐標(biāo)以繪出以 DMR 區(qū)域為中心向兩側(cè)各擴(kuò)展 1kb 區(qū)域的甲基化情況。最上方黑色方框標(biāo)識出該區(qū)域內(nèi)基因 promoter 區(qū)的位置(如果有)和基因表達(dá)方向。中間部分是兩組樣本的甲基化水平變化曲線。最下方是 CG 位點密度曲線。

