Genome Biology(IF 12.3)| 英國倫敦大學(xué)DNA甲基化隊列研究揭示其可變性新機(jī)制

DNA甲基化是基因功能的主要調(diào)節(jié)因子,在發(fā)育和生命過程中具有重要作用。多項研究表明,遺傳效應(yīng)對特定CpG的DNA甲基化水平有很大影響。目前人類甲基化分析最廣泛使用的分析技術(shù)是Illumina EPIC芯片。
2023年7月,來自英國倫敦大學(xué)國王學(xué)院雙胞胎研究和遺傳流行病學(xué)系團(tuán)隊在Genome Biology(IF 12.3)雜志上發(fā)表題為“Genetic impacts on DNA methylation help elucidate regulatory genomic processe”的研究文章,該研究報告了Illumina EPIC陣列上DNA甲基化的新型全基因組meQTL分析,對來自三個英國人群隊列的2358份樣本進(jìn)行了薈萃分析。

?研究材料

?技術(shù)路線

主要結(jié)果
1. Illumina EPIC DNA甲基化的遺傳力研究
?作者對TwinsUK隊列中的88對單合子(MZ)和70對雙合子(DZ)雙胞胎進(jìn)行研究,在所有檢測的CpG中,平均全基因組狹義遺傳力為A = 0.138(SD = 0.198;中位值A(chǔ) = 0.037,IQR = 0.220),當(dāng)通過基因組注釋進(jìn)行分層時,增強(qiáng)子中的CpG總體上傾向于具有更大的遺傳力估計值(平均值A(chǔ) = 0.179,sd = 0.217,95% CI [0.178,0.181])??傮w而言,EPIC探針和450K傳統(tǒng)探針之間的基因組注釋的遺傳力模式是一致的,作者還發(fā)現(xiàn)可變CpG位點(diǎn)往往是最可遺傳的。

2. 常見的遺傳變異對血液甲基化的影響
為了確定影響甲基的特定遺傳變異體,對三項非重疊人類隊列研究(TwinsUK,1946BC和1958BC)的五個數(shù)據(jù)集的總計2358份全血樣本進(jìn)行了meQTL分析。測試每個數(shù)據(jù)集中所有SNP-CpG對的關(guān)聯(lián)性。1 Mbp(上游和下游)內(nèi)的CpG和SNP關(guān)聯(lián)被視為cis,所有其他關(guān)聯(lián)被視為trans,共有189,202,234個候選cis meQTL-CpG對(P≤5×10-3)和100,814,822個trans對(P≤5×10-6)。作者確定244,491個CpG(受試探針的33.7%)受cis-meQTL SNPs影響,5219個CpG(受試探針的0.7%)受trans- meQTL SNPs影響,通過將CpG分成兩組(450K傳統(tǒng)探針和EPIC特異性探針)并重復(fù)meQTL發(fā)現(xiàn)過程來進(jìn)行敏感性分析,發(fā)現(xiàn)所報告的meQTL比例仍然非常相似。總體而言,具有順式和反式meQTLs的CpG具有最大的DNA甲基化遺傳力證據(jù)。

3. 用meQTL復(fù)制新的EPIC特異性和450K遺留CpG
使用之前發(fā)表的MeDIP-seq數(shù)據(jù),在Twin- sUK隊列的2319名個體的獨(dú)立樣本中,在選定的CpG中研究了meQTL效應(yīng)的復(fù)制,經(jīng)過多次測試校正并具有一致的作用方向。觀察到51.2%的cis-meqtl CpG(125,251 CpG)和37%的trans-meqtl CpG(1933 CpG)對EPIC陣列具有特異性。對于其余45萬個meQTLs的傳統(tǒng)CpG,作者通過將它們與基于32,851份血樣的GoDMC數(shù)據(jù)庫進(jìn)行比較,并驗(yàn)證??傊?50K特異性CpG中,97.0%的meQTLs(順式或反式)在GoDMC數(shù)據(jù)集中也受到遺傳影響。
4. 局部和遠(yuǎn)端遺傳效應(yīng)的基因組注釋顯示增強(qiáng)子的富集一致
作者發(fā)現(xiàn)CpG的基因組注釋與順式和反式meQTLs的總體對比模式相關(guān)。位于CpG島(CGI)、啟動子和轉(zhuǎn)錄因子結(jié)合位點(diǎn)(TFBSs)的CpG不太可能含有cis-meqtl,而更可能有反式meqtl。位于基因間區(qū)、增強(qiáng)子和絕緣體的CpG更可能同時具有順式和反式meQTLs。接下來,作者探索了不同基因組注釋中meQTL SNPs的富集或缺失,作者在不同注釋中比較了每個CpG位點(diǎn)最顯著相關(guān)的meQTL SNPs與全部測試遺傳變異體的比例,與觀察到的CpG結(jié)果相反,發(fā)現(xiàn)根據(jù)基因組類別,順式和反式meQTLs的分布模式一致。因此,與在遺傳控制下觀察到的CpG基因組模式不同,驅(qū)動meQTL效應(yīng)的遺傳變異體顯示出相似的局部和遠(yuǎn)端遺傳效應(yīng)基因組分布。簡而言之,觀察到在增強(qiáng)子中CpG明顯富集meQTL和meQTL SNPs。

5. 功能整合有助于深入了解對甲基化的長期遺傳影響
首先,將meQTL結(jié)果與eQTLGen財團(tuán)的數(shù)據(jù)結(jié)合起來,這是迄今為止最廣泛的eQTL資源,對來自37個以歐洲血統(tǒng)為主的隊列的31,684名個體的血液樣本進(jìn)行了研究??傮w上,作者觀察到了cis-meqtl和eQTLs之間共定位的有力證據(jù),這與之前的發(fā)現(xiàn)一致。總共有44.2%的表達(dá)基因與DNA甲基化有共同的遺傳基礎(chǔ),這比以前報道的要高。使用跨meQTL的SMR分析還發(fā)現(xiàn)了許多meQTL和eQTL共定位事件。總共有642個獨(dú)特的反式meQTL SNPs與cis- eQTLs共定位,同時影響709個CpG和782個基因,結(jié)果可能反映出影響參與直接或間接全局表觀遺傳調(diào)節(jié)的基因表達(dá)的遺傳變異體也是來自Villica和Bell的反式meqtl。cis-meQTL與cis-eQTL共定位的結(jié)果也允許做出推斷遠(yuǎn)端遺傳影響DNA甲基化水平的機(jī)制。作者對meQTLs進(jìn)行了另外兩次功能探索分析,首先,搜索了與基因組三維(3D)構(gòu)象重疊的meQTL-CpG關(guān)聯(lián),如拓?fù)湎嚓P(guān)結(jié)構(gòu)域(TADs),結(jié)果36.5%的具有染色體內(nèi)反式meQTL的CpG與其最相關(guān)的meQTL具有相同的TAD。這支持了作者的假設(shè),即tad可能會使跨meQTLs與它們的目標(biāo)CpG在物理上接近??傊?,結(jié)果與一些染色體內(nèi)反式meqtl可能在TADs中充當(dāng)“長距離”順式-meqtl的假設(shè)一致。其次,作者研究了位于編碼區(qū)內(nèi)的反式meqtl的GO分析,以檢測反式meqtl是否可能改變TFs等蛋白質(zhì)的功能,結(jié)果支持假設(shè),即反式meQTLs可能會改變TFs等蛋白質(zhì)的功能,進(jìn)而影響多基因組區(qū)域的DNA甲基化水平。

6. 高度連接的CpG和meQTL
作者計算了每CpG meQTL SNP關(guān)聯(lián)的有效數(shù)量,剔除了因LD引起的冗余SNP。在LD成塊后,受遺傳控制的CpG往往沒有什么關(guān)聯(lián),每個CpG的cis中位值為2,trans中位值為1??傮w上與順式和反式關(guān)聯(lián)最大的CpG是新型EPIC探針cg16423305 (42個順式和21個反式meqtl)、cg00128506 (48個順式和13個反式meqtl) 和cg25014118 (50個順式和6個反式meQTLs)。接下來,作者考察meQTL SNPs的連通性,觀察到與聚集meQTLs每個區(qū)域相關(guān)的五種獨(dú)特順式-CpG的中位值(IQR = 10),以及一種反式-CpG的中位值(IQR = 1)。在高度連接的CpG和遺傳區(qū)域中,特別值得注意的是主要組織相容性復(fù)合體(MHC)區(qū)域,該區(qū)域在具有遺傳效應(yīng)的CpG和屬于meQTL的SNPs中的比例過高。該位點(diǎn)包含多個高度調(diào)控的CpG和關(guān)鍵的調(diào)控meQTL區(qū)域,用于順式和特別是反式關(guān)聯(lián)。
7. 遺傳變異、DNA甲基化和復(fù)雜性狀之間的相互作用
作者使用meQTL來鑒定cis-meQTL SNPs和GWAS SNPs之間的共定位,這些SNPs來自分組為七個表型類別的56個常見人類復(fù)雜性狀。對186,817個受試CpG位點(diǎn)和7個表型類別進(jìn)行Bonferroni校正后,通過1325個獨(dú)特CpG之間的共定位識別了1520個關(guān)聯(lián)和34個性狀,涉及1180個獨(dú)特的cis-meqtl。生長和年齡(包括身高)是具有最多共定位和598個獨(dú)特CpG位點(diǎn)的表型分類。總體而言,與其他具有meQTLs的CpG相比,具有GWAS共定位的CpG在CGI、編碼和監(jiān)管區(qū)域更豐富??傊@些整合分析的例子突出了target遺傳變異體與多個CpG處的DNA甲基化、幾個基因處的基因表達(dá)以及許多復(fù)雜的代謝特征和疾病之間的聯(lián)系。這些新的聯(lián)系為特定GWAS變體在選定人類表型中的作用機(jī)制提供了功能性見解。

?產(chǎn)品特色
全基因組覆蓋,CpG位點(diǎn)升級
Illumina EPICV2.0(935K)芯片可檢測人全基因組約935,000個CpG位點(diǎn)的甲基化狀態(tài),在850K的基礎(chǔ)上去除了性能不佳的探針:
新增186,000個CpG靶向增強(qiáng)子和超級增強(qiáng)子;
更多CTCF結(jié)合位點(diǎn)、CNV檢測區(qū)域、EPIC v1.0覆蓋不足的CpG島以及常見癌癥驅(qū)動突變;
還增加了經(jīng)ATAC-Seq和ChIP-Seq實(shí)驗(yàn)鑒定的與腫瘤有關(guān)的染色質(zhì)開放區(qū)域;
此外,基因組版本更新到hg38以及GenCode數(shù)據(jù)庫v41版本,是更適合用于表觀基因組全關(guān)聯(lián)分析研究(EWAS)的一款芯片。
兼容多種樣本類型,包括FFPE
FFPE組織樣本可獲得高質(zhì)量數(shù)據(jù),F(xiàn)FPE兼容性對于癌癥研究極為重要,能夠支持以大型腫瘤生物樣本庫為基礎(chǔ)的研究。935K芯片檢測兼容樣本:(1)FFPE;(2)新鮮/冷凍組織;(3)全血;(4)細(xì)胞;(5)cfDNA。
高度準(zhǔn)確和精確的檢測數(shù)據(jù)
935K甲基化芯片檢測能夠檢測到0.2的beta值差異,假陽性率低于1%,從而實(shí)現(xiàn)了較高的分析靈敏度,同時也具有極好的數(shù)據(jù)可重現(xiàn)性。如下圖(A)935K芯片技術(shù)重復(fù)相關(guān)性R2>0.99(B)935K芯片和850K的交集探針間的相關(guān)性R2>0.99。(C)935K芯片數(shù)據(jù)與甲基化測序(100×測序深度)的相關(guān)性R2>96%。

中科新生命優(yōu)勢
自主檢測平臺
中科新生命強(qiáng)力引入Illumina iScan系統(tǒng),旨在為表觀研究的客戶提供高效率、低成本的一站式甲基化服務(wù)平臺。
數(shù)據(jù)穩(wěn)定可靠
Illumina Infinium MethylationEPICV2.0 BeadChip甲基化芯片作為一款優(yōu)秀的芯片,芯片數(shù)據(jù)的穩(wěn)定與可靠可以通過芯片的技術(shù)重復(fù)直觀的體現(xiàn),其本身的技術(shù)重復(fù)相關(guān)性R2>0.99。


中科優(yōu)品推薦
Illumina DNA甲基化芯片是一種全基因組甲基化篩選工具,該芯片保留了以單核苷酸分辨率定量分析全基因組CpG的能力,同時提供高度準(zhǔn)確和精確的甲基化測量,不受測序深度的影響??墒褂镁?、用戶友好的Infinium甲基化檢測分析多種DNA樣本類型,包括從FFPE分離的DNA樣本。與其他方法相比,Illumina DNA甲基化芯片具有可擴(kuò)展性和更低的單個樣本總成本,因此可用于探究疾病機(jī)制和生物標(biāo)志物的篩選。

