最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

易基因|RRBS單堿基繪制580種動(dòng)物的基因組規(guī)模DNA甲基化譜:Nature子刊

2023-02-21 16:33 作者:易基因科技  | 我要投稿

大家好,這里是專注表觀組學(xué)十余年,領(lǐng)跑多組學(xué)科研服務(wù)的易基因。

2023年01月16日,奧地利科學(xué)院分子醫(yī)學(xué)研究中心(CeMM)研究團(tuán)隊(duì)在《Nat Commun》雜志發(fā)表了題為“Comparative analysis of genome-scale, base-resolution DNA methylation profiles across 580 animal species”的研究論文,該研究通過(guò)優(yōu)化版簡(jiǎn)化基因組重亞硫酸鹽測(cè)序(RRBS)技術(shù)繪制了580種動(dòng)物(535種脊椎動(dòng)物,45種無(wú)脊椎動(dòng)物)的DNA甲基化圖譜,共生成了2443個(gè)基因組規(guī)模的多器官DNA甲基化譜。研究構(gòu)建了脊椎動(dòng)物和無(wú)脊椎動(dòng)物DNA甲基化組的大量資源,展示了在無(wú)參基因組物種中進(jìn)行無(wú)參表觀基因組分析的能力,并為脊椎動(dòng)物進(jìn)化研究提供了表觀遺傳學(xué)視角。

標(biāo)題:Comparative analysis of genome-scale, base-resolution DNA methylation profiles across 580 animal species 堿基分辨率下580種動(dòng)物基因組規(guī)模DNA甲基化譜的比較分析

時(shí)間:2023.01.16

期刊:Nature Communications

影響因子:IF 17.694

技術(shù)平臺(tái):RRBS等

樣本實(shí)驗(yàn):

研究摘要:

在脊椎動(dòng)物進(jìn)化的廣泛背景下,為研究人類基因組之外的DNA甲基化,本研究通過(guò)RRBS在535種脊椎動(dòng)物和45種無(wú)脊椎動(dòng)物中以單堿基分辨率繪制了基因組規(guī)模的DNA甲基化譜,涵蓋所有脊椎動(dòng)物類別和幾個(gè)近端無(wú)脊椎動(dòng)物類別。其中心臟樣本和肝臟樣本用于物種組織匹配比較,肺、鰓、鰭、脾、腦、淋巴結(jié)、肌肉、腎和皮膚等其他組織以物種特異性方式包括在內(nèi)。樣本優(yōu)先考慮健康成體和平衡雄雌比例,每種物種2-4個(gè)。

研究使用優(yōu)化版簡(jiǎn)化基因組重亞硫酸鹽測(cè)序(RRBS)進(jìn)行DNA甲基化分析。檢測(cè)區(qū)域不僅包括富含CpG的調(diào)控區(qū)域,也包括外顯子、內(nèi)含子、基因間區(qū)域和重復(fù)元件等基因組其他區(qū)域;檢測(cè)了基因組CpG位點(diǎn)和非CpG位點(diǎn)的DNA甲基化。為同時(shí)研究目前沒(méi)有公布參考基因組的物種、避免由于可用參考基因組的質(zhì)量不同而產(chǎn)生的偏差,本研究使用與參考基因組無(wú)關(guān)的生物信息學(xué)方法分析生成RRBS數(shù)據(jù)集,并在此前三個(gè)物種無(wú)參和有參分析的頭對(duì)頭比較中驗(yàn)證了這種方法。

本研究完整數(shù)據(jù)集涵蓋580種動(dòng)物(535種脊椎動(dòng)物和45種無(wú)脊椎動(dòng)物)的2443個(gè)DNA甲基化譜。基于該數(shù)據(jù)集,研究鑒定出DNA甲基化與脊椎動(dòng)物和無(wú)脊椎動(dòng)物之間共有潛在基因組DNA序列的定量及預(yù)測(cè)相關(guān)聯(lián)。研究結(jié)果表明了沿著進(jìn)化軸的兩個(gè)主要轉(zhuǎn)變:一個(gè)在脊椎動(dòng)物和無(wú)脊椎動(dòng)物之間,另一個(gè)在兩棲動(dòng)物和爬行動(dòng)物之間。同時(shí)還研究了DNA甲基化的組織特異性和個(gè)體間差異:對(duì)于魚類、鳥類和哺乳動(dòng)物,組織特異性差異比個(gè)體間差異更為顯著,但對(duì)于無(wú)脊椎動(dòng)物、爬行動(dòng)物和兩棲動(dòng)物,這兩個(gè)因素表現(xiàn)出DNA甲基化差異的相似比例。通過(guò)分析整個(gè)脊椎動(dòng)物進(jìn)化過(guò)程中心臟和肝臟組織之間差異甲基化區(qū)域的轉(zhuǎn)錄因子結(jié)合位點(diǎn),結(jié)果表明DNA甲基化與組織同一性的高度保守相關(guān)聯(lián)。最后與現(xiàn)有參考基因組的交叉比對(duì)鑒定出基因啟動(dòng)子區(qū)DNA甲基化的特異性進(jìn)化趨勢(shì)。

本研究為脊椎動(dòng)物進(jìn)化提供了表觀遺傳學(xué)視角,為揭示DNA甲基化在脊椎動(dòng)物和無(wú)脊椎動(dòng)物中的作用構(gòu)建了重要資源。此外研究結(jié)果闡明了將表觀基因組分析納入正在進(jìn)行的所有脊椎動(dòng)物基因組圖譜分析中的可行性和價(jià)值,并為揭示DNA序列模式和DNA甲基化的復(fù)雜互作如何促進(jìn)脊椎動(dòng)物基因組進(jìn)化提供了新起點(diǎn)。


結(jié)果圖形

(1)RRBS繪制580種動(dòng)物的DNA甲基化圖譜及脊椎動(dòng)物進(jìn)化中全基因組DNA甲基化模式

圖1:580種動(dòng)物的DNA甲基化圖譜揭示脊椎動(dòng)物進(jìn)化過(guò)程中基因組和表觀基因組之間的整體關(guān)聯(lián)。

  1. 跨物種圖譜,涵蓋580種動(dòng)物(535種脊椎動(dòng)物和45種無(wú)脊椎動(dòng)物)的2443個(gè)基因組規(guī)模的DNA甲基化圖譜。動(dòng)物輪廓表示不同物種:章魚(無(wú)脊椎動(dòng)物)、鯊魚(軟骨魚)、鯉魚(硬骨魚)、青蛙(兩棲動(dòng)物)、烏龜(爬行動(dòng)物)、鴿子(鳥類)、袋鼠(有袋動(dòng)物)、大象(真獸類哺乳動(dòng)物),器官輪廓表示包括的主要組織(胚層組織)。

  2. 每個(gè)組織和分類組的分析樣本數(shù)量氣泡圖。

  3. 每個(gè)物種的全基因組DNA甲基化水平條形圖(圓圈外的黑條),所有組織和個(gè)體的平均值,比對(duì)到帶注釋的分類樹上。

  4. 所有物種按分類組匯總的全基因組DNA甲基化水平箱線圖。

  5. 每個(gè)物種的共有參考片段百分比箱線圖,片段根據(jù)其DNA甲基化水平分為三個(gè)分類組,包括至少10 reads覆蓋片段。

  6. 左:由基因組DNA序列特征闡明的物種特異性平均DNA甲基化水平之間的差異百分比條形圖。顏色表示平均Akaike信息標(biāo)準(zhǔn)(AIC),根據(jù)模型復(fù)雜性進(jìn)行調(diào)整。誤差線表示基于自舉法(100次迭代)平均值的標(biāo)準(zhǔn)偏差。右:使用逐步選擇將單個(gè)3-mer選擇到最終模型的穩(wěn)定性。*號(hào)表示響應(yīng)的3-mer基于圖h中描述的系統(tǒng)發(fā)育廣義線性模型顯示出統(tǒng)計(jì)上的顯著關(guān)聯(lián)。

  7. 基于共有參考片段中3-mer和6-mer頻率相似性的物種分層聚類。k-mer長(zhǎng)度為4和5的聚類顯示出非常相似的結(jié)果。

  8. 基于具有(x軸)和不具有(y軸)系統(tǒng)發(fā)育關(guān)系校正的廣義線性模型(GLMs)的標(biāo)準(zhǔn)誤差散點(diǎn)圖,比較3-mer頻率和全基因組DNA甲基化水平之間相關(guān)性的統(tǒng)計(jì)顯著性(p值)。

  9. 全基因組DNA甲基化水平與DNA甲基化侵蝕(DNA methylation erosion)之間的關(guān)系散點(diǎn)圖,通過(guò)單個(gè)樣本的“不一致reads比例”(PDR)進(jìn)行分析。虛線表示數(shù)學(xué)上預(yù)期的關(guān)系。實(shí)線表示使用R函數(shù)geom_smooth擬合到數(shù)據(jù)的廣義加性模型。

  10. 全基因組DNA甲基化水平與分類組DNA甲基化侵蝕之間的關(guān)系散點(diǎn)圖,取相應(yīng)樣本的中位數(shù)。虛線表示數(shù)學(xué)上預(yù)期的關(guān)系(如圖i所示)。實(shí)線表示擬合到數(shù)據(jù)的線性回歸模型。兩側(cè)顯示Pearson相關(guān)性及其顯著性。

  11. 與同一物種中的其他組織相比,大腦中非CpG甲基化水平的對(duì)數(shù)比率(log-ratios)箱線圖。單側(cè)配對(duì)Wilcoxon試驗(yàn)評(píng)估大腦中非CpG甲基化水平的增加。


(2)脊椎動(dòng)物和無(wú)脊椎動(dòng)物DNA甲基化的基因組編碼

圖2:機(jī)器學(xué)習(xí)識(shí)別DNA序列和位點(diǎn)特異性DNA甲基化之間的預(yù)測(cè)關(guān)系(“基因組編碼”)

  1. 基于機(jī)器學(xué)習(xí)方法的示意圖,用于從基因組DNA序列預(yù)測(cè)位點(diǎn)特異性DNA甲基化。

  2. 支持向量機(jī)(SVM)基于相應(yīng)基因組DNA序列k-mer頻率來(lái)預(yù)測(cè)基因組區(qū)域的DNA甲基化水平(高與低)的測(cè)試集性能(受試者操作特征曲線下面積,ROC-AUC)箱線圖

  3. 每個(gè)分類組的代表性ROC曲線,所顯示物種的ROC-AUC值密切反映對(duì)應(yīng)分類組的平均ROC-AUC值。隨機(jī)標(biāo)簽數(shù)據(jù)上訓(xùn)練和評(píng)估的ROC曲線接近對(duì)角線作為陰性對(duì)照(灰色)。

  4. 脊椎動(dòng)物和無(wú)脊椎動(dòng)物的ROC-AUC值的直方圖,七鰓鰻(早期無(wú)顎脊椎動(dòng)物)在兩種分布之間顯示為綠點(diǎn)。

  5. 基于SVM的3-mer的特征權(quán)重?zé)釄D,所述SVM training后針對(duì)每個(gè)物種(由分類樹排序)可以預(yù)測(cè)位點(diǎn)特異性DNA甲基化。

  6. 每個(gè)分類組跨物種間的3-mer平均特征權(quán)重序列標(biāo)志。序列標(biāo)志分別顯示與低和高DNA甲基化水平相關(guān)的3-mer。


(3)DNA甲基化基因組編碼的保守和分化

圖3:位點(diǎn)特異性DNA甲基化的“基因組密碼”在脊椎動(dòng)物和無(wú)脊椎動(dòng)物中廣泛保守。

  1. 預(yù)測(cè)所有物種DNA序列的位點(diǎn)特異性DNA甲基化ROC-AUC值熱圖。

  2. 在肥睡鼠物種(fat dormouse,F(xiàn)D)中訓(xùn)練并在其他物種中測(cè)試的分類器的跨物種預(yù)測(cè)特征結(jié)果ROC曲線(從左到右:Parma-wallaby,PK;macaque,MAC;little skate,LSK;white hake,WHH)。在非反向物種中training時(shí),“反向物種(inverted species)”特征比隨機(jī)預(yù)測(cè)性能更差。

  3. 按training物種(個(gè)體圖)和test物種(x軸)分類組匯總的物種預(yù)測(cè)性能(圖a的ROC-AUC值)箱線圖。

  4. 與系統(tǒng)發(fā)育相關(guān)的非反向物種(下)相比,所有反向魚類物種(上)的物種預(yù)測(cè)性能直方圖(圖a的ROC-AUC值)。反向物種:Atlantic cod, ACO; walleye pollock, WEP; Atlantic salmon, ATS; Atlantic herring, ATH; white hake, WHH. 非反向物種: Pollock, POL; silver arowana, SAA; Pacific grenadier, PAG; onefin flashlightfish, FLF; trout, TRO。

  5. 左:反向物種(白鱈魚,WHH)和所有其他骨魚(actinopteri)物種(按分類樹排序)之間最大差異3-mer的分類器特征權(quán)重。右:白鱈魚相同3-mer的體重與所有其他骨魚(actinopteri)物種的平均值條形圖。誤差線表示平均值的標(biāo)準(zhǔn)偏差。

  6. 反向物種(白鱈魚,WHH)中training的分類器跨物種預(yù)測(cè)性能(y軸)與通過(guò)圖d加權(quán)差分3-mer重復(fù)構(gòu)建的三個(gè)9-mer重復(fù)(x軸)頻率差異之間的關(guān)聯(lián)散點(diǎn)圖。>0值表示高甲基化序列中的頻率較高,反之亦然。反向物種:大西洋鱈魚(ACO)、白眼狹鱈(WEP)、白鱈魚(WHH)、大西洋鮭魚(ATS)、大西洋鯡魚(ATH)。虛線表示頻率差為0(垂直線),ROC-AUC值為0.5(水平線)。


(4)組織特異性DNA甲基化模式的進(jìn)化保守

圖4:組織特異性DNA甲基化表明DNA甲基化與轉(zhuǎn)錄調(diào)控和組織特性的高度保守相關(guān)。

  1. 每個(gè)物種的位點(diǎn)特異性DNA甲基化變化百分比散點(diǎn)圖,分別由不同分類組的組織(x軸)和個(gè)體(y軸)闡明。箭頭和p值表示組織和個(gè)體解釋的方差差異方向和統(tǒng)計(jì)顯著性,使用雙側(cè)成對(duì)Wilcoxon檢驗(yàn)計(jì)算。虛線箭頭表示無(wú)顯著差異,文子云(Word clouds)總結(jié)了每個(gè)分類組中有助于分析的組織類型頻率。

  2. 心臟組織和肝臟組織(給定物種內(nèi))之間鑒定的差異甲基化區(qū)域中轉(zhuǎn)錄因子結(jié)合位點(diǎn)(TFBS)motif的富集分析示意圖。

  3. 心臟和肝臟之間差異甲基化片段的TFBS motif富集的聚類熱圖。每個(gè)轉(zhuǎn)錄因子(列)顏色表示其是否富含相應(yīng)物種(行)的心臟(藍(lán)色)或肝臟(黃色)中的低甲基化片段。根據(jù)《人類蛋白質(zhì)圖譜》,該熱圖僅包括每個(gè)物種至少有十個(gè)顯著富集的轉(zhuǎn)錄因子和物種,以及心臟或肝臟組織中標(biāo)準(zhǔn)化RNA表達(dá)值>1。

  4. 圖c中鑒定的轉(zhuǎn)錄因子的GO注釋。

  5. 基于圖c中鑒定的具有已知結(jié)合偏好(甲基化/非甲基化)的轉(zhuǎn)錄因子及其具有已知調(diào)控作用(激活:綠色;抑制:紅色)的直接靶基因構(gòu)建的基因調(diào)控網(wǎng)絡(luò)。在一種組織類型中偏好低甲基化的轉(zhuǎn)錄因子用黃色(心臟)或藍(lán)色(肝臟)表示,而沒(méi)有表現(xiàn)出這種富集的轉(zhuǎn)錄因子以及轉(zhuǎn)錄因子靶基因用灰色表示。插圖顯示心臟和肝臟中FOXO4和EGR1的特異性富集,其對(duì)HIF1A的作用相反(FOXO4:激活;EGR1:抑制)。底部圖片表示每個(gè)分類組中的一個(gè)物種,有助于對(duì)跨物種的心臟和肝臟的DNA甲基化差異分析。


(5)脊椎動(dòng)物進(jìn)化中DNA甲基化的基因中心模式

圖5:人類同源基因空間中DNA甲基化的跨物種分析鑒定了啟動(dòng)子甲基化的保守和分化。

  1. 基于無(wú)參的共有參考片段與注釋參考基因組的交叉比對(duì),基因啟動(dòng)子區(qū)域DNA甲基化的UMAP表示。樣品按分類組表示,匹配的參考基因組為黑色。參考基因組由其UCSC基因組瀏覽器標(biāo)識(shí)符注釋。插圖:加擾數(shù)據(jù)的UMAP表示顯示調(diào)控分析中缺乏聚類。

  2. 基于鳥類和哺乳動(dòng)物的啟動(dòng)子甲基化數(shù)據(jù),使用交叉比對(duì)數(shù)據(jù)集區(qū)分心臟和肝臟的隨機(jī)森林分類器的ROC曲線。實(shí)線基于真實(shí)數(shù)據(jù),虛線基于加擾數(shù)據(jù)(圖a中的插圖)。給出真實(shí)數(shù)據(jù)(1)和加擾數(shù)據(jù)(2)的ROC-AUC值。

  3. 心臟與肝臟分類中四種最具預(yù)測(cè)性基因的基因啟動(dòng)子區(qū)域DNA甲基化水平箱線圖。

  4. 基于心臟和肝臟樣本的啟動(dòng)子甲基化數(shù)據(jù),使用交叉比對(duì)數(shù)據(jù)集區(qū)分鳥類和哺乳動(dòng)物的隨機(jī)森林分類器ROC曲線。格式與圖b相同。

  5. 哺乳動(dòng)物與鳥類分類中四種最具預(yù)測(cè)性基因的基因啟動(dòng)子區(qū)域DNA甲基化水平箱線圖。格式與圖c相同


總結(jié):

本研究通過(guò)RRBS測(cè)序生成的DNA甲基化數(shù)據(jù)建立了一個(gè)規(guī)??涨暗臄?shù)據(jù)集,并通過(guò)對(duì)各種動(dòng)物物種的DNA甲基化保守和分化等不同方面的深入了解,初步闡明了與脊椎動(dòng)物進(jìn)化相關(guān)的DNA甲基化景觀。最值得注意的是,研究發(fā)現(xiàn)DNA序列和DNA甲基化在脊椎動(dòng)物和無(wú)脊椎動(dòng)物物種中表現(xiàn)出廣泛的相關(guān)性,這些關(guān)聯(lián)在脊椎動(dòng)物進(jìn)化過(guò)程中逐漸發(fā)生變化。研究所生成的數(shù)據(jù)和分析為研究在人類和動(dòng)物種群以及各種疾病中的表觀遺傳異質(zhì)性提供了進(jìn)化背景。


關(guān)于易基因簡(jiǎn)化基因組甲基化測(cè)序(RRBS)研究解決方案

簡(jiǎn)化甲基化測(cè)序(Reduced Representation Bisulfite Sequencing,RRBS)是利用限制性內(nèi)切酶對(duì)基因組進(jìn)行酶切,富集啟動(dòng)子及CpG島等重要的表觀調(diào)控區(qū)域并進(jìn)行重亞硫酸鹽測(cè)序。該技術(shù)顯著提高了高CpG區(qū)域的測(cè)序深度,在CpG島、啟動(dòng)子區(qū)域和增強(qiáng)子元件區(qū)域可以獲得高精度的分辨率,是一種準(zhǔn)確、高效、經(jīng)濟(jì)的DNA甲基化研究方法,在大規(guī)模臨床樣本的研究中具有廣泛的應(yīng)用前景。

為適應(yīng)科研技術(shù)的需要,易基因進(jìn)一步開(kāi)發(fā)了可在更大區(qū)域內(nèi)捕獲CpG位點(diǎn)的雙酶切RRBS(dRRBS),可研究更廣泛區(qū)域的甲基化,包括CGI shore等區(qū)域。

為助力適用低起始量DNA樣本(5ng)量多維度甲基化分析,易基因開(kāi)發(fā)了富集覆蓋CpG島、啟動(dòng)子、增強(qiáng)子、CTCF結(jié)合位點(diǎn)的甲基化靶向基因組測(cè)序方法:extended-representation bisulfite sequencing(XRBS),實(shí)現(xiàn)了高靈敏度和微量樣本復(fù)用檢測(cè),使其具有高度可擴(kuò)展性,并適用于有限的樣本和單個(gè)細(xì)胞基因組CG位點(diǎn)覆蓋高達(dá)15M以上。


技術(shù)優(yōu)勢(shì):

  • 起始量:100ng gDNA;

  • 單堿基分辨率;

  • 多樣本的覆蓋區(qū)域重復(fù)性可達(dá)到85%-95%、測(cè)序區(qū)域針對(duì)高CpG調(diào)控區(qū)域,數(shù)據(jù)利用率更高;

  • 針對(duì)性強(qiáng),成本較低;

  • 基因組CG位點(diǎn)覆蓋高達(dá)10-15M,顯著優(yōu)于850K芯片。


應(yīng)用方向:

RRBS/dRRBS/XRBS廣泛應(yīng)用于動(dòng)物,要求全基因組掃描(覆蓋關(guān)鍵調(diào)控位點(diǎn))的:

  • 隊(duì)列研究、疾病分子分型、臨床樣本的甲基化 Biomarker 篩選

  • 復(fù)雜疾病及腫瘤發(fā)病機(jī)制等甲基化研究

  • 模式動(dòng)物發(fā)育和疾病甲基化研究

易基因科技提供全面的DNA甲基化研究整體解決方案,技術(shù)詳情了解請(qǐng)致電易基因。


參考文獻(xiàn):

Klughammer J, et al. Comparative analysis of genome-scale, base-resolution DNA methylation profiles across 580 animal species. Nat Commun. 2023 Jan 16;14(1):232.

易基因|RRBS單堿基繪制580種動(dòng)物的基因組規(guī)模DNA甲基化譜:Nature子刊的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
洛隆县| 台东县| 灵宝市| 蛟河市| 五华县| 南澳县| 眉山市| 平昌县| 益阳市| 芜湖市| 迁西县| 凤冈县| 建阳市| 西贡区| 蕲春县| 肥西县| 贺兰县| 南乐县| 河间市| 东莞市| 东海县| 普定县| 抚松县| 德阳市| 郴州市| 绵竹市| 梁平县| 邳州市| 河源市| 临澧县| 巨鹿县| 阜南县| 潮州市| 仙桃市| 三原县| 阜城县| 磐石市| 靖州| 新绛县| 漯河市| 塔河县|