EWAS數(shù)據(jù)分析(4)—關聯(lián)分析篇
通過前面3篇EWAS數(shù)據(jù)分析技術干貨介紹,我們已經把進行關聯(lián)分析得數(shù)據(jù)和樣本都準備好了,接下來是否可以做關聯(lián)分析了呢?如果你得樣本性狀數(shù)據(jù)已經整理好了,那我們就開始吧!
對于預處理后所得甲基化水平Beta表,針對每個CpG位點,可以Beta值為自變量,目標性狀為因變量,其他因素如性別、年齡等為協(xié)變量,利用回歸分析進行CpG位點甲基化顯著關聯(lián)分析。
當目標變量是連續(xù)型時,可以采用線性回歸分析(linear regression);若樣本存在關聯(lián)分層現(xiàn)象,也可采用混合線性回歸分析(linear mixed regression)進一步處理樣本分層問題。
當目標變量是離散型(二值)時,可以采用Logistic回歸分析。相比于普通的t檢驗或KW檢驗,采用Logistic回歸的優(yōu)勢在于可以進行協(xié)變量校正、處理樣本分層現(xiàn)象。
1. 分析結果

2. 展示圖
根據(jù)所有CpG位點關聯(lián)分析結果,可以根據(jù)全基因組的Manhattan圖和QQ圖:

根據(jù)特定基因區(qū)域上CpG位點關聯(lián)檢驗結果,可以利用CoMet繪制區(qū)域展示圖:

其中最上方圖內時區(qū)間內部CpG位點關聯(lián)檢驗結果展示圖;中間區(qū)域是不同來源的基因、功能注釋信息;最下方區(qū)域是CpG位點之間Beta值的相關系數(shù)展示圖。
通過上述關聯(lián)分析,我們就可以發(fā)現(xiàn)與疾病某些特定形狀顯著性相關得甲基化位點。那么,是不是說EWAS分析已經結束了呢?這只是剛剛開始,更多精彩內容請看下回分解。