最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

WGCNA結(jié)果如何解讀?(入門cainiao必看)

2022-01-25 14:05 作者:Biogeek_Lau  | 我要投稿

????????前面的視頻我們也介紹了WGCNA,大家去搜索引擎去搜WGCNA肯定也會找到很多教程。其實(shí)我們最重要的一步是理解算法的原理(關(guān)于WGCNA的入門知識和概念請大家務(wù)必參考文獻(xiàn)[1]),跑完這個代碼,能夠?qū)Y(jié)果進(jìn)行一個正確的解讀。我在專欄里也提到WGCNA的一個應(yīng)用現(xiàn)狀和存在的問題。那么如何解WGCNA的結(jié)果?這一篇會進(jìn)行詳細(xì)介紹。在正式介紹之前,我首先要指出WGCNA構(gòu)建的是一個相關(guān)網(wǎng)絡(luò),在解讀的時候一定要注意,我們得到的是一個相關(guān)性的結(jié)果,它不能導(dǎo)出因果關(guān)系。所以大家務(wù)必記住這句話,相關(guān)不代表因果,這是很重要的。

????????那要如何應(yīng)用呢?可不可以用到一個疾病的機(jī)制研究?是可以的,但是我們單純以WGCNA的結(jié)果來進(jìn)行一個機(jī)制的解讀,那是夸大了計算機(jī)分析的結(jié)果,是不合理的。生物的問題終歸要回到生物實(shí)驗(yàn)去解答。WGCNA得到的是一個相關(guān)性的結(jié)果,它可以為后續(xù)實(shí)驗(yàn)提供重要線索。比如我們用WGCNA進(jìn)行一個疾病標(biāo)記物的挖掘,那是可以的,但是如果說你要研究疾病的機(jī)制,WGCNA其實(shí)只是第一步。大家可以去看它在Nature雜志文章中的應(yīng)用,WGCNA只是論文中數(shù)據(jù)分析或者生物信息學(xué)分析的一個工具,只是論文內(nèi)容的一小部分。如果說是疾病標(biāo)記物的挖掘,我們后續(xù)還需要在臨床樣本中進(jìn)行一個實(shí)驗(yàn)的驗(yàn)證,畢竟生老病死是大事,生物的問題最終還是要在生物樣本里面驗(yàn)證。如果是研究疾病機(jī)制的話,我們根據(jù)WGCNA提供的線索,實(shí)驗(yàn)驗(yàn)證要做的是基因敲除,或者基因過表達(dá)/干擾等等,以觀察這個基因和表型間真實(shí)的關(guān)系。如果敲除了表型的確發(fā)生變化,那因果關(guān)系是可以確立的。但是具體是如何調(diào)控的?特別是我們體內(nèi)的基因很多,調(diào)控關(guān)系很復(fù)雜。后續(xù)可以用分子生物學(xué)手段去研究,比如說以轉(zhuǎn)錄因子或者說蛋白蛋白相互作用的方式,所以我們可以采用比如免疫共沉淀或者說酵母雙雜交或者轉(zhuǎn)錄因子分析的一些方法來進(jìn)行機(jī)制研究,這才算是一個完整的研究的思路,形成一個有利于病人的完整論文(倘若要把分子用于疾病診斷、治療和預(yù)后)。但是目前有一些論文直接從WGCNA推到疾病機(jī)制,這是夸大了數(shù)據(jù)分析的結(jié)果,是嚴(yán)重的錯誤。研究機(jī)制需要更多不同技術(shù)手段獲得的實(shí)驗(yàn)數(shù)據(jù)來支持。邁爾舍恩伯格在《大數(shù)據(jù)時代》里說,“要相關(guān),不要因果” ,在大數(shù)據(jù)時代,有相關(guān)就夠了。這句話在標(biāo)記物挖掘方面存在一定合理性。

????????所以我們下面介紹一下如何解讀WGCNA的結(jié)果。首先是不同的實(shí)驗(yàn)設(shè)計獲得的實(shí)驗(yàn)數(shù)據(jù)不同,可能會有不同的一個分析方法,但是利用WGCNA進(jìn)行模塊鑒定的這個流程都是一致,本質(zhì)上它是一個數(shù)據(jù)降維的過程,成千上萬的基因轉(zhuǎn)變?yōu)閹资畟€模塊。不管你實(shí)驗(yàn)如何設(shè)計,這個流程它是不變的,只不過我們最后得到的模塊,如何跟現(xiàn)有的樣本數(shù)據(jù)進(jìn)行一個關(guān)聯(lián),使用不同的方法。所以我這邊總結(jié)了一下,主要有三種常見的實(shí)驗(yàn)設(shè)計方式。第一種是沒有實(shí)驗(yàn)分組的數(shù)據(jù),比如說都是某種腫瘤的組學(xué)數(shù)據(jù)。第二種的話是有實(shí)驗(yàn)分組的,比如說實(shí)驗(yàn)組跟對照組,這是兩組的,或者說有三組,比如說對照組,實(shí)驗(yàn)組,然后治療組等。第三種情況是一個時間序列的實(shí)驗(yàn)設(shè)計,就比如說每隔三個小時進(jìn)行一個取樣,然后得到的這個轉(zhuǎn)錄組或者其他的組學(xué)數(shù)據(jù)。這三種實(shí)驗(yàn),它的WGCNA結(jié)果和樣本數(shù)據(jù)的關(guān)聯(lián)可能用不一樣的方法。第一步進(jìn)行共表達(dá)模塊鑒定這個是一模一樣程,也就是我們把所有的樣本,如果你沒有特殊需求的話,是把所有的樣本拿來構(gòu)建這個基因共表達(dá)網(wǎng)絡(luò),并進(jìn)行一個共表達(dá)模塊的鑒定。那么第一種情,比如說腫瘤的病理分型,現(xiàn)在乳腺癌有很多不同的病理分型。這時候我們的模塊可以跟這些分型進(jìn)行一個關(guān)聯(lián)。因?yàn)樗且粋€分類數(shù)據(jù)啊,也就類別數(shù)據(jù)。所以一般我們比如說可以用模塊ME值進(jìn)行一個聚類的分析。然后我們看聚類樹啊,應(yīng)該不同的亞型,它應(yīng)該是聚類到不同的樹枝下面,所以通過這個聚類樹,其實(shí)我們大致可以看出,哪一些模塊在哪一個病理分型里面,它的表達(dá)量是高的或者低的。當(dāng)然,這個聚類是一個定性的,如果要定量,可以使用ANOVA進(jìn)行分析(注意多重檢驗(yàn)的P值需要進(jìn)行校正如顯著性閾值修改為0.05/n),看哪些模塊ME值在不同病理分型中存在差異。如果病理分型是有序的分類變量,就說這個疾病它的一個程度是越來越嚴(yán)重的,那時候那這時候你就可以把它轉(zhuǎn)換為數(shù)值,然后跟我們模塊基因表達(dá)ME進(jìn)行一個相關(guān)分析,看哪個模塊和腫瘤發(fā)展最相關(guān)。因?yàn)閮烧吡烤V不一樣,所以可以進(jìn)行Sperman秩相關(guān)分析,獲得相關(guān)系數(shù)R和對應(yīng)P值。此外,NCBI GEO或者TCGA中腫瘤的樣本一般都有生存時間數(shù)據(jù),因此可以簡單應(yīng)用每個模塊ME的高低進(jìn)行樣本分組,然后2組進(jìn)行生存分析比較(log rank test),發(fā)現(xiàn)哪個模塊和病人生存時間相關(guān)。當(dāng)然,復(fù)雜一些的話,可以采用多個模塊的表達(dá)組合進(jìn)行分組,如模塊A高表達(dá)+模塊C低表達(dá)為1組,模塊A低表達(dá)+模塊C高表達(dá)為1組,再進(jìn)行生存分析。也可以和其他數(shù)據(jù)關(guān)聯(lián),比如現(xiàn)如今很火的cibersort免疫細(xì)胞組分?jǐn)?shù)據(jù)。第二種情況就是分組的數(shù)據(jù),這是比較常見的一個實(shí)驗(yàn)設(shè)計。不管什么樣的實(shí)驗(yàn)設(shè)計,對于我們鑒定到的模塊,每一個樣本都有對應(yīng)的模塊基因表達(dá)ME。所以我們通過簡單的分析比如說t檢驗(yàn)或者非參檢驗(yàn)來看每個模塊在實(shí)驗(yàn)對照組中是否存在差異,也可以得到模塊表達(dá)是上調(diào)還是下調(diào),你就用實(shí)驗(yàn)組-對照組的ME。我們經(jīng)??吹降奈墨I(xiàn)里面,一般都是這種情況。所以直接就是把實(shí)驗(yàn)組標(biāo)成1,對照處標(biāo)成0。這時候ME再跟這個實(shí)驗(yàn)分組進(jìn)行相關(guān)分析。特別是我們樣本量多的時候,這個要注意,相關(guān)系數(shù)有時候很低,比如說0.1或者0.2以下,但是P值很顯著,這個其實(shí)沒有任何意義,就說這個模塊P值是很顯著,但是因?yàn)樗嚓P(guān)系數(shù)太低了。如果我們把這個模塊跟某種性狀,比如說實(shí)驗(yàn)分組,用散點(diǎn)圖畫出來。我們再去看啊,就可以看到如果相關(guān)性是0.1還是0.2的話,這個圖沒有什么規(guī)律,雖然說他因?yàn)闃颖玖勘容^多,而導(dǎo)致較低的P值。第三種情況就是一個時間序列的實(shí)驗(yàn)設(shè)計啊,比如說這個樣本,我們是每隔三個小時進(jìn)行一個采樣。時間序列的話,我們一般會關(guān)注兩個點(diǎn)。一個點(diǎn)就是隨著時間,這個模塊基因表達(dá)ME會發(fā)生什么變化?是一直上調(diào),還是說他會像一個周期性的sin曲線,就是成一個節(jié)律的表達(dá)模式。如果這個基因表達(dá)可能會越來越高或者越來越低,可能具有趨勢性,所以隨時間發(fā)展一直上調(diào)(一定時間范圍內(nèi))。但是有些情況他沒有這個趨勢存在,就比如說他是一個節(jié)律相關(guān)的一個模塊。所以這個模塊他在白天12小時的時候他表達(dá)高,它的ME值應(yīng)該也是最高,然后在晚上12點(diǎn)的ME值最低呀,所以它是成一個節(jié)律性波動,就是說在一定范圍內(nèi)隨時間呈周期波動。節(jié)律相關(guān)的一個模塊,比如說我們鑒定到這個模塊,在正常里面它是成節(jié)律性的變化,在疾病里面他這個節(jié)律變化消失了。那我們就可以發(fā)現(xiàn),可能這個疾病它是跟節(jié)律的異常是相關(guān)的。所以主要是這三種常見的一個實(shí)驗(yàn)設(shè)計,它的WGCNA結(jié)果應(yīng)該如何與樣本的屬性數(shù)據(jù)進(jìn)行一個整合,應(yīng)該就是用這個思路。最后的話我們介紹一下視頻中的那個流程,它得到的結(jié)果有很多包括圖形和表格,它到底什么含義,要如何解讀?


主要參考文獻(xiàn)

[1] 權(quán)重基因共表達(dá)網(wǎng)絡(luò)分析在生物醫(yī)學(xué)中的應(yīng)用 https://cjb.ijournals.cn/cjbcn/article/abstract/gc17111791

注:版權(quán)所有,轉(zhuǎn)載請注明出處,或者給本文點(diǎn)贊


WGCNA結(jié)果如何解讀?(入門cainiao必看)的評論 (共 條)

分享到微博請遵守國家法律
赤城县| 榆社县| 福安市| 固原市| 盐池县| 洛宁县| 屏东县| 台中县| 三都| 德化县| 库伦旗| 古浪县| 宿松县| 久治县| 崇义县| 台江县| 雷州市| 永城市| 海阳市| 个旧市| 安福县| 奉新县| 乳山市| 修文县| 靖西县| 广丰县| 沾益县| 闸北区| 许昌县| 潮州市| 平原县| 北票市| 友谊县| 乌拉特前旗| 宜君县| 鹤岗市| 白玉县| 桑植县| 勃利县| 墨江| 云南省|