生信小白入門級(jí)文章!非腫瘤純生信分析+WGCNA,輕松發(fā)到4分+文章!
越來(lái)越多的生信分析文章會(huì)用到WGCNA分析,WGCNA是描述不同樣品之間基因關(guān)聯(lián)模式的系統(tǒng)生物學(xué)方法。(ps:布小谷往期的分享有相關(guān)解讀內(nèi)容喲!)今天布小谷給大家?guī)?lái)一篇非腫瘤純生信文章,研究使用WGCNA分析,對(duì)生信小白非常友好,思路簡(jiǎn)單,容易復(fù)現(xiàn)。
如果沒時(shí)間或者需要尋找新方向建議找布小谷,超多個(gè)性化的分析思路供你選擇哦!

l?題目:通過WGCNA分析鑒定膿毒癥關(guān)鍵基因
l?雜志:Preventive Medicine.
l?影響因子:IF=4.673
l?發(fā)表時(shí)間:2023年7月
研究背景
膿毒癥是一種由感染引起的機(jī)體異常反應(yīng),可導(dǎo)致危及生命的器官功能障礙,并進(jìn)一步發(fā)展為感染性休克,是感染導(dǎo)致死亡的最重要原因。膿毒癥指南的發(fā)布和實(shí)施、重癥監(jiān)護(hù)的進(jìn)步以及對(duì)早期診斷和及時(shí)干預(yù)的認(rèn)識(shí)提高,膿毒癥的發(fā)病率雖然有所增加,但死亡率正在逐漸下降。但是膿毒癥依然對(duì)人類健康有威脅,了解膿毒癥發(fā)病機(jī)制和確定潛在的分子治療靶點(diǎn)非常重要。
數(shù)據(jù)來(lái)源

研究思路
本研究在GEO數(shù)據(jù)庫(kù)上,獲得兩個(gè)不同數(shù)據(jù)集的原始數(shù)據(jù),GSE131761和GSE137342。借助limma包識(shí)別DEGs。用了WGCNA R包構(gòu)建共表達(dá)網(wǎng)絡(luò)并識(shí)別模塊。從兩個(gè)模塊中提取基因進(jìn)行了基因本體(GO)分析和KEGG分析。選擇相互重疊的基因作為關(guān)鍵基因的候選者,使用venn R包鑒定樞紐基因。
主要結(jié)果
1.GSE131761數(shù)據(jù)集中DEGs的鑒定
圖1為GSE131761數(shù)據(jù)集中識(shí)別DEGs的結(jié)果圖。閾值為|log2(差異倍數(shù))|>1和p<0.05,共鑒定出1272個(gè)DEGs,包括642個(gè)下調(diào)基因和630個(gè)上調(diào)基因。

2.構(gòu)建GSE131761數(shù)據(jù)集中相關(guān)基因的共表達(dá)網(wǎng)絡(luò)
對(duì)GSE131761數(shù)據(jù)集進(jìn)行WGCNA分析。對(duì)樣本進(jìn)行聚類分析以檢測(cè)異常值,選擇值140作為高度截止值,分析結(jié)果表明所有的樣本都位于簇中并通過了閾值(圖2A)。使用“sft$powerEstimate”確定軟功率閾值,采用軟閾值功率分析獲得網(wǎng)絡(luò)拓?fù)涞臒o(wú)標(biāo)度擬合指數(shù),用于對(duì)敗血癥和正常狀況進(jìn)行進(jìn)一步研究(圖2B-C)。使用WGCNA R包的一步法網(wǎng)絡(luò)構(gòu)建功能來(lái)構(gòu)建基因網(wǎng)絡(luò),并找到其中的模塊,對(duì)模塊進(jìn)行層次聚類分析,構(gòu)建了32個(gè)基因共表達(dá)模塊(圖2D)。圖2E為已識(shí)別模塊之間的連接圖,熱圖描繪了用于加權(quán)共表達(dá)網(wǎng)絡(luò)分析的基因的拓?fù)渲丿B矩陣(TOM)。
研究者在膿毒癥和模塊相關(guān)后尋找顯著性水平最高的關(guān)聯(lián),結(jié)果表明,淺綠色模塊與膿毒癥的相關(guān)性最顯著(圖3A)。淺綠色模塊的模塊均值和基因重要性(GS)具有高度顯著的相關(guān)性(圖3B)。


?

3.淺綠色模塊的功能分析
對(duì)淺綠色模塊中包含的基因進(jìn)行GO和KEGG分析。結(jié)果表明絕大多數(shù)基因富含蛋白質(zhì)絲氨酸/蘇氨酸/酪氨酸激酶活性(圖4A),并且除了TNF和HIF-1信號(hào)通路之外,淺綠色模塊是控制B細(xì)胞受體信號(hào)通路的模塊(圖4B)。隨后對(duì)信號(hào)通路進(jìn)行熱圖分析(圖4C),發(fā)現(xiàn)淺綠色模塊中的每個(gè)基因都對(duì)應(yīng)其中一條信號(hào)通路。

?4.GSE137342數(shù)據(jù)集中DEGs的識(shí)別結(jié)果
圖5為GSE137342數(shù)據(jù)集中識(shí)別DEGs的結(jié)果。閾值設(shè)置為|log2(差異倍數(shù))|>1和p<0.05,發(fā)現(xiàn)233個(gè)DEGs,其中149個(gè)下調(diào)基因,84個(gè)上調(diào)基因。

研究在GSE137342數(shù)據(jù)集中構(gòu)建了相關(guān)基因的共表達(dá)網(wǎng)絡(luò)。對(duì)樣本進(jìn)行聚類分析,觀察是否有任何明顯的異常值。本研究樣本量不受身高限制,臨界值設(shè)置為200(圖6A)。使用函數(shù)“sft$powerEstimate”,建立軟功率閾值,得到網(wǎng)絡(luò)拓?fù)涞臒o(wú)標(biāo)度擬合指數(shù)(圖6B-C)。對(duì)樣本進(jìn)行層次聚類分析,檢測(cè)具有相應(yīng)顏色分配的共表達(dá)簇,熱圖描述了用于加權(quán)共表達(dá)網(wǎng)絡(luò)分析的基因的拓?fù)渲丿B矩陣(TOM)(圖6D-E)。?


研究尋找模塊和膿毒癥之間最強(qiáng)的關(guān)聯(lián),對(duì)膿毒癥重要模塊進(jìn)行分析。藍(lán)色模塊在預(yù)測(cè)膿毒癥方面具有最高水平的意義(圖7A)。藍(lán)色模塊的GS及其相關(guān)基因顯示出強(qiáng)的正相關(guān)(圖7B)。

5.藍(lán)色模塊的功能分析
對(duì)藍(lán)色模塊的部分基因進(jìn)行GO和KEGG分析。研究結(jié)果顯示絕大多數(shù)基因表現(xiàn)出泛素樣蛋白轉(zhuǎn)移酶活性的富集,這可以解釋為這些基因在分子水平上發(fā)揮的作用(圖8A)。藍(lán)色模塊調(diào)控包括與軟病毒疾病相關(guān)的氧化磷酸化以及與許多不同疾病相聯(lián)系的神經(jīng)退行性通路在內(nèi)的一些通路(圖8B)。圖8C為信號(hào)通路的熱圖,顯示藍(lán)色模塊中的每個(gè)基因?qū)?yīng)信號(hào)網(wǎng)絡(luò)中的特定通路。


6.膿毒癥相關(guān)樞紐基因的鑒定
基于藍(lán)色模塊中的1938個(gè)基因、淺綠色模塊中的2898個(gè)基因、GSE131761數(shù)據(jù)集中的1272個(gè)DEGs和GSE137342數(shù)據(jù)集中的233個(gè)DEGs,韋恩分析表明2個(gè)交集基因,包括錨蛋白重復(fù)結(jié)構(gòu)域22(ANKRD22)和vanin1(VNN1),為膿毒癥相關(guān)樞紐基因(圖9)。

?文章小結(jié)
本文章在分析思路和整體設(shè)計(jì)上比較簡(jiǎn)單,對(duì)生信新手非常友好。即使是剛?cè)腴T的朋友也可快速掌握,容易復(fù)現(xiàn)。雖然分析內(nèi)容較為簡(jiǎn)單,數(shù)據(jù)量不大,但通過使用WGCNA分析,制作了兩個(gè)模塊,發(fā)現(xiàn)了兩個(gè)樞紐基因,了解膿毒癥相關(guān)的易感模塊和基因。感興趣的朋友,碼住思路開始行動(dòng)吧!
布小谷之聲
如果您的時(shí)間和精力有限或者缺乏相關(guān)經(jīng)驗(yàn),并且對(duì)生信分析和思路設(shè)計(jì)有所需要的話,“生信鳥”非常樂意為您提供如下服務(wù):免費(fèi)思路評(píng)估、付費(fèi)生信分析和方案設(shè)計(jì)以及實(shí)驗(yàn)項(xiàng)目實(shí)施等,有意向的小伙伴歡迎咨詢布小谷哦!
