雙疾病升級版之非腫瘤泛癌分析!WGCNA篩選免疫細(xì)胞相關(guān)基因+機(jī)器學(xué)習(xí),如此簡單的純生

腫瘤的泛癌分析已經(jīng)很常見了,但是你知道非腫瘤疾病也能做泛癌分析嗎?
腫瘤和非腫瘤疾病均與免疫細(xì)胞相關(guān),以此為橋梁豈不是將非腫瘤疾病與腫瘤聯(lián)系起來了嗎?

雙疾病是一種性價比很高的生信分析思路,不僅非腫瘤之間可以用,非腫瘤和腫瘤之間也可以用。
但這句話說的并不全面,應(yīng)該加一句:不僅單個非腫瘤疾病與單個腫瘤之間可以用,就連單個非腫瘤疾病與多個腫瘤之間也可以用。。。
因為非腫瘤疾病也能做泛癌分析?。。?/p>
(沒有思路、不知道怎么創(chuàng)新的找番茄君,超多個性化的分析思路供你選擇!)
今天給大家分享的這篇文章有3個亮點:
(1)?使用WGCNA結(jié)合免疫浸潤分析,識別類風(fēng)濕關(guān)節(jié)炎(RA)中與CD8+T細(xì)胞相關(guān)的差異基因;
(2)?利用機(jī)器學(xué)習(xí)篩選關(guān)鍵基因;
(3)?針對CD8+T細(xì)胞相關(guān)的關(guān)鍵基因進(jìn)行泛癌分析。
讓我們看看這篇文章具體是如何進(jìn)行分析的。

題目:類風(fēng)濕關(guān)節(jié)炎中CD8+T細(xì)胞相關(guān)生物標(biāo)志物的鑒定及其泛癌分析
雜志:Frontiers in immunology
影響因子:IF=8.786
發(fā)表時間:2022年11月

研究思路
通過多個類風(fēng)濕關(guān)節(jié)炎(RA)數(shù)據(jù)集、CIBERSORT和WGCNA算法,篩選出與RA中CD8+T細(xì)胞相關(guān)的基因。進(jìn)一步利用機(jī)器學(xué)習(xí)分析確定與RA最密切相關(guān)的CD8+T細(xì)胞基因。分析三個關(guān)鍵基因與33種癌癥之間的關(guān)系。針對關(guān)鍵基因的相關(guān)性分析、轉(zhuǎn)錄因子分析、單基因GSEA和PPI網(wǎng)絡(luò)的構(gòu)建。
主要研究結(jié)果
?
1.?WGCNA篩選與CD8+T細(xì)胞相關(guān)的hub模塊,并進(jìn)行功能富集分析
使用CIBERSORT分析GEO中RA相關(guān)數(shù)據(jù)集,確定數(shù)據(jù)集中每個樣本中各種免疫細(xì)胞亞型的百分比。然后選擇7個T細(xì)胞亞型的比例作為WGCNA的特征數(shù)據(jù)。采用WGCNA構(gòu)建基因共表達(dá)網(wǎng)絡(luò),計算平均關(guān)聯(lián)系數(shù)和Pearson相關(guān)系數(shù),對數(shù)據(jù)集中所有樣本進(jìn)行聚類分析。將功能相同的模塊組合成一個大模塊,形成37個模塊。
在37個模塊中,藍(lán)色模塊與CD8+T細(xì)胞的關(guān)系最為顯著。因此,將藍(lán)色模塊作為hub模塊。從中篩選出10個關(guān)鍵基因。然后對藍(lán)色模塊中的基因進(jìn)行GO和KEGG分析。

圖1.模塊-性狀相關(guān)性和功能富集分析
2.?hub基因的篩選與驗證
對上述10個關(guān)鍵基因進(jìn)行LASSO和隨機(jī)森林(RF)分析,通過LASSO分析共獲得6個基因。從RF分析結(jié)果中選取重要度為0.6的7個基因。用維恩圖(Venn diagram)對LASSO和RF的交集基因進(jìn)行可視化,共得到4個關(guān)鍵基因。

圖2. Hub基因的篩選
用5個GEO驗證數(shù)據(jù)集驗證4個關(guān)鍵基因(CD8A、TNS3、GZMA、PRF1)水平與CD8+T細(xì)胞浸潤之間的相關(guān)性。發(fā)現(xiàn)其中三個基因與CD8+T細(xì)胞浸潤程度呈顯著正相關(guān)。

圖3.在三個不同的數(shù)據(jù)集中hub基因表達(dá)與CD8+T細(xì)胞浸潤水平的散點圖
3.?關(guān)鍵基因的泛癌分析
采用CIBERSORT、McP-counter、QUANTISEQ、TIMER、XCELL等方法分析關(guān)鍵基因在不同癌癥中與CD8+T細(xì)胞浸潤的關(guān)系。發(fā)現(xiàn)3個關(guān)鍵基因在各種惡性腫瘤中與CD8+T細(xì)胞浸潤呈正相關(guān)。說明所鑒定的hub基因在腫瘤免疫微環(huán)境中起著重要作用,并與CD8+T細(xì)胞浸潤程度高度相關(guān)。

圖4. 不同癌癥中CD8A表達(dá)水平與CD8+T細(xì)胞浸潤程度的關(guān)系
4.?Hub基因的相關(guān)性分析
在不同數(shù)據(jù)集中驗證了hub基因之間的相關(guān)性,發(fā)現(xiàn)CD8A、GZMA、PRF1三者之間存在顯著正相關(guān)。

圖5. 3個hub基因在3個不同基因集中表達(dá)水平的關(guān)系
然后檢測CD8A、GZMA和PRF1在各種惡性腫瘤中的關(guān)系。除THYM、CD8A和GZMA在所有腫瘤中呈正相關(guān)外,CD8A和PRF1在33種腫瘤中呈正相關(guān),GZMA和PRF1在33種腫瘤中呈正相關(guān)。正常組織分析結(jié)果顯示,CD8A與GZMA在各正常組織中呈正相關(guān),GZMA與PRF1在各正常組織中呈正相關(guān),CD8A與PRF1在骨髓中呈負(fù)相關(guān),其余均呈正相關(guān)。

圖6. 三個hub基因表達(dá)水平的關(guān)系:(A-C)在不同的癌癥類型;(D-F)正常組織
5.?轉(zhuǎn)錄因子分析
從CHEA3數(shù)據(jù)庫中分析出與CD8A、GZMA和PRF1相關(guān)的8種常見轉(zhuǎn)錄因子。

圖7. CHEA3數(shù)據(jù)庫中Hub基因的轉(zhuǎn)錄因子預(yù)測
6.?單基因GSEA
為了探究hub基因的功能,進(jìn)行單基因GSEA分析。結(jié)果發(fā)現(xiàn)CD8A主要富集于類風(fēng)濕關(guān)節(jié)炎、哮喘、膽固醇代謝等(圖A)。GZEA主要富集在膽固醇代謝、類固醇生物合成等方面(圖B)。PRF1主要富集在冠狀病毒病COVID-19、磷酸戊糖途徑和亞油酸代謝中(圖C)。


圖8. hub基因的GSEA分析
7.?分析hub基因的相互作用
利用GeneMANIA數(shù)據(jù)庫建立Hub基因的PPI網(wǎng)絡(luò),構(gòu)建了一個20個基因相互作用網(wǎng)絡(luò)。并分析了20個基因的功能富集情況?;蛑饕患赥細(xì)胞介導(dǎo)的免疫、修飾等,并可能調(diào)控原發(fā)性免疫缺陷、病毒蛋白與細(xì)胞因子的相互作用以及細(xì)胞因子受體。說明這些基因?qū)γ庖呦到y(tǒng)至關(guān)重要。

圖9. Hub基因互作分析
?
總結(jié)
這篇文章并沒有特別復(fù)雜的分析內(nèi)容,也沒有實驗驗證,簡單的分析思路就發(fā)到8分+,性價比超高!
看完這篇文章是不是發(fā)現(xiàn),原來非腫瘤疾病也能做泛癌分析!那么以此為套路,換一種疾病進(jìn)行分析,豈不又是一篇文章?
非腫瘤疾病既可以做雙疾病,也可以基于免疫細(xì)胞相關(guān)基因進(jìn)行生信分析,還能做非腫瘤疾病的泛癌分析。。。能做的分析思路有多了一種選擇!
如果你也想進(jìn)行非腫瘤疾病的泛癌分析或者基于免疫細(xì)胞相關(guān)基因進(jìn)行分析,歡迎咨詢番茄君哦!小云可以提供:免費(fèi)評估服務(wù)、付費(fèi)設(shè)計服務(wù)、定制化生信分析等。超多個性化、創(chuàng)新性高的分析思路供你選擇!
