干嘛死磕一種疾病,交叉融合才是王道!8+ Frontiers系列的雙疾病純分析文章

今天分享的這個“雙疾病生信分析”套路,分析手段都是比較常規(guī)的方法,也比較好復現(xiàn),還能發(fā)表到Frontiers 8+的期刊上,性價比相當高?。?/p>
發(fā)表時間:2022年7月
發(fā)表雜志:Frontiers in Immunology
影響因子:IF=8.786
文章題目:COVID-19感染和原發(fā)性干燥綜合征潛在致病機制的生物信息學分析
公眾號回復“123”獲取原文
研究背景
臨床統(tǒng)計發(fā)現(xiàn),原發(fā)性干燥綜合征(PSS)患者中COVID-19的患病率顯著較高。然而,其中的機制仍不完全清楚。本研究旨在通過對公共 RNA 測序數(shù)據庫的生物信息學分析,進一步研究這種并發(fā)癥的分子機制。
分析思路

主要結果
1. 共同差異基因的識別
基于GEO2R工具在GSE157103和GSE40611進行差異基因分析,并對差異基因取交集,共獲得40個共有基因(圖1)。

圖1 COVID-19和PSS中共同差異基因的識別
2. GO 和 KEGG 通路分析
為了進一步探索這些共同DEGs 的潛在生物學信息,使用 R 包中的“cluster profiler”包進行 GO 分析和 KEGG 通路富集。GO-BP顯示DEGs主要富集于蛋白結合細胞質、胞質、細胞核和核質(圖2A)。在KEGG途徑富集分析中,前五個重要術語是代謝途徑、嘧啶代謝、細胞周期、丙型肝炎和細胞因子-受體相互作用。這些結果有力地表明,細胞成分和代謝途徑共同參與了兩種炎癥性疾病的發(fā)展和進展(圖2B)。

圖2 共同DEGs 的功能富集分析
3. 共同DEGs的PPI網絡構建和hub基因鑒定
為了進一步揭示共同DEGs編碼的蛋白質之間的潛在關系并識別hub基因,通過STRING篩選DEGs的PPI網絡。PPI網絡包括40個節(jié)點和149條邊,其中PPI富集P值低于1.0e? 16(圖3)。

圖3 PPI網絡和樞紐基因的鑒定
4. Hub基因的鑒定及功效評價
通過應用插入式cytoHubba的七種算法,我們篩選了前20個hub基因。通過維恩圖的交叉,最終確定了12個常見的中樞基因,包括CMPK2、TYMS、RRM2、HERC5、IFI44L、IFI44、IFIT2、IFIT1、IFIT3、MX1、CDCA2和TOP2A(圖4A)。根據GeneMANIA數(shù)據庫,構建了一個復雜的基因相互作用網絡來解讀這些中樞基因的生物學功能,共表達為60.37%,物理相互作用為33.91%,共定位為3.46%,預測為2.15%,路徑為0.10%(圖4B)。確定了與12個hub基因相關的20個基因,結果表明它們主要與I型干擾素應答、病毒應答、病毒基因組復制調控、病毒生命周期調控、病毒壽命周期調控、脫氧核糖核酸代謝過程和腺苷酸轉移酶活性相關。

圖4 CD 和 PAD 中hub基因的鑒定及功效評價
5. TF基因相互作用協(xié)同調控網絡
Networkanalys工具預測可與12個hub基因相互作用的TFs,并繪制了TF基因調控網絡,并通過Cytoscape可視化(圖5)。該網絡包含124個TF、134個節(jié)點和165個邊緣。這些TFs調控網絡中的多個hub基因,這表明TFs與hub基因的高度相互作用。

圖5 12個hub基因相互作用的TFs網絡構建
文章小結
看完這篇文章是不是發(fā)現(xiàn)并沒有什么高難度分析手段,簡簡單單常規(guī)分析也可以發(fā)文,關鍵得選好方向,目前看來,雙疾病關聯(lián)分析是個好思路,非腫瘤疾病之間可以用,非腫瘤和腫瘤間可以用,原發(fā)疾病和并發(fā)癥之間可以用,可謂用途相當廣泛。并且多個疾病就能多些數(shù)據集,數(shù)據多了才能做更多的分析內容,這是個良性循環(huán),所以綜合來講,雙疾病方向是一片藍海,廣闊天地大有作為啊!有想法的朋友盡快上車,一個方向一旦火爆起來,發(fā)文競爭力可就大多了,時不我待呀!
想復現(xiàn)這種思路或者定制更多創(chuàng)新性思路歡迎直接call小云,云生信團隊竭誠為您的科研助力!
