最新6分+非腫瘤純最新6分+非腫瘤純生信思路,告訴你“臨床疾病分組”是分析創(chuàng)新的絕佳

如果你關(guān)注的疾病已經(jīng)有生信文章發(fā)表了,還能再做生信思路嗎?
如果能,怎么做??
看完這篇你就知道了~

小云告訴你解決方法之一就是從疾病本身的分組找創(chuàng)新,分析疾病的亞組。比如只關(guān)注兒童膿毒癥,再比如分析左側(cè)結(jié)腸癌 vs 右側(cè)結(jié)腸癌,或者只關(guān)注腫瘤的晚期(Ⅲ-Ⅳ期)等等。
(沒有思路、不知道怎么創(chuàng)新的來找小云吧,超多新奇的分析思路供你選擇?。?/strong>
但是單純的從疾病分組創(chuàng)新能發(fā)6分+純生信?當然還有機器學習和單細胞來助力。
今天小云要分享的這篇文章有幾個亮點:
亮點一:從疾病不同分期(COPD早期和晚期)角度進行切入分析;
亮點二:2種機器學習算法篩選診斷基因;
亮點三:單細胞數(shù)據(jù)分析關(guān)鍵基因的表達與定位。
快來跟著小云一起學習它的巧妙之處吧。

題目:基于機器學習分析揭示EXPH5作為COPD晚期潛在診斷基因生物標志物
雜志:Computers in biology and medicine
影響因子:6.698
發(fā)表時間:2023年1月
數(shù)據(jù)信息

研究思路
分析慢性阻塞性肺?。–OPD)GEO數(shù)據(jù)集中早期和晚期的差異表達基因(DEGs)。GSEA分析COPD早期和晚期之間的通路。通過LASSO和SVM-RFE篩選出晚期COPD的候選診斷生物標志物EXPH5。ROC曲線評價其診斷準確性。CIBERSORT算法用于評估兩個COPD分期之間組織浸潤免疫細胞的分布。分析診斷標志物EXPH5基因與免疫細胞浸潤的關(guān)系。進一步分析了單細胞轉(zhuǎn)錄組數(shù)據(jù)中EXPH5基因的表達。

分析流程圖
主要研究結(jié)果
1.?篩選COPD早期和晚期的差異表達基因(DEGs),并進行功能分析
對GEO數(shù)據(jù)中早期和晚期COPD樣本進行差異表達分析,并利用metscape數(shù)據(jù)庫進行GO和通路分析(圖1A),還進行了GSEA(圖1B-C),以確定DEGs的生物學功能。


圖1. COPD早期和晚期DEGs的功能分析
2.?通過LASSO和SVM-RFE鑒定EXPH5基因為診斷生物標志物
利用LASSO邏輯回歸算法從DEGs中識別出19個與COPD相關(guān)的基因(圖2A)。使用SVM-RFE算法識別出6個關(guān)鍵基因(圖2B)。兩者取交集獲得4個關(guān)鍵基因(圖2C),并分析它們在COPD早期和晚期的表達水平存在顯著差異(圖2D-G)。


圖2篩選COPD早期和晚期的候選診斷標志物
????使用GSE54837數(shù)據(jù)集作為驗證隊列,驗證四個候選診斷生物標志物的表達水平。其中EXPH5在COPD晚期樣本中的表達水平較早期明顯下調(diào)(圖3A)。ROC曲線評估EXPH5的診斷價值(圖3E-F)。

圖3.診斷基因的驗證和ROC曲線
3.?分析COPD早期和晚期的免疫細胞浸潤,以及EXPH5與浸潤免疫細胞的相關(guān)性
通過CIBERSORT算法計算出COPD早期和晚期免疫細胞浸潤的比例(圖4B)。進一步分析COPD晚期EXPH5表達水平與免疫細胞浸潤的相關(guān)性(圖4A、F)。



圖4. 免疫浸潤分析
4.?EXPH5在單細胞轉(zhuǎn)錄組數(shù)據(jù)中的表達水平
分析COPD單細胞數(shù)據(jù)中EXPH5在細胞簇中的表達。在11種主要細胞類型中,EXPH5在最重要的肺細胞類型AT1和AT2中表達水平最高,而且EXPH5在晚期COPD的AT1和AT2中的表達下調(diào)(圖5)。


圖5. 單細胞轉(zhuǎn)錄組數(shù)據(jù)集中EXPH5基因的表達分析
?
總結(jié)
這篇文章的創(chuàng)新點就是基于疾病的分組進行了分析,再利用機器學習算法篩選診斷基因,并分析了免疫細胞浸潤,最后還利用單細胞數(shù)據(jù)分析了關(guān)鍵基因的表達,以及主要表達在哪一類細胞中。后續(xù)完全可以根據(jù)這個結(jié)果設計課題思路,比如“XX基因調(diào)控XX免疫細胞影響COPD的進展”。
臨床分組的切入角度不同,就可以提高分析的創(chuàng)新性??赐晷≡频姆治?,不知如此巧妙的分析思路有沒有讓你有一點點心動呢?

沒有思路不要緊,小云會幫你找到創(chuàng)新的思路哦!如果你對熱門/潛在熱門方向感興趣,或者想定制創(chuàng)新性思路歡迎直接call小云哦,下一篇生信文章在向你招手!
