脂質(zhì)代謝+非編碼RNA+干濕結(jié)合,多種機器學習算法篩選預后基因
生信文章好發(fā)不好發(fā),關(guān)鍵看研究創(chuàng)新性有多高。常規(guī)思路,過時的研究對象,好發(fā)才怪呢。。。。
新穎的研究思路,巧妙的研究設(shè)計,前沿的研究方向,這些都是優(yōu)秀文章的加持項。
嗯?這些你都知道,但不知道怎么去找呢?還沒有參考思路?
快來關(guān)注生信鳥公眾號吧!!這里可以滿足你的所有發(fā)文章的要求,幫你實現(xiàn)快速發(fā)文的夢想,快來上車吧?。?!

布小谷就拿今天這篇4.3分+的文章為例,給大家簡單分析一下生信發(fā)文的思路和研究設(shè)計。本文將脂質(zhì)代謝和microRNA結(jié)合起來研究miRNAs在前列腺癌中的預后價值,采用多種機器學習算法篩選有預后價值的miRNAs,另外采用干濕結(jié)合的研究方法,使故事更加真實。看著每張圖都很簡單,連起來后整個故事非常完整,邏輯清晰。


題目:脂質(zhì)代謝相關(guān)miRNAs在前列腺癌癥中的潛在診斷作用
雜志:Lipids Health Dis.
影響因子:IF=4.321
發(fā)表時間:2023年3月
研究背景
前列腺癌癥(PCa)是世界上第二大男性實體腫瘤,其死亡率大大增加。脂質(zhì)代謝對腫瘤生長的影響已經(jīng)有研究,但脂質(zhì)代謝紊亂與前列腺癌相關(guān)的機制在很大程度上仍然難以捉摸。
數(shù)據(jù)來源

研究思路
從TCGA-PRAD中篩選差異表達基因并與脂質(zhì)代謝相關(guān)基因取交集,得到差異表達的脂質(zhì)代謝相關(guān)基因(DE-LMRGs)。再從TCGA-PRAD中篩選差異表達miRNAs并與DE-LMRGs進行相關(guān)性分析得到差異表達的脂質(zhì)代謝相關(guān)miRNAs(DE-LMRMs),然后與在GSE45604表達的miRNAs取交集得到穩(wěn)定表達的DE-LMRMs。接著應用最小絕對收縮和選擇算子(LASSO)、極限梯度增強(XGBoost)和支持向量機遞歸特征消除(SVM-RFE)算法來選擇特征miRNAs,并構(gòu)建脂質(zhì)代謝相關(guān)診斷模型。隨后使用qRT-PCR驗證所選DE-LMRMs在前列腺癌和良性前列腺增生標本中的表達水平。此外,構(gòu)建了轉(zhuǎn)錄因子-miRNA-mRNA網(wǎng)絡。
主要結(jié)果
1. 前列腺癌中DE-LMRGs的鑒定
從TCGA-PRAD中鑒定出519個DEGs,包括157個上調(diào)和362個下調(diào)的mRNA(圖1A)。與脂質(zhì)代謝相關(guān)基因取交集得DE-LMRGs(圖1C)。


圖1?前列腺癌中DE-LMRGs的鑒定
2. 前列腺癌中DE-LMRMs的鑒定
從TCGA-PRAD中鑒定出56個DEMs,包括48個上調(diào)和8個下調(diào)的miRNA(圖2A)。隨后,以?R <?-0.3和P?<?0.05為標準對DEMs和DE-LMRGs進行相關(guān)性分析,得到47個與脂質(zhì)代謝密切相關(guān)的DE-LMRMs,再與在GSE45604表達的miRNAs取交集得27個穩(wěn)定表達的miRNA用于進一步分析(圖2D)?


圖2 前列腺癌中DE-LMRMs的鑒定
3. 前列腺癌關(guān)鍵診斷miRNA的鑒定和驗證
為了篩選關(guān)鍵的診斷miRNA,首先進行ROC分析以初步縮小診斷miRNA的范圍,得到25個miRNAs(圖3A)。隨后,通過LASSO回歸、SVM-RFE算法、和XGBoost算法篩選并取交集到7個關(guān)鍵的診斷miRNA(圖3G)。為了驗證診斷特征的預測能力,對訓練集和驗證集繪制基于7個關(guān)鍵診斷miRNA的ROC曲線,結(jié)果顯示AUC值分別為0.99和1(圖3H和I)。具體而言,每個關(guān)鍵的診斷miRNAs在兩個數(shù)據(jù)集之間也表現(xiàn)出優(yōu)異的區(qū)分能力(圖3J和K)。qRT-PCR結(jié)果顯示,7種關(guān)鍵診斷miRNA在前列腺癌組織中的表達水平與前列腺增生組織相比存在顯著差異(圖4)。




圖3?前列腺癌關(guān)鍵診斷miRNA的鑒定和驗證

圖4?前列腺癌和前列腺增生組織中7種關(guān)鍵診斷miRNAs的表達水平
4. TF-miRNA-mRNA網(wǎng)絡與預后分析
通過StarBase和miRNET數(shù)據(jù)庫預測關(guān)鍵miRNAs靶基因,并分別與上調(diào)和下調(diào)DE-LMRGs取交集,得到76個下調(diào)和2個上調(diào)的靶基因,將其用于構(gòu)建miRNA-mRNA調(diào)控網(wǎng)絡(圖5A-B和D)。類似地,預測到miR-200c-3p的兩個TF結(jié)合位點,即GATA3和SANI2(圖5E-F)。隨后整合miRNA-TF(圖5F)和miRNA-mRNA網(wǎng)絡(圖5D)得到25個靶向mRNA以及miR-200c-3p的2個TF結(jié)合位點來構(gòu)建TF-miRNA-mRNA網(wǎng)絡(圖5G)。




圖5 TF-miRNA-mRNA調(diào)控網(wǎng)絡的建立
文章小結(jié)
這篇文章將脂質(zhì)代謝相關(guān)基因和非編碼RNA聯(lián)系起來篩選預后靶標,設(shè)計巧妙,采用干濕結(jié)合的研究方法使研究結(jié)構(gòu)完整。這篇文章采用多種機器學習算法(LASSO、SVM-RFE和XGBoost)篩選預后基因,不僅使預后價值更加可靠,也減少了實驗驗證的工作量。整篇文章思路比較新穎,驗證比較充分,發(fā)4分+也是手拿把掐。對這研究思路感興趣的朋友,抓緊行動起來吧!
布小谷之聲
如果您的時間和精力有限或者缺乏相關(guān)經(jīng)驗,并且對生信分析和思路設(shè)計有所需要的話,“生信鳥”非常樂意為您提供如下服務:免費思路評估、付費生信分析和方案設(shè)計以及實驗項目實施等,有意向的小伙伴歡迎咨詢布小谷哦!?
