ceRNA機制過于老套難發(fā)表?結合預后模型搞定5+期刊

近兩年,以“Bioinformatics analysis”為關鍵詞進行檢索,大部分文章都是關于預后模型的構建。看了這些文章后,發(fā)現(xiàn)思路大同小異。特殊一些的,結合了免疫,自噬,鐵死亡等相關基因進行研究。如何在大眾的文章中獨樹一幟呢?是個值得思考的問題。就在這時,一個老朋友,ceRNA,進入我們的視線,看似過氣的它能否與預后模型擦出新的火花?讓我們來看看吧。
本次分享的文獻題目是“Identification of Hub lncRNAs Along With lncRNA-miRNA-mRNA Network for Effective Diagnosis and Prognosis of Papillary Thyroid Cancer”(Hub lncRNA和lncRNA-miRNA-mRNA網(wǎng)絡的鑒定對甲狀腺乳頭狀癌的有效診斷和預后的幫助),發(fā)表于
“Frontiers in pharmacology”,影響因子為5.810分。

分析流程圖
從GEO數(shù)據(jù)庫中獲得4個GEO數(shù)據(jù)集,提取lncRNA數(shù)據(jù);TCGA數(shù)據(jù)庫中提取miRNA和mRNA數(shù)據(jù)。經(jīng)過差異分析,篩選出差異lncRNA,miRNA和mRNA。預測lncRNA-miRNA以及mRNA-miRNA關系對,構建ceRNA網(wǎng)絡。基于該網(wǎng)絡中的RNAs,構建總生存期(OS)和無病生存期(DFS)兩個預后模型,隨后進行驗證。

主要結果
Hub lncRNAs的識別和驗證
四個數(shù)據(jù)集獲得的差異lncRNA數(shù)量:GSE29265,8個差異lncRNA(3上調和5下調);GSE3678,6個差異lncRNA(3上調和3下調);GSE33630,9個差異lncRNA(5上調和4下調);GSE3467:1下調。RRA方法整合上述的差異基因,共獲得5個hub lncRNAs。

這5個hub lncRNAs是SLC26A4-AS1, RNF157-AS1, NR2F1-AS1, ST7-AS1,和MIR31HG。隨后,這些基因的表達水平在四個GEO數(shù)據(jù)集以及GEPIA中進行了驗證,結果表明NR2F1-AS1和MIR31HG在乳頭甲狀腺癌中上調,而其余的lncRNAs在癌癥組織中下調。


為了進一步驗證這5個hub lncRNAs用于標記乳頭甲狀腺癌的潛力,我們基于4個GEO數(shù)據(jù)集和TCGA進行ROC曲線分析,驗證這5個lncRNAs的診斷性能。結果表明對于每個lncRNA,AUC值均大于0.75。因此,這5個hub lncRNAs都是可靠的,并且是標記乳頭甲狀腺癌(PTC)的潛在生物標志物。


驗證5個lncRNAs的診斷性能(2)
lncRNA-mRNA共表達網(wǎng)絡
進一步,篩選了與hub lncRNAs共表達的mRNAs。通過Pearson相關性分析,研究了TCGA中5個lncRNAs和2716個差異mRNAs之間的相互作用。構建的lncRNA-mRNA網(wǎng)絡包括5個lncRNAs和647個mRNAs。出圖中可以看出,SLC26A4-AS1,RNF157-AS1和ST7-AS1與較多的mRNAs具有相互作用,這可能表明三個lncRNA之間通過共享共同的mRNA而存在協(xié)同作用。但NR2F1-AS1單獨具有最多的相互作用mRNA, MIR31HG具有最少的相互作用mRNA。

為了探究該網(wǎng)絡中mRNA的生物功能,我們隨后進行了功能富集分析。這些mRNA被分成常見mRNA和特異mRNA。如果一個mRNA與兩個以上(包括兩個)lncRNAs有相關性的話,定義為常見mRNA;而只與一個lncRNA相關的mRNA被認為是特異mRNA。
常見的mRNA參與甲狀腺激素的生成(GO-BP)和動力蛋白中間鏈結合功能(GO-MF)。 它們通常與甲狀腺激素合成(KEGG)和甲狀腺疾病有關(DO)。
?特異性mRNA主要參與軸突發(fā)生和跨膜受體蛋白酪氨酸激酶活性。它們可能與p53信號通路和乳頭狀癌有關。
lncRNA-miRNA-mRNA ceRNA網(wǎng)絡
通過預測miRNA,得到了lncRNA-miRNA以及miRNA-mRNA關系對,整合后構建lncRNA-miRNA-mRNA ceRNA網(wǎng)絡。該網(wǎng)絡包括17miRNAs,5個lncRNAs和68個mRNAs。

隨后,對該網(wǎng)絡中的mRNA的功能進行預測。結果指出這些mRNA富集在皮膚形態(tài)發(fā)生和皮質類固醇(GO-BP)以及血小板衍生生長因子結合和細胞外基質(GO-MF)。另外,它們與甲狀旁腺功能亢進(KEGG)和甲狀旁腺疾?。―O)有關。

預后signature的構建和生存分析
為了識別具有預后特征的潛在RNAs,我們對網(wǎng)絡中5個lncRNAs,17個miRNAs和68個mRNAs進行了單變量Cox比例風險回歸分析。P<0.05作為閾值篩選與OS以及DFS有關的基因。共有9個mRNAs與DFS有關;4個miRNAs和9個mRNAs與患者的OS顯著相關。為了進一步篩選構建預后模型的最優(yōu)組合,隨后進行了逐步多因素Cox回歸分析。獲得了OS相關的預后模型(PTC-mi1m4),包括了1個miRNA: hsa-miR-1305和4個mRNAs: PAPSS2, SCD, ID4, 和DCBLD2)。DFS相關的預后模型(PTC-m3)包括3個mRNA: TMEM184A, TOB1, 和FADS6。
為了評估這些模型的預測性能,分別對OS和DFS的預后模型進行了驗證。
OS相關預后模型:
根據(jù)risk score的中位數(shù),將所有的患者分為高風險和低風險組。KM分析曲線顯示出低風險組的患者比高風險的患者具有更高的生存率。時間依賴的ROC曲線表明5年和10年的AUC值為0.781和0.823,C指數(shù)為0.755。這些結果表明該模型對預測乳頭甲狀腺癌的OS具有較強的預測能力。
為了進一步評估了該模型的獨立預測能力,我們納入了一些臨床指標(年齡,性別和腫瘤分期)。單因素Cox回歸分析顯示,風險評分、年齡和分期與PTC患者OS相關,但多因素Cox回歸分析顯示,風險評分和年齡是PTC患者OS的獨立預后指標。

DFS相關預后模型:
使用同樣的方法對DFS模型的預測性能和獨立預測能力進行了評估。結果表明該模型對預測PTC的DFS具有較強的預測能力;并且,風險評分和分期是PTC患者DFS的獨立預后指標。

PTC患者的免疫景觀
腫瘤浸潤免疫細胞比例和水平的差異可能代表了不同個體的內在特征,因此我們研究了乳頭狀甲狀腺癌患者的特異性免疫特征。運用CIBERSORT對樣本中22個免疫細胞的比例進行評估。我們觀察到靜息記憶CD4 T細胞的比例最高,而中性粒細胞的比例很低,提示這兩種免疫細胞可能在PTC腫瘤的發(fā)生發(fā)展中起重要作用。

隨后,分別對OS和DFS預后模型中高風險和低風險組免疫細胞比例的差異進行了分析。
在OS模型中,與低?;颊呦啾龋呶;颊咧徐o息記憶CD4 T細胞,巨噬細胞M0和激活的樹突狀細胞的比例顯著升高。另外,CD8 T細胞,濾泡輔助性T細胞和調節(jié)性T細胞(treg)比例在高危患者中比例較低。隨后,對特征性mRNA和免疫細胞進行了Pearson相關分析。結果表明活化樹突狀細胞,巨噬細胞M0和treg不僅在高,低危組存在差異,還與基因表達水平密切相關。

對這3中免疫細胞進行了單因素和多因素Cox回歸分析。結果表明活化樹突狀細胞與PTC患者的OS顯著相關,另外,它的浸潤程度在高危患者中較高。

在DFS模型中,與低危患者相比,高?;颊哽o息樹突狀細胞,巨噬細胞M0,靜息肥大細胞和treg的比例較高;而嗜酸性粒細胞,巨噬細胞M1,活化肥大細胞,單核細胞和靜息記憶CD4 T細胞的比例較低。隨后,對基因和免疫細胞浸潤進行了Pearson相關分析。結果表明巨噬細胞M0,嗜酸性粒細胞,treg和靜息記憶CD4 T細胞不僅與高低風險組有關,還與預后的特征基因有關。

隨后,對差異的4種免疫細胞進行單因素和多因素Cox回歸分析,發(fā)現(xiàn)巨噬細胞M0與PTC的DFS密切相關。

應用CMap分析確定治療藥物
發(fā)現(xiàn)新的有效藥物可能改善PTC患者的預后。在我們的兩個預后模型中,獲得了與PTC預后相關的7個特征mRNA。靶向這些基因的藥物有望在PTC的治療中發(fā)揮巨大的潛力。除2個沒有GPL96探針I(yè)D的外,其余5個mRNA: PAPSS2, TOB1, ID4, SCD, 和DCBLD2,上傳至CMap web工具,以篩選逆轉這5個hub基因表達的化合物。如果連接性得分為負,則表明該化合物抑制了查詢基因的表達。因此,我們確定連接性得分接近-1的前三種生物活性化合物為潛在的PTC治療藥物。共獲得了3種化合物,piolitazone,benserazide和SB-203580。通過文獻檢索,這3個生物活性化合物均可通過靶向5個特征mRNA調控PTC相關的生物過程或通路。


亮點總結
本文有以下幾點創(chuàng)新之處。涉及了多個數(shù)據(jù)庫整合分析(GEO和TCGA),而不是單一數(shù)據(jù)庫。疾病的診斷和預后都進行了分析。另外,基于ceRNA網(wǎng)絡構建了OS和DFS兩個預后模型,相對比較全面。在免疫浸潤分析中,還添加了免疫細胞和基因/預后之間的相關性。最后,還做了藥物預測分析。
整體的分析有邏輯性,每個步驟都不難,可以復刻,這樣能發(fā)到5分+也很不錯!小伙伴們,如果你們也準備研究預后模型而不知道從哪入手的話,可以參考本次分享的文獻哦。
另外,歡迎關注我們,我們會定期分享文獻解讀的視頻以及寫作技巧等干貨。如果有感興趣的內容,可以在評論區(qū)留言提醒小編哦。
