肺腺癌 RNA 結合蛋白相關預后模型的開發(fā)和驗證

摘要:
RNA結合蛋白(RBPs)失調在多種惡性腫瘤中均有報道,并與癌癥的發(fā)生和發(fā)展有關。然而,RBP 在肺腺癌 (LUAD) 中的作用卻知之甚少。我們從癌癥基因組圖譜 (TCGA) 數(shù)據庫下載了 LUAD 的 RNA 測序數(shù)據,并確定了正常組織和癌癥組織之間不同表達的 RBP。然后,該研究通過一系列生物信息學分析系統(tǒng)地研究了這些 RBP 的表達和預后價值。共鑒定出 223 個不同表達的 RBP,包括 101 個上調和 122 個下調的 RBP。八個 RBP(IGF2BP1、IFIT1B、PABPC1、TLR8、GAPDH、PIWIL4、RNPC3和ZC3H12C)被鑒定為預后相關的中樞基因,并用于構建預后模型。進一步分析表明,基于該模型,高風險亞組患者的總生存期(OS)低于低風險亞組患者。預后模型的時間依賴性接受者操作特征曲線的曲線下面積在 TCGA 隊列中為 0.775,在GSE31210隊列中為 0.814,證實了良好的預后模型。我們還在 TCGA 隊列中建立了基于 8 個 RBP mRNA 和內部驗證的列線圖,顯示出對肺腺癌的良好鑒別能力。
關鍵詞:肺腺癌,RNA結合蛋白,總生存期,預后模型
結果
識別 LUAD 患者中不同表達的 RBP
在這項研究中,我們通過幾種先進的計算方法對 LUAD 中 RBP 的關鍵作用和預后價值進行了系統(tǒng)分析。研究設計如圖所示圖1.?從TCGA下載的肺腺癌數(shù)據庫包含524個腫瘤樣本和59個正常肺組織樣本。R 軟件包用于處理數(shù)據并發(fā)現(xiàn)不同表達的 RBP。共納入1542個RBP[?6?],223個RBP符合本研究篩選標準(P?<0.05,|log2FC)|?>1.0),其中包括 101 個上調和 122 個下調的 RBP。這些不同表達的 RBP 的表達分布顯示在圖 2.


不同表達RBP的GO和KEGG通路富集分析
為了研究確定的 RBP 的功能和機制,我們將這些不同表達的 RBP 分為兩組:上調或下調表達。然后我們將這些不同表達的 RBP 上傳到在線工具 WebGestalt 進行功能豐富分析。結果表明,下調的不同表達的RBPs在與翻譯負調控、RNA磷酸二酯鍵水解、mRNA代謝過程調控、翻譯調控和mRNA加工相關的生物學過程中顯著富集。表格1)。上調的不同表達的RBPs在有機氮化合物生物合成過程、細胞酰胺代謝過程、RNA加工、肽代謝過程和酰胺生物合成過程中顯著富集。表格1)。在分子功能方面,減少的不同表達的 RBP 顯著富集 RNA 結合、mRNA 結合、核糖核酸酶活性、雙鏈 RNA 結合和 mRNA 3'-UTR 結合。表格1(表格1)。通過細胞成分(CC)分析,我們發(fā)現(xiàn)減少的不同表達的RBPs富集于微核糖核蛋白復合物、ELL-EAF復合物、RISC復合物、微核糖核蛋白復合物和核糖核蛋白復合物,上調的不同表達RBPs主要富集。在核糖體、核糖體亞基、核糖核蛋白復合物、大核糖體亞基和胞質核糖體中(表格1)。此外,我們發(fā)現(xiàn)下調的不同表達的 RBPs 主要富集于真核生物中的 mRNA 監(jiān)測途徑、RNA 降解和核糖體生物發(fā)生,而上調的 RBPs 顯著富集于核糖體、剪接體和 RNA 降解。表格1)。

蛋白質-蛋白質相互作用(PPI)網絡構建和關鍵模塊選擇
為了進一步研究不同表達的 RNA 結合蛋白在 LUAD 中的作用,我們使用 Cytoscape 軟件創(chuàng)建了 PPI 網絡,該網絡基于 STRING 數(shù)據庫的數(shù)據包含 197 個節(jié)點和 1484 個邊。圖 3A)。共表達網絡使用 MODE 工具處理,識別可能的關鍵模塊和獲得的第一個重要模塊,由 107 個節(jié)點和 1088 條邊組成(圖 3B)。關鍵模塊 1 中的 RBP 在 mRNA 監(jiān)測途徑、RNA 轉運、RNA 降解、RNA 加工、真核生物中的核糖體生物發(fā)生、核糖核蛋白復合物生物發(fā)生、RNA 結合、肽代謝過程、酰胺生物合成過程和翻譯中非常豐富。
預后相關的 RBP 選擇
從 PPI 網絡中共識別出 197 個關鍵的不同表達的 RBP。為了研究這些 RBP 的預后意義,我們進行了單變量 Cox 回歸分析并獲得了 22 個與預后相關的候選中心 RBP。圖 4)。隨后,通過多重逐步 Cox 回歸分析這 22 個與預后相關的候選中心 RBP,以研究它們對患者生存時間和臨床結果的影響,發(fā)現(xiàn) 8 個中心 RBP 是 LUAD 患者的獨立預測因子。圖 5,表 2)。



預后相關遺傳風險評分模型構建與分析
從多重逐步 Cox 回歸分析中確定的八個中心 RBP 用于構建預測模型。根據以下公式計算每位患者的風險評分:
R?i?s?k?s?c?o?r?e?=?(?0.1362?*?ExpIGF?2?BP?1?)?+?(?1.6799?*?ExpIFIT?1?B?)???????+?(?0.2843?*?ExpPABPC?1?)?+?(?-?0.2663?*?ExpTLR?8?)??????+?(?0.3882?*?ExpGAPDH?1?)?+?0.8073?*?ExpPIWIL?4??????+?(?-?0.3219?*?ExpRNPC?3?)?+?(?-?0.4965?*?ExpZC?3?H?12?C?)?。
然后,我們進行了生存分析以評估預測能力。共有 458 名 LUAD 患者根據中位風險評分分為低風險和高風險亞組。結果表明,與低風險亞組患者相比,高風險亞組患者的 OS 較差(圖 6A)。為了進一步評估八種 RBPs 生物標志物的預后能力,進行了時間依賴性 ROC 分析。我們發(fā)現(xiàn)這個 RBPs 風險評分模型的 ROC 曲線下面積(AUC)為 0.775(圖 6B),這表明它具有中等的診斷性能。表達熱圖、患者的生存狀態(tài)和由低風險和高風險亞組中的 8 個 RBP 組成的簽名的風險評分顯示在圖 6C.?此外,我們評估了在其他 LUAD 患者隊列中具有相似預后價值的八 RBP 預測模型是否將相同的公式用于GSE31210數(shù)據集。我們發(fā)現(xiàn),在GSE31210隊列中,高風險評分的患者的 OS 也比低風險評分的患者差。圖 7A–7C)。這些結果表明預后模型具有更好的敏感性和特異性。


基于八個中心 RBP 的列線圖構建
為了開發(fā) LUAD 預后的定量方法,我們整合了 8 個 RBP 簽名來建立列線圖(圖 8)。基于多變量 Cox 分析,通過使用列線圖中的點標度將點分配給各個變量。我們畫一條水平線來確定每個變量的點,并通過對所有變量的點求和來計算每個患者的總分,并將其標準化為 0 到 100 的分布。我們可以計算 LUAD 患者的估計生存率1、3 和 5 年通過在總點軸和每個預后軸之間繪制一條垂直線,這可能有助于相關從業(yè)者為 LUAD 患者制定臨床決策。此外,我們通過 COX 回歸分析評估了 TCGA 中 LUAD 患者不同臨床特征的預后意義。結果顯示,腫瘤分期、原發(fā)腫瘤部位、P?<0.01) (表3)。然而,我們僅通過多元回歸分析發(fā)現(xiàn)年齡、腫瘤分期和風險評分是與 OS 相關的獨立預后因素(P?<0.01)(表3)。


驗證中心 RBP 的預后價值和表達
為了進一步探索 LUAD 中八個中心 RBP 的預后價值,使用 Kaplan Meier 繪圖儀確定中心 RBP 與 OS 之間的關系。Kaplan Meier-plotter 服務器識別了八個中心 RBP 中的六個(GAPDH、IGF2BP1、PABPC1、PIWIL4、RNPC3 和 TLR8)。對數(shù)秩檢驗結果表明 6 個 RBP 與 LUAD 患者的 OS 相關。圖 9)。為了進一步確定這些中樞 RBP 在 LUAD 中的表達,我們使用來自人類蛋白質圖譜數(shù)據庫的免疫組織化學結果表明,與正常肺組織相比,肺癌中的 IGF2BP1、PABPC1 和 GAPDH 顯著增加。圖 10)。然而,TLR8、PIWIL4和ZC3H12C的抗體染色水平在肺癌組織中相對降低。此外,IFIT1B的蛋白表達在腫瘤和正常肺組織之間沒有顯著差異(圖 10)。
