一種新的肝細胞癌焦亡相關預后模型
A Novel Pyroptosis-related Prognostic Model for Hepatocellular Carcinoma

摘要:
肝細胞癌(HCC)由于其顯著的異質性和復雜的分子發(fā)病機制而成為第二致命的惡性腫瘤。迫切需要新的預后生物標志物,因為目前對于 HCC 患者不存在有效且可靠的預后生物標志物。越來越多的證據(jù)表明,細胞焦亡在惡性腫瘤的發(fā)生和發(fā)展中發(fā)揮作用。然而,焦亡相關基因(PRGs)與HCC患者預后之間的關系仍不清楚。在這項研究中,從以前的研究和 GeneCards 中獲得了 57 個 PRG。HCC患者的基因表達譜和臨床數(shù)據(jù)來自公共數(shù)據(jù)門戶。使用 TCGA 數(shù)據(jù)進行最小絕對收縮和選擇算子 (LASSO) Cox 回歸分析以建立風險模型。此外,該風險模型在獨立的 ICGC 數(shù)據(jù)集中得到進一步驗證。我們的結果表明,在 TCGA 隊列中,39 個 PRG 在腫瘤和正常肝組織之間存在顯著差異表達。功能分析證實這些 PRG 富含細胞焦亡相關途徑。根據(jù)單變量 Cox 回歸分析,14 個差異表達的 PRG 與 TCGA 隊列中 HCC 患者的預后相關。構建了一個整合兩個 PRG 的風險模型,將患者分為不同的風險組。在 TCGA 的高危組中觀察到總生存率較差(功能分析證實這些 PRG 富含細胞焦亡相關途徑。根據(jù)單變量 Cox 回歸分析,14 個差異表達的 PRG 與 TCGA 隊列中 HCC 患者的預后相關。構建了一個整合兩個 PRG 的風險模型,將患者分為不同的風險組。在 TCGA 的高危組中觀察到總生存率較差(功能分析證實這些 PRG 富含細胞焦亡相關途徑。根據(jù)單變量 Cox 回歸分析,14 個差異表達的 PRG 與 TCGA 隊列中 HCC 患者的預后相關。構建了一個整合兩個 PRG 的風險模型,將患者分為不同的風險組。在 TCGA 的高危組中觀察到總生存率較差(p?< 0.001) 和 ICGC (?p?< 0.001) 患者。受試者工作特征曲線證明了模型的準確性。此外,風險評分通過多變量 Cox 回歸分析被確認為獨立的預后指標(TCGA 隊列:HR = 3.346,p?< 0.001;ICGC 隊列: HR = 3.699,?p?< 0.001)。此外,單樣本基因集富集分析揭示了高風險和低風險群體之間的不同免疫狀態(tài)。總之,我們新的細胞焦亡相關風險模型在預測 HCC 患者的預后方面具有潛在的應用價值。
關鍵詞:肝細胞癌,細胞焦亡,預后模型,風險評分,腫瘤免疫
結果
TCGA 隊列中差異表達的 PRG 及其功能分析
我們從先前的研究中獲得了 57 個 PRG,并分析了這些基因在 TCGA 的 371 名 HCC 患者中的表達水平(Xia 等人,2019 年)。根據(jù)FDR<0.05的篩選標準,39個PRGs在腫瘤和正常肝組織之間存在顯著差異表達。如箱線圖所示,IL1B、MST1、GBP1和NLRP3在腫瘤組織中下調,其他 35 個 PRG 在腫瘤組織中上調。圖 1A)。此外,還進行了 GO 和 KEGG 分析以研究這些差異表達的 PRG 的生物學功能。GO功能分析結果表明,凋亡過程中細胞因子產(chǎn)生、炎性體復合物和內(nèi)肽酶活性的正調控分別是生物學過程、細胞成分和分子功能類別中最豐富的GO術語。圖 1B)。在KEGG通路分析中,PRGs主要富集于細胞焦亡相關通路,如NOD樣受體信號通路(?Fritz et al., 2006?)。此外,PRGs被鑒定參與C型凝集素受體信號通路以及與細菌和病毒感染相關的通路,包括乙型肝炎和丙型肝炎感染。圖 1C)。

差異表達的 PRG 和功能富集分析。(A) HCC 和相鄰正常樣本中 39 個差異表達的 PRG 的表達狀態(tài)。紅色和綠色分別代表腫瘤 (T) 和鄰近的正常組織 (N)。(B) 39 個差異表達的 PRG 的 GO 功能分析(BP:生物過程,CC:細胞成分,MF:分子功能)。(C) 39 個差異表達的 PRG 的 KEGG 通路分析。
TCGA 隊列中預測特征的構建
在排除沒有生存信息的病例和隨訪時間為 0 天的病例后,進行單變量 Cox 回歸分析以評估 TCGA 隊列中 365 名 HCC 患者的 PRG 表達與 OS 之間的相關性。結果表明,18 個 PRG 與 HCC 患者的預后顯著相關(p?< 0.05)(補充圖 S1)。我們分析了參與我們研究的患者的臨床病理學特征表格1.?我們選擇了 14 個差異表達且與 HCC 患者的 OS 顯著相關的 PRG(圖 2A-C)。這些基因之間的相關網(wǎng)絡被建立并呈現(xiàn)在圖 2D.?然后,進行 LASSO Cox 回歸分析,以確定具有最佳預測性能的標志物并計算回歸系數(shù)。因此,確定了GSDME和PLK1以建立風險模型。每位患者的風險評分計算如下:風險評分 = 0.1475 × GSDME 的表達水平+ 0.2859 ×?PLK1的表達水平。根據(jù)中位風險評分,將 HCC 患者分為高危組和低危組(圖 3A)。隨著風險評分的增加,死亡發(fā)生率增加(圖 3B)。PCA 和 t-SNE 結果表明,具有不同風險狀態(tài)的患者聚集在兩個區(qū)域(圖 3C、D)。此外,Kaplan-Meier 生存曲線顯示,風險評分高的患者的 OS 比風險評分低的患者差(p?< 0.001)(圖 3E)。生成時間依賴性 ROC 曲線以評估模型預測 TCGA 隊列中 HCC 患者預后的準確性,1 年、2 年和 2 年的曲線下面積(AUC)分別為 0.727、0.693 和 0.674。 3年,分別(圖 3F)。



在 ICGC 隊列中進一步驗證模型
為了進一步評估 TCGA 隊列中建立的雙基因特征的穩(wěn)健性,ICGC 隊列中 HCC 患者的風險評分也根據(jù)相同的公式計算。然后,根據(jù)中位風險評分將ICGC病例分為高危組和低危組(圖 4A)。同樣,死亡人數(shù)隨著風險評分的增加而增加(圖 4B)。PCA和t-SNE分析證實了風險評分的分類能力(圖 4C、D)。一致地,Kaplan-Meier 圖顯示高風險評分也與 ICGC 隊列中較差的 OS 顯著相關(p?< 0.001)(圖 4E)。從 ROC 曲線分析獲得的 1 年 0.716、2 年 0.711 和 3 年 0.726 的 AUC 表明,該模型準確地預測了 ICGC 數(shù)據(jù)庫中 HCC 患者的預后。圖 4F)。

模型的獨立預測能力
為了評估特征作為獨立預后指標的能力,在單變量和多變量 Cox 回歸分析中包括了多個變量。結果,單變量 Cox 回歸分析顯示,在 TCGA 和 ICGC 隊列中,較高的風險評分預測 HCC 患者的 OS(HR = 4.197, 95% CI:2.498–7.050,?p?< 0.001; HR = 4.806, 95% CI : 4.354–9.811,?p?< 0.001, 分別) (圖 5A、B)。在多變量分析中,風險評分被進一步證明是 TCGA 和 ICGC 患者的獨立預測因子(HR = 3.346, 95% CI: 1.968–5.689,?p?< 0.001; HR = 3.699, 95% CI: 1.823–7.504,?p?< 0.001,分別)(圖 5C、D)。

基于 TCGA 和 ICGC Cohorts 模型的功能分析
進行GO和KEGG分析以分析與風險模型相關的生物學功能。分析中包括高風險組和低風險組之間的差異表達基因。前 5 個 GO 術語和 KEGG 結果顯示在表 2.?這些基因富含與細胞周期相關的幾種功能,例如有絲分裂核分裂、核分裂和染色體分離。腫瘤免疫是影響癌癥進展的重要因素。因此,我們還研究了風險模型與腫瘤免疫之間的相關性。用 ssGSEA 量化免疫細胞和免疫相關通路的水平。在 TCGA 隊列中,aDC、iDC、巨噬細胞、Tfh 細胞、Tregs 和 MHC I 類的得分顯著更高,而 B 細胞、肥大細胞、NK 細胞、I 型 IFN 反應和 II 型 IFN 反應顯著降低高危組比低危組(圖 6A、B)。在 ICGC 隊列中,aDC、DC、巨噬細胞、Th2 細胞、Treg、APC 共抑制和 HLA 的得分顯著更高,而 B 細胞、NK 細胞、I 型 IFN 反應和 II 型 IFN 反應顯著降低高危組比低危組(圖 6C、D)。

