基于m7G相關LncRNA構建乳腺癌預后特征及免疫分析
結(jié)果
差異基因的獲得
我們從 TCGA 數(shù)據(jù)庫中獲得了 1,113 個乳腺癌組織和 113 個正常組織的 RNA-seq 數(shù)據(jù)。使用 Wilcoxon 檢驗比較乳腺癌和非腫瘤組織之間的 DEGs (|log2FC|>1, FDR<0.05)。發(fā)現(xiàn)了17個與m7G相關的基因,包括7個下調(diào)基因和10個上調(diào)基因(圖 1A–C).

構建 BC 中 m7G 相關 lncRNA 的預測特征
我們總共獲得了 1,090 個與 m7G 相關的 lncRNA。根據(jù)單變量 Cox 回歸分析(補充圖 S1),43 個 LncRNA 與 BC 患者的預后有關。與 m7G 相關的九個 lncRNA(LINC01871、AP003469.4、Z68871.1、AC245297.3、EGOT、TFAP2A-AS1、AL136531.1、SEMA3B-AS1、AL606834.2)可用作 BC 患者的預測特征,根據(jù)多元Cox回歸和Lasso回歸分析(圖 2A–C).?其中,(LINC01871、AC245297.3、EGOT、TFAP2A-AS1、AL136531.1、SEMA3B-AS1、AL606834.2)為保護因子,(AP003469.4、Z68871.1)為危險因子。此外,九個m7G相關的lncRNA和臨床病理因素在高風險和低風險人群中的分布也顯示在熱圖上(圖 2D).?結(jié)果顯示,兩組間在性別(p?<0.001)、臨床分期(p?<0.05)、T分期(p?<0.05)、M分期(p?<0.05)、N分期(p?<0.05)上存在差異, 但沒有出現(xiàn)任何顯著的年齡差異。然后,為了顯示 LncRNA 和 mRNA 之間的聯(lián)系,我們使用 Cytoscape 創(chuàng)建了 lncRNA 和 mRNA 的網(wǎng)絡圖(圖 3A), 同時, 我們制作了?;鶊D (圖 3B).?然后根據(jù)多變量 Cox 回歸分析確定的相關系數(shù)確定每位 BC 患者的風險評分,并根據(jù)中位風險評分將患者分為低風險組和高風險組。我們用來確定風險評分的公式如下: RiskScore=(?0.549×LINC01871 expression) + (0.553×AP003469.4 expression) + (0.746×Z68871.1 expression) + (?0.449×AC245297.3 expression) +(-0.458×EGOT 表達)+(-0.665×TFAP2A-AS1 表達)+(-0.642×AL136531.1 表達)+(-0.270×SEMA3B-AS1 表達)+(-0.806×AL606834.2 表達)。

BC 壞死相關 lncRNA 特征的建立。(A)使用十倍交叉驗證,確定最佳轉(zhuǎn)向參數(shù) (logλ)。(B)最小絕對收縮和選擇運算符 (LASSO) 算法對變量選擇的 10 倍交叉驗證。(C) BC 和正常組織中九種 m7G 相關 lncRNA 的表達水平。(D)高風險和低風險人群中的九種預后 m7G 相關 lncRNA 和臨床病理因素分布熱圖??s寫:BC,乳腺癌;m7G,N7-甲基鳥苷;lncRNA,長鏈非編碼RNA;N,淋巴結(jié);M,轉(zhuǎn)移;T,腫瘤。

與N7-甲基鳥苷基因相關的LncRNAs和mRNAs之間的關系。(A)預后 m7G 相關 lncRNA 的共表達網(wǎng)絡。(B)預后性 m7G 相關 lncRNA 的 Sankey 圖。縮寫:lncRNAs,長鏈非編碼RNA;m7G,N7-甲基鳥苷;BC,乳腺癌。
N7-甲基鳥苷相關的 LncRNA 特征與 BC 患者的預后:相關性
首先,為了建立 m7G 相關 lncRNA 譜與 BC 患者預后之間的聯(lián)系,我們進行了 Kaplan-Meier 分析以評估高風險和低風險 BC 組之間的生存期。如圖(圖 4A), 高風險組的 OS 時間明顯短于低風險組。熱力圖、散點圖、風險曲線都是同時繪制的(圖 4B–D),并且可以看出,隨著時間的推移,風險評分越高,BC患者死亡人數(shù)越多,預后越差。之后,我們進行了多變量 ROC 分析以及單變量和多變量 Cox 回歸分析,以查看預測特征是否是 BC 患者預后的可靠預測因子。年齡、TNM 分期、臨床分期和風險評分 (?p?< 0.05) 與 BC 患者的 OS 顯著相關,如單變量 Cox 回歸分析圖所示 (圖 5A).?在 BC 患者中,多變量 Cox 回歸分析顯示年齡和風險評分 (?p?< 0.05) 是 OS 的獨立預測因子 (圖 5B).?用于預測 1 年、3 年和 5 年生存率的 ROC 曲線下面積 (AUC) 值分別為 0.715、0.724 和 0.726(圖 5C),這證明了該特征在預測乳腺癌預后方面的有效性。風險評分的AUC值為0.777,在預測BC患者預后方面高于臨床變量(圖 5D).?通過RiskScore、Kaplan-Meier分析曲線、風險分布、生存結(jié)果、壞死相關lncRNAs在訓練集和測試集的表達情況,使用單一公式進行分析(圖 6A–J),結(jié)果證明了我們的預測模型的準確性。此外,將風險評分模型和臨床變量相結(jié)合以創(chuàng)建精確的預后列線圖(圖 7A).?校準曲線表明 1、3 和 5 年的實際和預期生存率具有良好的一致性(圖 7B–D).

CC患者預后與預測特征的關系。(A) Kaplan-Meier 分析比較了高風險和低風險 BC 患者的 OS。(B) BC 患者的風險評分分布。(C)死亡和存活的具有各種風險評分的患者數(shù)量。橙色表示有多少人死亡,紫色表示有多少人幸存。(D)與 m7G 相關的九個 lncRNA 的表達熱圖??s寫:m7G,N7-甲基鳥苷;lncRNA,長鏈非編碼RNA;BC,乳腺癌;OS,總生存期。

壞死性凋亡相關 lncRNA 預后特征的評估。(A)對臨床特征和風險評分進行單變量 Cox 回歸分析。(B)風險評分和臨床特征進行多變量 Cox 回歸分析。(C)用于預測 1 年、3 年和 5 年生存率的 ROC 曲線。(D)風險評分和臨床病理因素的 ROC 曲線??s寫:m7G,N7-甲基鳥苷;lncRNA,長鏈非編碼RNA;BC,乳腺癌;ROC,接受者操作特征;AUC,曲線下面積;T,腫瘤;N,淋巴結(jié);OS,總生存期。

訓練、測試中 9 個 m7G 相關 lncRNA 特征的預后值。風險曲線(A,B),生存散點圖(C,D),9個lncRNA表達熱圖(E,F(xiàn)),BC患者ROC曲線(G,H),Kaplan-Meier生存曲線(I,J )分別在train、test中的低風險和高風險人群之間。縮寫:m7G,N7-甲基鳥苷;lncRNA,長鏈非編碼RNA;BC,乳腺癌;ROC,接受者操作特征;AUC,曲線下面積。

列線圖的構建。(A)整合臨床病理因素和風險評分的列線圖預測 BC 患者 1、3 和 5 年的 OS。(B – D)校準曲線檢查預測的 1、3 和 5 年生存率是否與當時的實際 OS 率一致。縮寫:OS,總生存期;BC,乳腺癌。
BC 患者預后與各種臨床協(xié)變量和預測特征的關系
根據(jù)臨床病理因素將乳腺癌患者分成許多組,以檢查各種臨床協(xié)變量對 BC 患者預后的影響(圖 8A–L).?對于每個分類,高風險組中 BC 患者的 OS 明顯低于低風險組。這些結(jié)果進一步證明了預測簽名的準確性。

不同臨床病理變量下的風險曲線。(一)年齡。(B)性別。(C , D) T 階段。(E – G) N 階段。(H , I) M 階段。(J – L)階段??s寫:T,腫瘤;N,淋巴結(jié);M,轉(zhuǎn)移。
功能分析
然后我們進行了 KEGG 和 GO 功能富集分析。在 KEGG 分析中(圖 9A), m7G 相關的 lncRNA 主要聚集在細胞周期、原發(fā)性免疫缺陷、Erbb 信號通路、間隙連接、RNA 降解和卵母細胞減數(shù)分裂中。在GO分析中(圖 9B),m7G相關的lncRNAs主要集中在ATP水解活性、T細胞穩(wěn)態(tài)、紡錘體定位、淋巴細胞介導免疫調(diào)節(jié)、適應性免疫反應調(diào)節(jié)和淋巴細胞穩(wěn)態(tài)。

KEGG 和 GO 富集分析。(A) KEGG 富集分析。(B) GO 富集分析??s寫:GO,基因本體論;KEGG,京都基因和基因組百科全書。
免疫系統(tǒng)成分及活性分析
我們研究了風險模型與免疫相關成分之間的關系,因為研究人員最近發(fā)現(xiàn)免疫因素在癌癥中起著重要作用。我們使用ssGESA分析了免疫細胞和免疫通路,結(jié)果顯示(圖 10A) aDCs、B 細胞、CD8?+?T 細胞、NK 細胞、T 輔助細胞和 Th1 細胞在低風險 BC 組中表達更多。在 APC 共刺激、檢查點、HLA、炎癥促進、T 細胞共抑制和 I 型干擾素反應方面,低風險組的免疫功能評分高于高風險組(圖 10B),這表明低風險乳腺癌患者比高風險患者具有更活躍的免疫系統(tǒng)。然后我們分析了免疫檢查點(圖 10C、D),我們從圖中可以看出,幾乎每一個免疫檢查點都被揭示在低危BC組中更加活躍,包括CD274(PDL1)、LAG3、PDCD1(PD1)、TNFRSF18和LGALS9,提示這些個體可能是對免疫療法更敏感。

風險評分和免疫相關因素分析。(A)免疫細胞的相關性分析。(B)免疫相關通路分析。(C) CD274 (PD-L1) 在高危和低危人群中的表達。(D)風險人群中常見免疫檢查點表達的差異??s寫:ssGSEA,單樣本基因集富集分析;PD-L1,程序性細胞死亡配體 1;* p < 0.05;** p < 0.01;*** p < 0.001;ns,不顯著。
藥敏分析
由于低風險 BC 患者對免疫療法更敏感,我們對比了高風險和低風險組之間的藥物敏感性(圖 11A–F),研究結(jié)果顯示,低危BC患者對免疫藥物AZD7762、CCT018159、CGP.60474和化療藥物依托泊苷、吉西他濱反應較好,但對靶向藥物伊馬替尼耐藥。這些結(jié)果證明,研究適合高風險和低風險 BC 組的專門治療計劃是有益的。

藥物敏感性分析。(A) AZD7762 在高風險和低風險人群中的 IC50。(B) CCT018159 在高風險和低風險人群中的 IC50。(C) CGP.60474 在高風險和低風險人群中的 IC50。(D)依托泊苷在高危和低危人群中的 IC50。(E)吉西他濱在高危和低危人群中的 IC50。(F)伊馬替尼在高危和低危人群中的 IC50。縮寫:IC50,半數(shù)最大抑制濃度。
?主成分分析進一步證明m7G相關lncRNA特征的可靠性
使用主成分分析 (PCA) 證實,高風險和低風險 BC 組之間存在差異。這個圖片顯示著 (圖 12A–D),預后風險模型可以區(qū)分高風險和低風險 BC 組,這進一步說明了簽名的準確性。

主成分分析 (PCA)。(A)整個基因表達譜。(B)與 m7G 相關的基因。(C)連接到 m7G 的 LncRNA。(D)基于與 m7G 相關的 lncRNA 的預測特征??s寫:m7G,N7-甲基鳥苷。lncRNA; 長鏈非編碼 RNA。
預測模型與臨床變量的相關性分析
我們使用 TCGA 數(shù)據(jù)庫中的基因表達數(shù)據(jù)和相關臨床數(shù)據(jù)檢查了這些臨床特征與預測特征之間的關系(圖 13A–H): LncRNA AL606834.2與T期相關;lncRNA EGOT與臨床分期和T期相關;lncRNA SEMA3B-AS1與年齡、M期、N期相關;LncRNA TFAP2A-AS1與臨床分期和M期相關。

與 m7G 相關的九個 lncRNA 與臨床特征之間的聯(lián)系。(A) lncRNA AL606834.2 表達與 T 期的關聯(lián)。 (B – D) lncRNA SEMA3B-AS1 表達水平與年齡、M 期、N 期的關聯(lián)。 (E , F) lncRNA EGOT 表達水平與臨床分期的關聯(lián),T期。(G,H) lncRNA TFAP2A-AS1表達水平與臨床分期的關聯(lián),M期。縮寫:m7G,N7-甲基鳥苷;lncRNA,長鏈非編碼RNA;N,淋巴結(jié);M,轉(zhuǎn)移;T,腫瘤。
?BC中m7G相關lncRNA表達的外部驗證
通過 qRT-PCR,我們檢測了 9 個 m7G 相關 lncRNA 在 BC 組織和正常組織中的相對表達水平。結(jié)果表明,AP003469.2 和 Z68871.1 在 BC 組織中顯著增加,而 LINC01871、AC245297.3、EGOT、TFAP2A-AS1、AL136531.1、SEMA3B-AS1 和 AL606834.2 顯著減少(圖 14).?這些結(jié)果與數(shù)據(jù)庫分析的結(jié)果一致。

使用 qRT-PCR 分析鑒定與乳腺癌中 m7G 相關的血漿 lncRNA。血漿AP003469.4 (A)、Z68871.1 (B)、TFAP2A-AS1 (C)、EGOT (D)、AC245297.3 (E)、SEMA3B-AS1 (F)、AL136531.1 ( G)、AL606834.2 (H)、LINC01871 (I)通過 qRT-PCR 在乳腺癌組織和正常組織中測量。* p < 0.05.** p < 0.01。