5+腫瘤+預(yù)后模型+實驗
非小細胞肺癌(NSCLC)是全球肺癌發(fā)病率的80-85%,是最常見的惡性腫瘤類型。非小細胞肺癌最常見的組織學(xué)亞型是肺腺癌(LUAD),其次是肺鱗狀細胞癌(LUSC),LUAD占非小細胞肺癌病例的40%以上。盡管使用了尖端技術(shù)、策略和治療方法來治療肺癌,但只有17%的肺癌患者能夠存活五年。因此,作者迫切需要開發(fā)一種精確預(yù)測患者生存的方法
1. 膠原風(fēng)險模型的構(gòu)建
為了確定與LUAD預(yù)后相關(guān)的膠原家族蛋白,并找出影響LUAD發(fā)生和進展的關(guān)鍵因素,作者從TCGA數(shù)據(jù)庫下載了598個LUAD樣本的表達譜。本研究的標(biāo)準(zhǔn)是FDR < 0.01,| log (fold change) | > 1。共有44個膠原家族蛋白被納入TCGA-LUAD轉(zhuǎn)錄組數(shù)據(jù)。根據(jù)篩選標(biāo)準(zhǔn),在LUAD患者中有5542個基因顯著差異表達,其中包括26個膠原家族成員。膠原家族26個差異表達基因的表達模式和特征在火山圖和熱圖中呈現(xiàn),其中5個膠原家族基因下調(diào),21個膠原家族基因上調(diào)(圖1A、B)。根據(jù)單變量Cox回歸分析,膠原家族中的6個差異表達基因與OS顯著相關(guān)(圖1C)。通過使用LASSO-Cox回歸分析,進一步研究了這些基因。通過Lasso分析確定了5個最重要的基因,分別是COL1A1、COL4A3、COL5A1、COL11A1和COL22A1(圖1D、E)。根據(jù)多元Cox分析結(jié)果(P < 0.05)(圖1F),COL4A3和COL22A1被證明是獨立的預(yù)后風(fēng)險變量。
圖1 在TCGA-LUAD中鑒定預(yù)后膠原家族基因并構(gòu)建Collagen-Risk模型
2. 在TCGA-LUAD中鑒定預(yù)后膠原家族基因并構(gòu)建Collagen-Risk模型
根據(jù)風(fēng)險評分的中位數(shù)值,將所有LUAD患者分為高風(fēng)險組和低風(fēng)險組。散點圖用于展示風(fēng)險評分的分布以及風(fēng)險評分與生存狀態(tài)之間的關(guān)系,結(jié)果顯示高風(fēng)險組的死亡率較高(圖2A)。在LUAD中,圖2B比較了高風(fēng)險組和低風(fēng)險組中五個膠原家族基因的表達情況。盡管COL4A3在低風(fēng)險組中的表達較高,但COL5A1、COL1A1、COL1A2和COL22A在高風(fēng)險組中的表達上調(diào)。使用K-M生存分析比較了高風(fēng)險組和低風(fēng)險組的OS。根據(jù)研究結(jié)果,高風(fēng)險組的預(yù)后較差(P=0.0019)(圖2C)。為了更好地探索Collagen-Risk評分在LUAD不同病理分期中的預(yù)后意義,作者將LUAD分為早期和晚期,其中I期和II期為早期,III期和IV期為晚期。在早期階段,作者發(fā)現(xiàn)膠原風(fēng)險評分是OS的可靠指標(biāo),高風(fēng)險組的患者預(yù)后明顯較低風(fēng)險組差。(p = 0.01) (圖2D)。在另一個亞組分析中,高風(fēng)險組的患者在晚期階段的OS較低風(fēng)險組更短,但差異在統(tǒng)計學(xué)上不顯著(P=0.05) (圖2E)。
圖2 膠原風(fēng)險模型的特征和預(yù)測意義
3. 膠原風(fēng)險模型的生存分析
首先,作者分析了不同臨床特征的患者中膠原風(fēng)險評分的分布情況,包括性別、病理分期和TNM分期。作者發(fā)現(xiàn),N分期和病理分期較高的患者具有較高的風(fēng)險評分(N 1 vs N 0,p < 0.05;N 2-3 vs N 0,p < 0.05;II期 vs I期,p < 0.01;III/IV期 vs I期,p < 0.01)。男性和女性患者之間的風(fēng)險評分沒有顯著差異,M或T分期的患者之間也沒有顯著差異(P > 0.05)(圖3A)。
圖3 膠原風(fēng)險模型的生存分析
其次,根據(jù)Collagen-Risk評分的中位數(shù),將五個GEO數(shù)據(jù)集中的患者分為高風(fēng)險組和低風(fēng)險組。作者使用五個GEO隊列作為外部驗證集評估了Collagen-Risk評分在預(yù)測OS方面的表現(xiàn)。與TCGA隊列的生存分析一樣,低風(fēng)險組的患者在驗證數(shù)據(jù)集中有更長的生存時間(P=0.0051,GSE11969;P<0.001,GSE72094;P=0.0062,GSE12313;P=0.02,GSE31210;P=0.02,GSE30219)(圖3B-F)。高風(fēng)險組的RFS明顯降低,低風(fēng)險組的RFS,這表明Collagen-Risk評分是LUAD患者RFS的優(yōu)秀預(yù)測指標(biāo)。接下來,為了進一步證明該模型在預(yù)測肺癌預(yù)后方面的優(yōu)越性,作者使用ROC曲線評估了Collagen-Risk模型的能力,在六個數(shù)據(jù)集中,AUC范圍從0.60到0.74(圖3G-L)??傮w而言,時間相關(guān)的AUC表明,在TCGA和GEO數(shù)據(jù)集中,Collagen-Risk評分在預(yù)測LUAD患者OS方面具有相當(dāng)?shù)膬r值。
4. LUAD中膠原風(fēng)險模型的診斷價值
使用單變量和多變量Cox回歸分析來研究膠原風(fēng)險模型對預(yù)后的預(yù)測能力。作者在TCGA和Geo數(shù)據(jù)集中通過單變量和多變量Cox回歸分析評估了膠原風(fēng)險模型的預(yù)后意義。單變量Cox回歸分析的結(jié)果顯示,膠原風(fēng)險分?jǐn)?shù)與TCGA LUAD隊列和5個GEO隊列中的OS顯著相關(guān)(TCGA,HR=2.115,95%CI=1.602-2.792,P<0.001;GSE11969,HR=2.432,95%CI=1.376-4.300,P=0.002;GSE13213,HR=2.514,95%CI=1.413-4.471,P=0.002;GSE30219,HR=2.541,95%CI=1.488-4.342,P<0.001;GSE31210,HR=2.174,95%CI=1.6922.901,P<0.001;GSE372094,HR=2.022,95%CI=1.536-2.663,P<0.001)(圖4A)。多變量Cox回歸分析證實,膠原風(fēng)險分?jǐn)?shù)是TCGA LUAD隊列和四個GEO隊列中OS的重要預(yù)測因子(P<0.001,HR=2.49,95%CI=1.618-3.822,TCGA;P=0.013,HR=2.134,95%CI=1.174-3.880,GSE11969;P=0.014,HR=2.339,95%CI=1.188-4.604,GSE13213;P=0.002,HR=2.479,95%CI=1.411-4.356,GSE30219;P<0.001,HR=2.347,95%CI=1.709-3.223,GSE72094)(圖4A)。與此同時,作者通過單變量和多變量Cox回歸分析,分析了不同數(shù)據(jù)集中包含的臨床特征的預(yù)后價值。在TCGA數(shù)據(jù)集的測試集中,年齡、N分期和風(fēng)險評分被發(fā)現(xiàn)是預(yù)后的獨立因素。在驗證數(shù)據(jù)集中,年齡和風(fēng)險評分在單變量和多變量分析中一致被確定為預(yù)后的獨立預(yù)測因子。此外,單變量和多變量Cox回歸分析表明,膠原風(fēng)險評分是RFS的獨立預(yù)后因子。通過分析TCGA和5個GEO隊列的預(yù)后結(jié)果,進行了一項薈萃分析,以確定膠原風(fēng)險評分與LUAD患者的OS和RFS的關(guān)聯(lián)和預(yù)后意義。通過總體風(fēng)險比(HR),確認膠原風(fēng)險評分是LUAD患者OS的危險因素(總體HR = 2.05,95% CI = 1.68-2.49,P < 0.001)(圖4B)。同樣,膠原風(fēng)險評分是影響兩個GEO隊列中RFS的危險因素(總體HR = 3.10,95% CI = 1.96-4.91,P < 0.001)。
圖4 膠原風(fēng)險模型對LUAD的診斷價值
單變量和多變量Cox分析的結(jié)果顯示,膠原風(fēng)險評分與LUAD患者的總生存期(OS)和無復(fù)發(fā)生存期(RFS)密切相關(guān)。隨后,作者構(gòu)建了一個預(yù)測患者1年、3年和5年生存概率的諾模圖,將膠原風(fēng)險評分與年齡、性別、T分期、N分期、M分期和腫瘤分期等臨床特征結(jié)合在一起(圖4C)。諾模圖的校準(zhǔn)曲線顯示,預(yù)測的生存率與實際1年、3年和5年的生存率密切相關(guān)(圖4D-F)。
5. 與膠原風(fēng)險模型相關(guān)的生物機制
作者已經(jīng)證明了Collagen-Risk模型是LUAD患者重要的預(yù)后因素,并將進一步研究其對預(yù)后的影響機制。作者使用Pearson相關(guān)分析篩選出與膠原標(biāo)志相關(guān)的基因(Pearson | R| > 0.5, p < 0.05)。結(jié)果表明,59個基因與Collagen-Risk模型顯著相關(guān),其中31個基因呈正相關(guān),28個基因呈負相關(guān)(圖5A)。然后,對這些膠原標(biāo)志相關(guān)基因進行GO和KEGG通路富集分析。這些基因的GO-生物過程(BP)分析顯示主要富集在細胞外基質(zhì)組織、骨骼和心血管系統(tǒng)發(fā)育、心血管系統(tǒng)發(fā)育(圖5B)。細胞組成(CC)的變化主要集中在膠原三聚體、細胞外區(qū)域和細胞外基質(zhì)(圖5C)。分子功能(MF)的變化主要集中在蛋白質(zhì)結(jié)合、受體和蛋白酶活性以及細胞外基質(zhì)結(jié)構(gòu)(圖5D)。KEGG信號通路分析顯示,這些基因主要參與了細胞外基質(zhì)受體相互作用、癌癥通路、PI3K-Akts和AGE-RAGE信號通路(圖5E)。通過GSEA分析,利用TCGA-LUAD患者的轉(zhuǎn)錄組數(shù)據(jù)確定了與膠原風(fēng)險評分相關(guān)的信號轉(zhuǎn)導(dǎo)通路。KEGG分析顯示,細胞周期和p53信號通路在高風(fēng)險組中富集(圖5F)。標(biāo)志物分析表明,上皮間質(zhì)轉(zhuǎn)化、未折疊蛋白應(yīng)激、G2M檢查點、有絲分裂紡錘體、糖酵解、MTORC1信號通路、E2F靶點、缺氧和血管生成主要富集在高風(fēng)險組中(圖5G)。
圖5 與膠原風(fēng)險模型相關(guān)的生物機制
6. 膠原蛋白標(biāo)記與免疫標(biāo)記之間的關(guān)系
在這項研究中,使用CIBERSORT算法計算了LUAD患者中22種浸潤免疫細胞的豐度,并且所有樣本中T細胞CD4幼稚型和T細胞Gamma Delta的含量均為0。同時,CIBERSORT結(jié)果中的P < 0.05表明樣本的免疫浸潤分析是可靠的,在淘汰不合格樣本后,剩下了333個LUAD樣本(圖6A、B)。如圖6C所示,低風(fēng)險組和高風(fēng)險組之間的B細胞記憶型、漿細胞、T細胞CD4記憶型靜止型、T細胞CD4記憶型活化型、調(diào)節(jié)性T細胞(Tregs)、單核細胞、巨噬細胞(M0)、巨噬細胞(M1)、巨噬細胞(M2)、靜止型樹突狀細胞和靜止型肥大細胞之間存在顯著差異(圖6C)。此外,作者還使用ESTIMATE算法計算了每個樣本的免疫評分、基質(zhì)評分、估計評分和腫瘤純度。作者發(fā)現(xiàn)基質(zhì)評分、估計評分和膠原風(fēng)險評分與Pearson系數(shù)分別為0.26和0.13之間存在正相關(guān)。然而,腫瘤純度和膠原風(fēng)險評分呈負相關(guān),Pearson系數(shù)為-0.14(圖6D、F、H、J)。高風(fēng)險組的免疫評分和基質(zhì)評分較高,而腫瘤純度較低(圖6E、G、I、K)。
圖6 膠原風(fēng)險評分與免疫特征之間的關(guān)系
腫瘤微環(huán)境(TME)的概念在癌癥研究領(lǐng)域是新的。ECM、與惡性腫瘤相關(guān)的成纖維細胞、血管上皮細胞以及浸潤的免疫細胞構(gòu)成了經(jīng)典的TME。極化的巨噬細胞,包括M1和M2亞型,在最近幾年被發(fā)現(xiàn)在腫瘤增殖、侵襲和轉(zhuǎn)移中起著重要作用。巨噬細胞非??伤埽⒃谔囟ǖ腡ME中形成亞群,主要分為M1和M2類型,具有特定的分子和功能特性。M1對于促進腫瘤生長、侵襲、轉(zhuǎn)移以及創(chuàng)造抑制性免疫環(huán)境至關(guān)重要,因為它能殺死腫瘤細胞并阻止病原體侵入。M2對腫瘤細胞的存活、生長、干細胞特性、侵襲、血管生成和免疫抑制有直接影響。作者深入研究了膠原蛋白標(biāo)記與巨噬細胞浸潤之間的相關(guān)性。高風(fēng)險組和低風(fēng)險組之間的巨噬細胞滲透水平在圖6C中顯示出明顯差異。接下來,作者發(fā)現(xiàn)TCGA隊列中TAM浸潤與膠原風(fēng)險評分之間存在聯(lián)系。M0和M1巨噬細胞浸潤與風(fēng)險評分呈正相關(guān),而M2巨噬細胞浸潤呈負相關(guān)(圖6L,M)。M1的生物標(biāo)志物包括IL1A、Il1b、IL6、NOS2、TLR2、TLR4、CD80和CD86。M2的生物標(biāo)志物包括CSF1R、MRC1、PPARG、ARG1、CD163、CLEC10A、RETNLB、PDCD1LG2和CLEC7A。然后,作者檢查了膠原風(fēng)險評分與M1和M2生物標(biāo)志物之間的關(guān)聯(lián)。M1標(biāo)志物IL1A、IL6和NOS以及M2標(biāo)志物RETNLB和PDCD1LG2都與膠原風(fēng)險評分呈正相關(guān),而TLR2與膠原風(fēng)險評分呈負相關(guān)。因此,膠原特征可能對巨噬細胞浸潤和類型具有預(yù)測價值。
癌相關(guān)成纖維細胞(CAFs)是腫瘤基質(zhì)的主要組成部分。CAFs以多種方式影響腫瘤細胞,如異常分泌細胞外基質(zhì)或重塑細胞外基質(zhì),分泌細胞因子引起代謝重編程,促進血管生成等。最近的研究發(fā)現(xiàn),CAFs對腫瘤細胞的影響是多樣的。生物標(biāo)志物(FAP,POSTN,PDGFRα/β,F(xiàn)SP-1,CD90,Palladin,OPN,AEBP1,TNC,CD10和GPR77)代表了促癌的CAFs。這些細胞可以通過代謝效應(yīng)促進腫瘤發(fā)展,從而促進血管生成和免疫抑制。然而,Meflin+ CAF和CD146+ CAF與患者的病理組織學(xué)特征和預(yù)后密切相關(guān)。因此,作者研究了這些生物標(biāo)志物與膠原風(fēng)險簽名之間的關(guān)系。相關(guān)分析結(jié)果顯示,風(fēng)險評分與促癌和抑癌的CAFs生物標(biāo)志物均呈正相關(guān),表明高風(fēng)險患者中CAFs的活性高于低風(fēng)險患者,進一步證實了CAFs在腫瘤進展中的重要性。然而,需要進一步的基礎(chǔ)研究來解釋這種關(guān)系中涉及的機制。
7. 膠原蛋白標(biāo)志物與免疫治療相關(guān)生物標(biāo)志物和腫瘤突變負荷之間的關(guān)系
近年來,腫瘤免疫療法已成為癌癥研究和治療領(lǐng)域的熱點,并取得了一些有希望和令人鼓舞的成就。對非小細胞肺癌免疫療法的幾項臨床研究的初步結(jié)果表明,免疫療法可能為非小細胞肺癌患者帶來更好的生存益處。隨后,作者研究了35個免疫檢查點的表達與膠原風(fēng)險評分之間的相關(guān)性。結(jié)果表明,膠原風(fēng)險評分與CD70、CD200、PDCD1LG2、SIGLEC15、TNFRSF8、TNFRSF9和TNFSF4呈強正相關(guān),與TNFRSF14和TNFSF15呈強負相關(guān)(圖7A-I)。Wilcoxon檢驗證實了上述9個免疫檢查點在低風(fēng)險組和高風(fēng)險組之間的顯著差異(圖7J)。
圖7 膠原風(fēng)險評分與免疫治療相關(guān)生物標(biāo)志物和TMB之間的關(guān)系
檢查了每個LUAD患者的突變譜。在整個基因組中,前30個最顯著改變的基因包括TP53、TTN、MUC16、CSMD3、RYR2、LRP1B、USH2A、ZFHX4、KRAS、FLG、SPTA1、XIRP2、NAV3、ZNF536、CSMD1、FAT3、ANK2、DAMTS12、COL11A1、PCDH15、MUC17、RYR3、PCLO、TNR、APOB、KEAP1、RR1L1、DNAH9、PTPRD、CDH10(圖7K)。之后,作者計算了每個樣本的TMB,并發(fā)現(xiàn)高風(fēng)險評分組的TMB明顯較高(圖7L)。
8. 預(yù)測基因的實驗數(shù)據(jù)驗證
為了驗證這些結(jié)果,作者檢查了人類LUAD標(biāo)本中五種膠原家族蛋白的轉(zhuǎn)錄水平。作者收集了30例正常組織和LUAD組織。結(jié)果顯示,大多數(shù)腫瘤中五種膠原家族蛋白的表達水平比正常組織高得多(圖8)。
圖8 通過定量實時聚合酶鏈反應(yīng)對LUAD中5個膠原家族基因的表達進行生物學(xué)驗證
總結(jié)
總結(jié)一下,作者在TCGA數(shù)據(jù)庫中確定了一個可靠的預(yù)后膠原蛋白標(biāo)志物。作者首次提出了基于膠原家族成員的預(yù)后模型,并詳細描述了膠原蛋白標(biāo)志物與腫瘤微環(huán)境之間的關(guān)系,這可能為LUAD患者的免疫治療提供預(yù)后信息。這些重要的新發(fā)現(xiàn)將使臨床醫(yī)生能夠更個體化地治療LUAD患者。