雙硫+機(jī)器學(xué)習(xí),在乳腺癌中機(jī)器學(xué)習(xí)識(shí)別雙硫死亡相關(guān)模型
?預(yù)測(cè)簽名的構(gòu)建
聚類 A 和聚類 B 之間總共有 239 個(gè) DEG,其中包括 71 個(gè)與預(yù)后相關(guān)的雙硫死亡-DEG,被選擇進(jìn)行單變量 Cox 回歸分析。然后通過基于訓(xùn)練隊(duì)列的 LASSO 回歸分析開發(fā)了四種雙硫死亡-DEG 的預(yù)后特征。然后我們?cè)诩?xì)胞水平驗(yàn)證了四種雙硫死亡-DEG 的表達(dá)水平。KIF21A和ALOX15B在癌細(xì)胞中低表達(dá),APOD在癌細(xì)胞中高表達(dá),并且ELOVL2表達(dá)在癌細(xì)胞和正常細(xì)胞之間沒有顯著差異(。集群 B 的風(fēng)險(xiǎn)評(píng)分高于集群 A。除NDUFA11外,九個(gè) DRG 的表達(dá)在高風(fēng)險(xiǎn)組和低風(fēng)險(xiǎn)組之間存在差異。在這九個(gè)基因中,NUBPL在高危組中低水平表達(dá),而其余八個(gè)基因在高危組中高表達(dá)

結(jié)果
BC雙硫死亡相關(guān)基因遺傳變異分析及篩選
我們鑒定了 10 個(gè)與雙硫死亡密切相關(guān)的基因(?NCKAP1、LRPPRC、NDUFS1、GYS1、SLC3A2、RPN1、SLC7A11、OXSM、NDUFA11和NUBPL )。我們首先確定了 BC 樣本中的體細(xì)胞突變水平、CNV、基因表達(dá)水平和 DRG 的預(yù)后價(jià)值。
這些基因中的體細(xì)胞突變并不普遍。987 個(gè)樣本中,有 47 個(gè)樣本存在 DRG 體細(xì)胞突變,頻率為 4.76%。其中,NCKAP1、LRPPRC、NDUFS1、GYS1的突變頻率最高。通過調(diào)查 CNV 的頻率,我們注意到 DRG 在 CNV 中存在廣泛的改變,并且大多數(shù)基因的增益狀態(tài)高于丟失狀態(tài)。顯示 CNV 擴(kuò)增的主要基因是SLC3A2和NUBPL。相比之下,NDUFA11的 CNV 缺失數(shù)量最多。然后我們分析了這 10 個(gè)基因在癌癥及其鄰近正常組織中的表達(dá)水平。NDUFA11、LRPPRC、SLC7A11、SLC3A2、OXSM和RPN1在癌組織中表達(dá)水平較高,而NDUFS1和NUBPL表達(dá)水平較低(p?< 0.01)。NCKAP1和GYS1的表達(dá)在癌組織和癌旁正常組織中沒有顯著差異。OS分析顯示, NDUFA11高表達(dá)組和NDUFS1、SLC7A11、OXSM、NCKAP1、LRPPRC低表達(dá)組預(yù)后較好(p?< 0.05)。NUBPL、RPN1和SLC3A2表達(dá)組之間的 OS 沒有顯著差異。

雙硫死亡相關(guān)基因的基因突變、拷貝數(shù)變異(CNV)、差異表達(dá)和生存分析。(A)瀑布圖顯示基因突變頻率和基因突變類型。(B,C)條形圖和馬戲團(tuán)顯示了CNV頻率和雙硫死亡相關(guān)基因在染色體上的位置。(D)正常樣本和乳腺癌樣本之間的基因表達(dá)分析。(E)基因高表達(dá)和低表達(dá)之間的 K-M 生存分析。**?p?< 0.01,***?p?< 0.001。
BC 特異性 DRG 的鑒定和不同的表達(dá)模式
單變量 Cox 回歸分析確定了三個(gè)主要遺傳風(fēng)險(xiǎn)因素:LRPPRC、NDUFS1和SLC7A11?(?p?< 0.01)。通過八個(gè) DRG、六個(gè)預(yù)后 DRG 和來自單變量 cox 回歸分析的三個(gè)風(fēng)險(xiǎn)因素的交叉,確定了三個(gè) BC 特異性 DRG。這些是基因NDUFS1、LRPPRC和SLC7A11?;谶@些基因,對(duì)整個(gè)隊(duì)列進(jìn)行無監(jiān)督共識(shí)聚類,并將整個(gè)隊(duì)列中的 BC 患者分為 A 組和 B 。PCA 顯示 BC 樣本可以根據(jù)不同的表達(dá)模式進(jìn)行區(qū)分,并且我們的 KM 生存曲線顯示 A 簇的中位 OS 優(yōu)于 B 簇()。

不同雙硫死亡相關(guān)表達(dá)模式的構(gòu)建。(A)雙硫死亡相關(guān)基因之間的單變量Cox回歸和相關(guān)性分析。(B)根據(jù)差異表達(dá)分析、單變量 Cox 回歸分析和 K-M 生存分析的結(jié)果顯示共享基因的維恩圖。(C)使用共識(shí)聚類矩陣 (?k = 2) 將乳腺癌 (BC) 患者分為兩個(gè)聚類。(D)具有累積分布函數(shù) (CDF) 的共識(shí)聚類模型,k 范圍為 2-9。(E)集群 A 和 (B) 之間的 KM 生存分析(F)熱圖顯示了每個(gè)不同簇中臨床病理因素的差異。
表達(dá)模式與BC分子亞型的相關(guān)性
我們構(gòu)建了一個(gè)熱圖,顯示集群 A 和 B 之間臨床因素的差異。為了進(jìn)一步探討乳腺癌分子亞型與我們確定的表達(dá)模式之間的關(guān)系,我們繪制了?;鶊D和KM生存曲線。結(jié)果顯示,在A簇中,Luminal A、Luminal B、HER2和Basel亞型的患者分別占60.4%、17.4%、8.8%和13.4%。在B簇中,luminal A、luminal B、HER2和Basel亞型分別占39.8%、26.0%、5.8%和28.4%。結(jié)果表明,A簇中Luminal A亞型患者比例顯著高于B簇,B簇中Basel亞型患者比例顯著高于A簇。KM生存分析結(jié)果結(jié)果表明,Luminal 亞型 A 簇和 B 簇患者的預(yù)后存在顯著差異,而 HER2 和 Basel 亞型則沒有發(fā)現(xiàn)差異
分析兩個(gè)簇之間的免疫浸潤(rùn)水平分析和功能富集分析
GSVA功能富集分析表明,A簇主要富集于與花生四烯酸和藥物代謝途徑相關(guān)的突變。B簇主要富集于腫瘤相關(guān)途徑(如DNA復(fù)制和細(xì)胞周期)和代謝途徑(如初級(jí)膽汁酸生物合成、嘧啶代謝、半胱氨酸和蛋氨酸代謝、乙醛酸和二羧酸代謝),A簇和B簇之間的免疫細(xì)胞浸潤(rùn)程度明顯不同。觀察到CD56明亮自然殺傷細(xì)胞、未成熟B細(xì)胞、未成熟樹突狀細(xì)胞、MDSC、巨噬細(xì)胞、自然殺傷T細(xì)胞、濾泡輔助T細(xì)胞和1型輔助T細(xì)胞。A簇的免疫細(xì)胞浸潤(rùn)高于B簇。PCA分析顯示A簇和B簇能夠更好地將患者區(qū)分為不同組。因此,我們進(jìn)一步探討了兩個(gè)集群之間的差異(圖3C)。在 A 簇和 B 簇之間鑒定出 239 個(gè)雙硫死亡DEG。雙硫死亡-DEGs的GO和KEGG富集分析表明,這些基因主要富集于細(xì)胞分裂相關(guān)通路(如核分裂、有絲分裂核分裂和染色體分離。KEGG分析結(jié)果顯示,二硫鍵-DEG在癌癥相關(guān)通路(如細(xì)胞周期、p53信號(hào)通路、ECM-受體相互作用等)顯著富集;

預(yù)測(cè)簽名的構(gòu)建
聚類 A 和聚類 B 之間總共有 239 個(gè) DEG,其中包括 71 個(gè)與預(yù)后相關(guān)的雙硫死亡DEG,被選擇進(jìn)行單變量 Cox 回歸分析。然后通過基于訓(xùn)練隊(duì)列的 LASSO 回歸分析開發(fā)了四種雙硫死亡DEG 的預(yù)后特征。然后我們?cè)诩?xì)胞水平驗(yàn)證了四種雙硫死亡-DEG 的表達(dá)水平。KIF21A和ALOX15B在癌細(xì)胞中低表達(dá),APOD在癌細(xì)胞中高表達(dá),并且ELOVL2表達(dá)在癌細(xì)胞和正常細(xì)胞之間沒有顯著差異。集群 B 的風(fēng)險(xiǎn)評(píng)分高于集群 A。除NDUFA11外,九個(gè) DRG 的表達(dá)在高風(fēng)險(xiǎn)組和低風(fēng)險(xiǎn)組之間存在差異。在這九個(gè)基因中,NUBPL在高危組中低水平表達(dá),而其余八個(gè)基因在高危組中高表達(dá)
雙硫死亡相關(guān)預(yù)后特征的驗(yàn)證
高風(fēng)險(xiǎn)組的風(fēng)險(xiǎn)評(píng)分高于低風(fēng)險(xiǎn)組,并且訓(xùn)練和測(cè)試隊(duì)列以及所有隊(duì)列中的死亡人數(shù)隨著風(fēng)險(xiǎn)評(píng)分的增加而增加。熱圖顯示了高風(fēng)險(xiǎn)組和低風(fēng)險(xiǎn)組之間雙硫死亡-DEGs 的差異表達(dá)。其中,KIF21A在高危組中高表達(dá),而APOD、ALOX15B和ELOVL2在低危組中高表達(dá)

評(píng)估預(yù)后特征的獨(dú)立作用并構(gòu)建預(yù)后預(yù)測(cè)的預(yù)測(cè)列線圖
我們還證實(shí),低風(fēng)險(xiǎn)組的總生存期(OS)顯著長(zhǎng)于高風(fēng)險(xiǎn)組(p?< 0.05)。我們還探討了 BC 不同分子亞型的預(yù)后模型的預(yù)后價(jià)值的一致性。我們發(fā)現(xiàn)在Luminal和Her2亞型中,高危組的PFS和DSS比低危組差。巴塞爾亞型高、低組的預(yù)后無差異,這可能是由于低危組患者數(shù)量較少(巴塞爾亞型低危組和高危組的患者數(shù)量相同)。風(fēng)險(xiǎn)組分別為 14 和 175)。然而,我們發(fā)現(xiàn)在KM生存曲線中,低風(fēng)險(xiǎn)組的7年P(guān)FS和DSS也明顯優(yōu)于高風(fēng)險(xiǎn)組??偟膩碚f,預(yù)后模型對(duì)于 BC 的不同分子亞型具有良好的預(yù)后價(jià)值。預(yù)后特征的 AUC 表明該模型具有良好的預(yù)測(cè)準(zhǔn)確性。列線圖是預(yù)測(cè) BC 患者臨床結(jié)果的另一種定量模型。因此,根據(jù)風(fēng)險(xiǎn)評(píng)分和其他臨床特征(例如年齡、疾病階段和分子亞型)開發(fā)列線圖,以便計(jì)算每位 BC 患者 1 年、3 年和 5 年的生存概率。用于折線圖內(nèi)部驗(yàn)證的校準(zhǔn)圖顯示預(yù)測(cè)的 OS 結(jié)果與實(shí)際觀察結(jié)果之間具有良好的一致性

?免疫細(xì)胞浸潤(rùn)、TMB、RNAss、藥敏分析
我們使用 CIBERSORT 算法計(jì)算了 22 個(gè)免疫細(xì)胞的浸潤(rùn)水平與我們識(shí)別的雙硫死亡-DEG 之間的相關(guān)性。其中,APOD和幼稚 B 細(xì)胞以及ELOVL2和靜息肥大細(xì)胞顯示出顯著的正相關(guān)。APOD和 M0 巨噬細(xì)胞,以及ELOVL2和 CD4 靜息記憶 T 細(xì)胞呈負(fù)相關(guān)。然后我們分析了腫瘤微環(huán)境(TME)中基質(zhì)細(xì)胞免疫細(xì)胞的含量與風(fēng)險(xiǎn)評(píng)分之間的相關(guān)性。低風(fēng)險(xiǎn)組顯示出較高的基質(zhì)分?jǐn)?shù)和估計(jì)分?jǐn)?shù)。接下來,我們分析了高風(fēng)險(xiǎn)組和低風(fēng)險(xiǎn)組之間的 TMB 是否存在差異。結(jié)果顯示,高危組的TMB頻率高于低危組。TMB 與風(fēng)險(xiǎn)評(píng)分呈正相關(guān)。在BC中,20個(gè)突變頻率高的基因的TMB在高風(fēng)險(xiǎn)組和低風(fēng)險(xiǎn)組之間存在顯著差異。例如, PIK3CA的突變頻率在高風(fēng)險(xiǎn)組和低風(fēng)險(xiǎn)組中分別為 23% 和 46%。TP53在 46% 的高風(fēng)險(xiǎn)組和 18% 的低風(fēng)險(xiǎn)組中發(fā)生突變。在腫瘤干性分析中觀察到 RNAss 與風(fēng)險(xiǎn)評(píng)分之間呈正相關(guān)。藥敏分析結(jié)果顯示,低危組對(duì)順鉑、環(huán)磷酰胺、多西他賽、拉帕替尼、紫杉醇、他莫昔芬的敏感性高于高危組,而高危組對(duì)瑞博西尼的藥物敏感性為高于低危組,有助于指導(dǎo)臨床治療的選擇
