Q1區(qū)8分+純生信!腫瘤內(nèi)異質(zhì)性加持,且看預(yù)后模型如何轉(zhuǎn)型升級?
腫瘤預(yù)后模型的構(gòu)建套路,大家看過多少了?是不是快視覺疲勞了呢? 那么,路博今天帶來一版轉(zhuǎn)型升級款的腫瘤預(yù)后模型。 保證讓大家眼前一亮~ 今日轉(zhuǎn)型升級的創(chuàng)新點是:腫瘤內(nèi)異質(zhì)性(Intratumour heterogeneity,ITH) 在過去的二十年里,許多研究已經(jīng)評估了從腫瘤和/或鄰近非腫瘤組織的高通量表達(dá)數(shù)據(jù)中建立多種能夠預(yù)測預(yù)后的基因標(biāo)記物,然而距離臨床實踐尚有一段距離,可能是由于重復(fù)性較差,并且缺乏標(biāo)準(zhǔn)化的檢測方法。 腫瘤內(nèi)異質(zhì)性(Intratumour heterogeneity,ITH),就是大多數(shù)類型癌癥臨床應(yīng)用失敗的主要原因之一。因為在多種癌癥類型中,轉(zhuǎn)錄組學(xué)ITH混淆了現(xiàn)有的基于表達(dá)的生物標(biāo)記物,并可能導(dǎo)致抽樣偏差。因此,在預(yù)后標(biāo)志物設(shè)計中,將ITH這一混雜因素排除,對精確醫(yī)學(xué)至關(guān)重要。 當(dāng)看到腫瘤內(nèi)異質(zhì)性在大多數(shù)類型的癌癥中均存在時,路博的小腦袋瓜靈機一動,這不妥妥的套路又來了嘛,換個癌種又是一篇的豈不快哉!路博的生信敏感神經(jīng)立馬做出反應(yīng),迫不及待的想分享給大家啦~ 話不多說,還是用事實說話,來看今天這篇8分+的文章:這篇文章不拘泥于常規(guī)腫瘤預(yù)后模型的構(gòu)建套路,而是通過引入、量化和整合了腫瘤間和腫瘤內(nèi)的異質(zhì)性,開發(fā)了一種克服臨床抽樣偏差的無ITH表達(dá)生物標(biāo)志物(AUGUR)。在整個過程中,不僅包括機器學(xué)習(xí)算法,還有生存分析、基因突變、列線圖構(gòu)建等多角度的分析與驗證。此外,這篇文章的最大亮點是納入了多個具有多區(qū)域腫瘤樣本的大型隊列,數(shù)據(jù)量是非??勾虻模“l(fā)到8分+絕對名副其實??!這個思路在很多腫瘤相關(guān)疾病都很合適,換個疾病快去復(fù)現(xiàn)吧!
(ps:沒有思路、不知道怎么創(chuàng)新的找路博,超多個性化的分析思路供你選擇哦?。?/p>
題目:在肝細(xì)胞癌預(yù)后風(fēng)險分類中,轉(zhuǎn)錄組學(xué)腫瘤內(nèi)無異質(zhì)性標(biāo)志物克服了抽樣偏差
雜志:
JHEP Reports.
影響因子:IF=8.3
發(fā)表時間:2023年3月
研究背景
轉(zhuǎn)錄組學(xué)腫瘤內(nèi)異質(zhì)性(ITH)已被證明在多種癌癥類型中混淆了現(xiàn)有的基于RNA表達(dá)的生物標(biāo)記物,并可能導(dǎo)致抽樣偏差。此外,ITH被認(rèn)為是利用分子生物標(biāo)志物進行患者精確分層的一個未解決的混雜因素。這可能是缺乏臨床合格的肝細(xì)胞癌(HCC)生物標(biāo)記物的原因。因此,本研究旨在尋找一種無ITH的肝細(xì)胞癌預(yù)測標(biāo)志物。
研究思路
利用三個涉及30名患者142個腫瘤區(qū)域的多區(qū)域HCC轉(zhuǎn)錄組數(shù)據(jù)集,探討了ITH對分子生物標(biāo)志物性能的混雜影響,并量化了轉(zhuǎn)錄組異質(zhì)性。設(shè)計了一種基于異質(zhì)性指標(biāo)的從頭策略,使用三個數(shù)據(jù)集,利用機器學(xué)習(xí)算法提取腫瘤中差異表達(dá)的無ITH標(biāo)志物,并提供最大的患者間區(qū)分,從中開發(fā)了一種克服抽樣偏差的監(jiān)測生物標(biāo)志物(一種使用RNA的實用工具;AUGUR)。然后,在3個基于RNA序列的數(shù)據(jù)集和3個基于微陣列的轉(zhuǎn)錄組數(shù)據(jù)集中評估和驗證了AUGUR的預(yù)后和預(yù)測準(zhǔn)確性,并將其與之前報道的13個HCC預(yù)后模型進行了比較。最后,基于AUGUR和TNM分期系統(tǒng)建立并驗證了經(jīng)過良好校準(zhǔn)的諾模圖,以提供更個性化的方法來預(yù)測HCC患者的預(yù)后信息。
主要結(jié)果
1. 腫瘤內(nèi)異質(zhì)性廣泛影響標(biāo)志物表現(xiàn)
在MultiRRnaSeq1隊列、MultiRRnaSeq2隊列或MultiRArray隊列中,對大多數(shù)變異基因的無監(jiān)督分層聚類都顯示出患者的獨立聚類,這表明來自同一腫瘤區(qū)域的聚類一致性,并顯示出比ITH更強的腫瘤間RNA異質(zhì)性(圖1A)。然而,整個轉(zhuǎn)錄組圖譜的PCA分析清楚地揭示了同一HCC不同區(qū)域之間的RNA ITH,例如來自MultiRRnaSeq1隊列中H2、H3、H9和H11的這些樣本沒有特殊的抽樣地理分布(圖1B)。為了評估RNA ITH對分子生物標(biāo)志物性能的影響,首先在MultiRRnaSeq1隊列中使用先前發(fā)表的上皮和免疫相關(guān)HCC ProGESigs研究了患者風(fēng)險偏差(圖1C)。使用與原始研究中相同的風(fēng)險評分計算方法,將腫瘤區(qū)域分為高風(fēng)險或低風(fēng)險,分別有55%和46%的患者表現(xiàn)出不一致的風(fēng)險分類。采用同樣方法,使用細(xì)胞焦亡相關(guān)、DNA甲基化驅(qū)動、突變衍生、微血管侵襲相關(guān)、新血管生成相關(guān)、最廣泛引用的五個基因標(biāo)志物和其他HCC ProGESigs,觀察到平均不一致率為39.9%(圖1D)。不一致的風(fēng)險分類率與標(biāo)志物的基因大小沒有顯著相關(guān)性。這些結(jié)果表明,在不考慮腫瘤異質(zhì)性的情況下,ProGESigs評估HCC患者的預(yù)后風(fēng)險經(jīng)常受到抽樣偏差的影響,這可能導(dǎo)致ProGESig在獨立隊列中的有效性和可重復(fù)性有限,從而潛在地限制了ProGESigs的臨床實用性。
圖1 腫瘤內(nèi)異質(zhì)性廣泛影響標(biāo)志物表現(xiàn)
2. 開發(fā)無ITH HCC預(yù)后標(biāo)志物的從頭策略
使用MultiRRnaSeq1隊列推導(dǎo)每個基因的腫瘤間和腫瘤內(nèi)異質(zhì)性指標(biāo),并根據(jù)其平均值將這兩個異質(zhì)性指標(biāo)分為高或低組,從而形成了HCC的四個RNA異質(zhì)性象限(圖2B)。Q4組中的基因(1477個具有高腫瘤間異質(zhì)性和低ITH的基因)在腫瘤之間表現(xiàn)出高度可變,在腫瘤內(nèi)表現(xiàn)出高度同質(zhì),從而限制了抽樣偏差,并可能促進患者分層(圖2B)。為了在Q4基因集中獲得具有可重復(fù)生存相關(guān)性的基因,從兩個獨立數(shù)據(jù)集(分別為ICGCLIRI-JP和TCGA-LIHC)中獲得的HCC差異表達(dá)基因和預(yù)后基因相結(jié)合,得到了包含34個基因的候選基因集(圖2C)。對于包含HCC和正常肝組織的五個隊列進行差異表達(dá)分析,結(jié)果顯示,這34個基因的表達(dá)都具有顯著差異(圖2D),驗證了這些基因在HCC中普遍失調(diào),而與最初的基因譜平臺無關(guān),因此它們可能在HCC的進展中發(fā)揮關(guān)鍵作用。隨后,使用彈性網(wǎng)絡(luò)算法來縮小34個候選基因的范圍,以去除冗余并選擇最有用的HCC預(yù)后標(biāo)志物,該算法生成了一個不含ITH的12基因預(yù)后標(biāo)記物,稱之為AUGUR(圖2E)。圖1 腫瘤內(nèi)異質(zhì)性廣泛影響標(biāo)志物表現(xiàn)
2. 開發(fā)無ITH HCC預(yù)后標(biāo)志物的從頭策略
使用MultiRRnaSeq1隊列推導(dǎo)每個基因的腫瘤間和腫瘤內(nèi)異質(zhì)性指標(biāo),并根據(jù)其平均值將這兩個異質(zhì)性指標(biāo)分為高或低組,從而形成了HCC的四個RNA異質(zhì)性象限(圖2B)。Q4組中的基因(1477個具有高腫瘤間異質(zhì)性和低ITH的基因)在腫瘤之間表現(xiàn)出高度可變,在腫瘤內(nèi)表現(xiàn)出高度同質(zhì),從而限制了抽樣偏差,并可能促進患者分層(圖2B)。為了在Q4基因集中獲得具有可重復(fù)生存相關(guān)性的基因,從兩個獨立數(shù)據(jù)集(分別為ICGCLIRI-JP和TCGA-LIHC)中獲得的HCC差異表達(dá)基因和預(yù)后基因相結(jié)合,得到了包含34個基因的候選基因集(圖2C)。對于包含HCC和正常肝組織的五個隊列進行差異表達(dá)分析,結(jié)果顯示,這34個基因的表達(dá)都具有顯著差異(圖2D),驗證了這些基因在HCC中普遍失調(diào),而與最初的基因譜平臺無關(guān),因此它們可能在HCC的進展中發(fā)揮關(guān)鍵作用。隨后,使用彈性網(wǎng)絡(luò)算法來縮小34個候選基因的范圍,以去除冗余并選擇最有用的HCC預(yù)后標(biāo)志物,該算法生成了一個不含ITH的12基因預(yù)后標(biāo)記物,稱之為AUGUR(圖2E)。
圖2?開發(fā)無ITH HCC預(yù)后標(biāo)志物的從頭策略
3. 無ITH標(biāo)志物AUGUR在HCC中具有強大的預(yù)測作用
為了研究AUGUR的預(yù)后表現(xiàn),首先使用中位數(shù)風(fēng)險評分將TCGA-LIHC患者分為兩組,發(fā)現(xiàn)AUGUR風(fēng)險評分與死亡率呈現(xiàn)顯著正相關(guān)(圖3A);高AUGUR評分組HCC患者的中位OS間期為3.48年,而低AUGUR評分組HCC患者的OS間期為6.72年。隨后,在另外三個獨立的基于RNA-seq的HCC數(shù)據(jù)集中觀察到相同的結(jié)果,即高AUGUR評分組HCC患者的中位生存間期更短(圖3B-D)。此外,還納入了三個基于微陣列的HCC數(shù)據(jù)集,以評估AUGUR的預(yù)后能力,結(jié)果顯示AUGUR與生存率顯著相關(guān)(圖3E)。在考慮所有訓(xùn)練和測試隊列的meta分析中,AUGUR也顯示出與結(jié)果的顯著相關(guān)性(圖3F)。這些結(jié)果證明了AUGUR在來自不同分析平臺的多個隊列中的預(yù)測性、重復(fù)性和一致性。
4. 無ITH標(biāo)記物AUGUR與其他基因表達(dá)標(biāo)記物的比較
時間相關(guān)ROC曲線和C指數(shù)的結(jié)果表明,AUGUR在1年、3年和5年生存預(yù)測方面優(yōu)于或相當(dāng)于其他13個模型(圖4A-C);尤其是在1年生存率和C指數(shù)AUC方面,AUGUR明顯優(yōu)于其他模型(圖4A)。此外,只有MultiRRnaSeq1納入HCC患者的9%和MultiRRnaSeq2納入HCC患者的14%使用AUGUR表現(xiàn)出不一致的風(fēng)險分類(圖4D-E),這甚至低于Nault等人開發(fā)的最廣泛引用的五個基因標(biāo)志物(圖1D)。此外,AUGUR,與其他標(biāo)志物相比,預(yù)測來自同一患者的多區(qū)域樣本的中位風(fēng)險偏倚最低(圖4F)。并在另外兩個多區(qū)域樣本數(shù)據(jù)集(MultiRRnaSeq2和MultiRArray隊列)中證實了這一結(jié)果(圖4G)。這些結(jié)果表明,AUGUR與已建立的ProGESigs的一致率相比是有利的(圖4E、圖1D),更有力地克服了抽樣偏差,并可應(yīng)用于單一活檢以進行患者風(fēng)險分類。 鑒于AUGUR的成分來源于Q4象限,為了了解其他標(biāo)志物的基因主要分布在哪個象限,使用MultiRRnaSeq1隊列評估了13個標(biāo)志物中所有基因的腫瘤間和腫瘤內(nèi)異質(zhì)性(圖4H),發(fā)現(xiàn)顯著超過預(yù)期數(shù)量的60%的基因位于Q1象限,其中基因表現(xiàn)出高度的腫瘤內(nèi)和腫瘤間異質(zhì)性(圖4I)。突變衍生的標(biāo)志物和ceRNA調(diào)控網(wǎng)絡(luò)相關(guān)標(biāo)志物,分別包含100%和75%的Q1基因,分別表現(xiàn)出46%和55%的不一致風(fēng)險分類(圖1D,圖4H),其高于包含100%Q4基因的AUGUR(低ITH)(圖4D和E),這表明標(biāo)志物中基因的ITH水平影響標(biāo)志物對ITH的敏感性。
圖4?無ITH標(biāo)記物AUGUR與其他基因表達(dá)標(biāo)記物的比較
5. AUGUR與腫瘤不良特征有關(guān)
使用TCGA-LIHC HCC隊列探索AUGUR標(biāo)志物的臨床病理和生物學(xué)基礎(chǔ)(圖5A),在高AUGUR風(fēng)險組中觀察到高TNM分期(圖5B)和組織學(xué)分級(圖5C)表現(xiàn)出顯著較高的富集率。此外,發(fā)現(xiàn)AUGUR風(fēng)險評分與基于GSE54236隊列的成像數(shù)據(jù)計算的HCC倍增時間呈顯著負(fù)相關(guān)(圖5D),AUGUR評分高的患者HCC倍增次數(shù)顯著更短(圖5E)。高AUGUR風(fēng)險評分預(yù)測了TCGA-LIHC隊列中血管侵襲和轉(zhuǎn)移的高風(fēng)險(圖5F),ICGC-LIRI-JP隊列中也獲得了相同的結(jié)果。在訓(xùn)練和驗證數(shù)據(jù)集以及基于RNA-seq和基于微陣列的平臺中,AFP(一種公認(rèn)的HCC生物標(biāo)志物)的血清水平也與AUGUR風(fēng)險評分顯著正相關(guān)(圖5H)。此外,在TCGA-LIHC隊列中進行了顯著突變基因(SMG)分析,結(jié)果顯示,TP53(31%)和CTNNB1(27%)是HCC中最常見的兩個突變基因(圖5I);AUGUR評分高的患者TP53的突變概率顯著更高,而AUGUR評分低的患者CTNNB1的突變概率明顯更高。這些結(jié)果表明,AUGUR評分高的HCC患者具有侵襲性特征,包括晚期腫瘤狀態(tài)、更快的腫瘤生長速度以及高侵襲性和轉(zhuǎn)移潛力。
圖5?AUGUR與腫瘤不良特征有關(guān)
6. 構(gòu)建和驗證一個融合AUGUR和其他獨立預(yù)測因素的結(jié)果預(yù)測列線圖
為了提供一個定量模型來預(yù)測特定HCC患者的生存概率,構(gòu)建了一個結(jié)合AUGUR和臨床病理風(fēng)險因素的列線圖,使用TCGA-LIHC數(shù)據(jù)集預(yù)測1年、3年和5年的結(jié)果。根據(jù)多變量分析,AUGUR和TNM分期在多個隊列中也顯示出獨立的預(yù)后能力(圖6A)。生成了1年、3年和5年生存率的校準(zhǔn)圖,并顯示列線圖預(yù)測的結(jié)果在所有TCGA-LIHC訓(xùn)練和三個驗證隊列中接近實際(圖6B-E)。時間依賴性ROC曲線進一步證明,預(yù)后列線圖的特異性和敏感性優(yōu)于1年(圖6F)、3年(圖6G)和5年(圖6H)生存率的任何單一獨立預(yù)測因素??傊?,與單一預(yù)后因素相比,基于AUGUR和TNM分期的合作列線圖可以提高生存預(yù)測。
圖6?構(gòu)建和驗證一個融合AUGUR和其他獨立預(yù)測因素的結(jié)果預(yù)測列線圖
文章小結(jié)
這篇文章基于常規(guī)腫瘤預(yù)后模型的構(gòu)建套路,通過引入、量化和整合了腫瘤間和腫瘤內(nèi)的異質(zhì)性,開發(fā)了一種無腫瘤內(nèi)異質(zhì)性的HCC生物標(biāo)志物(AUGUR)。文章的選題方向創(chuàng)新性比較高、純生信數(shù)據(jù)量滿滿,并且思路又很高級。目前“腫瘤異質(zhì)性”這個方向發(fā)文量比較少,創(chuàng)新性比較高,是個很不錯的方向呢,有興趣的小伙伴趕快沖一波吧!