最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

14分+cell子刊!機(jī)器學(xué)習(xí)及人工智能在泛癌水平上整合組織病理學(xué)和蛋白質(zhì)組學(xué)!

2023-12-05 09:35 作者:爾云間meta分析  | 我要投稿


在現(xiàn)代醫(yī)學(xué)的發(fā)展史上,機(jī)器學(xué)習(xí)的發(fā)展為精準(zhǔn)醫(yī)學(xué)和轉(zhuǎn)化研究提供了信息。計(jì)算病理學(xué)將計(jì)算機(jī)視覺方法應(yīng)用于臨床和病理圖像,并極大地受益于基于神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)技術(shù)。

今天小云跟小伙伴們分享一篇發(fā)表在Cell Reports Medicine上的高分機(jī)器學(xué)習(xí)類文章。這篇文章引入了一種開創(chuàng)性的方法,將病理成像與轉(zhuǎn)錄組學(xué)和蛋白質(zhì)組學(xué)相結(jié)合,以確定與癌癥關(guān)鍵臨床結(jié)果相關(guān)的預(yù)測組織學(xué)特征。

這篇文章是如何斬獲14+的高分呢?小云帶小伙伴們一起揭秘一下吧~

1,本研究采用了一種創(chuàng)新性的研究方法,根據(jù)泛癌蛋白質(zhì)組數(shù)據(jù)訓(xùn)練和驗(yàn)證深度學(xué)習(xí)成像模型,在包含六種疾病類型的泛癌數(shù)據(jù)上構(gòu)建了端到端的多分辨率神經(jīng)網(wǎng)絡(luò),以預(yù)測廣泛的組織學(xué)、臨床和分子結(jié)果,使得該研究具有很高的應(yīng)用價值;

2,本文使用了圖像模型識別驅(qū)動蛋白質(zhì)組特征的診斷形態(tài),模型包括蛋白質(zhì)組學(xué)以及基因組學(xué)和轉(zhuǎn)錄組學(xué),提高了研究的可靠性和準(zhǔn)確性,

3,本文廣泛的結(jié)合了人類病理學(xué)專家進(jìn)行評審,讓可視化程度在可解釋性上大幅提高,有助于該技術(shù)在轉(zhuǎn)化研究和臨床實(shí)踐中的應(yīng)用,有望成為組織病理學(xué)圖像數(shù)據(jù)蛋白質(zhì)組學(xué)建模應(yīng)用的框架概念,同時結(jié)合專家病理學(xué)審查與機(jī)器學(xué)習(xí),以評估模型的相關(guān)性。本文團(tuán)隊(duì)認(rèn)為,將機(jī)器學(xué)習(xí)與人類專家評審相結(jié)合能夠提高病理學(xué)家的診斷,有助于提高模型的可信度和應(yīng)用的可靠性,從而更好地指導(dǎo)臨床實(shí)踐和研究;

4,本研究團(tuán)隊(duì)還開發(fā)了一個圖形用戶界面(GUI),讓臨床醫(yī)生可以用他們自己的臨床圖像來探索模型,這一創(chuàng)新對于醫(yī)生學(xué)者們來說可謂是非常實(shí)用呀!

相信本文的研究思路能夠給想要發(fā)表高分SCI論文的小伙伴們一定的參考價值!小伙伴們也可以掃碼咨詢小云,小云可以提供更多生信方面熱點(diǎn)研究方向和創(chuàng)新思路,協(xié)助你發(fā)表高分SCI哦~? ??

  • 題目:利用深度學(xué)習(xí)在泛癌水平上整合組織病理學(xué)和蛋白質(zhì)組學(xué)

  • 雜志:Cell Reports Medicine: Cell Press

  • 影響因子:IF=14.3

  • 發(fā)表時間:2023年8月14日

    公眾號回復(fù)“123”獲取文獻(xiàn),文獻(xiàn)編號:231122


云生信學(xué)生物信息學(xué),將在12月05日 15:00 直播預(yù)約R語言實(shí)操-臨床數(shù)據(jù)下載整理與應(yīng)用視頻號

研究背景

卷積神經(jīng)網(wǎng)絡(luò)(CNN)模型可以穩(wěn)定預(yù)測特定癌癥類型中常見的突變基因。弱監(jiān)督CNN還可以識別多種癌癥類型中的可操作驅(qū)動突變,并預(yù)測分子特征。然而,以前的研究尚未嘗試將豐富的蛋白質(zhì)組數(shù)據(jù)與組織學(xué)特征關(guān)聯(lián)起來。同時,很少有弱監(jiān)督的深度學(xué)習(xí)研究將病理學(xué)專業(yè)知識整合到研究設(shè)計(jì)和解釋中,導(dǎo)致模型可能缺乏人類可解釋性或與腫瘤生物學(xué)的明確相關(guān)性。現(xiàn)有模型過于依賴基因組和轉(zhuǎn)錄組數(shù)據(jù),這限制了臨床和轉(zhuǎn)化研究人員在實(shí)際操作中采用機(jī)器學(xué)習(xí)作為輔助技術(shù)的能力。為了解決這些限制,本文作者團(tuán)隊(duì)引入了一種多分辨率CNN架構(gòu)Panoptes,用于對子宮內(nèi)膜癌圖像進(jìn)行分類。該技術(shù)不僅適用于來自不同器官系統(tǒng)的癌癥類型,還為推動機(jī)器學(xué)習(xí)在臨床和研究中的應(yīng)用提供了一個實(shí)踐路線圖。同時,通過評估蛋白質(zhì)組模型來補(bǔ)充和驗(yàn)證轉(zhuǎn)錄組相關(guān)性,進(jìn)一步提高了該技術(shù)的可靠性和應(yīng)用價值。?? ?

數(shù)據(jù)來源

本文研究團(tuán)隊(duì)所使用的圖像庫由2,755張H&E染色切片組成,來自臨床蛋白質(zhì)組學(xué)腫瘤分析聯(lián)盟(CPTAC)的福爾馬林固定石蠟包埋(FFPE)組織塊切片,涵蓋了六種癌癥類型。該聯(lián)盟對數(shù)百名患者的腫瘤組學(xué)(包括基因組學(xué)、蛋白質(zhì)組學(xué)和代謝組學(xué))進(jìn)行了全面的表征,并且對匹配的組織病理學(xué)圖像和臨床結(jié)果進(jìn)行了詳細(xì)注釋。這些數(shù)字化的H&E切片圖像可以在癌癥影像檔案(TCIA)上公開獲取。

同時,患者的臨床數(shù)據(jù)、人口統(tǒng)計(jì)學(xué)和其他臨床特征均由CPTAC的泛癌癥蛋白質(zhì)組學(xué)聯(lián)盟協(xié)調(diào)并提取,該聯(lián)盟從組織特異性CPTAC研究中獲得相關(guān)數(shù)據(jù)。本文重點(diǎn)關(guān)注的是具有基因組、轉(zhuǎn)錄組和蛋白質(zhì)組數(shù)據(jù)的CPTAC樣本,這些數(shù)據(jù)可用于研究泛癌蛋白質(zhì)組對組織病理學(xué)的影響。

原始和處理后的蛋白質(zhì)組學(xué)數(shù)據(jù)以及開放獲取的基因組數(shù)據(jù)均是通過蛋白質(zhì)組學(xué)數(shù)據(jù)共享(PDC)獲得的,該平臺的網(wǎng)址為https://pdc.cancer.gov/pdc/cptac-pancancer。原始基因組和轉(zhuǎn)錄組數(shù)據(jù)文件則可以通過基因組數(shù)據(jù)共享(GDC)數(shù)據(jù)門戶獲取,其中dbGaP研究登錄號為phs001287.v16.p6。

完整的CPTAC泛癌控制和處理數(shù)據(jù)可以通過癌癥數(shù)據(jù)服務(wù)(CDS)獲取,該平臺的網(wǎng)址為https://dataservice.datacommons.cancer.gov/。CDS中托管的CPTAC泛癌數(shù)據(jù)是受控?cái)?shù)據(jù),只有通過NCIDAC批準(zhǔn)的dbGaP編譯的白名單才能進(jìn)行訪問。用戶還可以通過七橋癌癥基因組云(SB-CGC)訪問這些數(shù)據(jù)進(jìn)行分析。

研究思路

從CPTAC獲取的組織塊切片和H&E染色切片,將TCGA 中的每個醫(yī)學(xué)全量影像(whole-slide images,WSI)劃分為較小圖塊,并使用與整個幻燈片共享相同標(biāo)簽的圖塊,然后在整個圖像級別聚合各個圖塊級別的評估,基于Panoptes的多分辨率CNN模型在圖塊上進(jìn)行訓(xùn)練、驗(yàn)證和測試,為了更好地理解模型決策,作者將四個任務(wù)分為 1 類或 2 類。1 類任務(wù)用作模型的概念驗(yàn)證,包括 (1) 識別腫瘤組織來源和 (2) 區(qū)分來自正常組織的腫瘤。2 類任務(wù)包括根據(jù)組織學(xué)圖像特征預(yù)測 (3) 臨床特征和 (4) 生物標(biāo)志物。通過稀疏 CCA 研究驅(qū)動預(yù)測形態(tài)改變的潛在生物機(jī)制,稀疏 CCA 提取基因、蛋白質(zhì)和成像特征的亞組,其表達(dá)值彼此最大程度相關(guān)。然后對不同典型變異的高分和低分病例進(jìn)行病理學(xué)審查,以評估模型衍生特征的病理和生物學(xué)相關(guān)性。在每個切片基于成像的預(yù)測任務(wù)的AUROC圖中進(jìn)行總結(jié)比較。除此之外,通過引入基于云的圖形用戶界面,供臨床醫(yī)生將此機(jī)器學(xué)習(xí)模型應(yīng)用于自己所需的組織學(xué)圖像。? ??

主要結(jié)果

1.組織源模型性能和組學(xué)整合

通過使用正常鄰近組織(NAT)和腫瘤樣本的組合進(jìn)行訓(xùn)練,模型表現(xiàn)出了極好的性能,每切片水平的AUROC值介于0.949至0.995(圖2A),而每圖塊水平的AUROC值則介于0.905至0.963(圖2B)。為了更直觀地理解模型的學(xué)習(xí)成果,我們將潛在特征與最終卷積層的tSNE結(jié)果進(jìn)行了可視化,從而可以觀察到不同組織類型之間的分離程度(圖2C和2D)。后續(xù)作者應(yīng)用稀疏 CCA將組織來源模型在TCGA樣本上進(jìn)行了驗(yàn)證,CCA 典型變量突出了 UCEC 和 LUAD 樣本之間的相似性。(圖2E)?? ?

圖 2組織源模型性能和組學(xué)整合

2.泛癌模型的特征可視化和交叉測試

通過評估組織學(xué)特征的 CNN 模型如何區(qū)分腫瘤和 NAT(另一類 1 類任務(wù)),并將模型的決策過程與標(biāo)準(zhǔn)病理檢查進(jìn)行比較。結(jié)果顯示泛癌模型在腫瘤和NAT分類中實(shí)現(xiàn)了高的AUROC值,并在外部TCGA測試集上驗(yàn)證了泛癌模型的準(zhǔn)確性。為了識別模型中權(quán)重較大的組織學(xué)特征,作者評估了模型在每個幻燈片級別的預(yù)測的空間分布,并采用類激活映射(CAM)來展示深度學(xué)習(xí)模型的注意力。結(jié)果顯示模型通常更多地關(guān)注腫瘤區(qū)域而不是正常區(qū)域(圖3c)。提取倒數(shù)第二層測試集樣本的激活圖進(jìn)行降維以顯示二維 tSNE 圖,觀察到腫瘤樣本聚集在頂部,而正常樣本聚集在底部,并且預(yù)測標(biāo)簽和真實(shí)標(biāo)簽相關(guān)性良好。除了與 CCRCC 樣本相關(guān)的兩個小簇外,沒有按來源組織劃分的明顯簇(圖3 DEF)。通過審查與 tSNE 圖上的點(diǎn)相對應(yīng)的 H&E 圖塊,表明高細(xì)胞核密度和細(xì)胞核形狀/大小是模型用于區(qū)分腫瘤組織與 NAT 的主要特征。? ??

圖3腫瘤發(fā)生模型的特征可視化和交叉測試

在對泛癌模型中區(qū)分腫瘤和NAT的分子特征進(jìn)行評估后,發(fā)現(xiàn)模型通過將成像和轉(zhuǎn)錄組或蛋白質(zhì)組特征之間的投影值可視化,清晰地顯示了正常樣本和腫瘤樣本之間的界限(圖4A)。此外,對頂級轉(zhuǎn)錄組和蛋白質(zhì)組通路以及頂級圖塊的評估確定了富含細(xì)胞周期DNA復(fù)制和雙鏈斷裂修復(fù)的基因和蛋白質(zhì)子集(圖4B和4C)。另一個典型變量(第2號)則顯示LSCC和LUAD與NAT明顯分離,而HNSCC腫瘤與NAT中度分離(圖4D和4E)。通過可視化,我們還觀察到藍(lán)色區(qū)域能夠明顯隔離具有離散靜脈血的區(qū)域(圖4F),而與代謝活動增加相關(guān)的紅色區(qū)域則突出顯示具有腫瘤細(xì)胞的圖塊。藍(lán)色區(qū)域則分割出具有平滑肌組織的正常肺區(qū)域,中間的白色圖塊則與纖維化或促結(jié)締組織區(qū)域相關(guān)(圖4E)。這些發(fā)現(xiàn)表明,成像模型已經(jīng)學(xué)習(xí)到了一些特征,這些特征結(jié)合起來代表可解釋的生物信號并對應(yīng)于可識別的H&E特征。?? ?

3.臨床和組織病理學(xué)特征

經(jīng)過訓(xùn)練模型來預(yù)測病理分級和疾病階段(如圖5A所示),可以清楚地看到,TCGA等級數(shù)據(jù)并不適用于測試其普遍性。為了解決這個問題,作者利用稀疏CCA來識別生物相關(guān)性。通過這種方法,實(shí)現(xiàn)了對具有最高預(yù)測值的區(qū)域的可視化(如圖5B所示),該可視化捕獲了無管腔形成和廣泛壞死的雜亂腫瘤細(xì)胞區(qū)域,以及惡性腺體顯示基底核極性喪失的區(qū)域。這些區(qū)域通常與腫瘤的惡性程度和疾病進(jìn)展相關(guān)。另一方面,具有最低預(yù)測值的圖塊主要是NAT樣本,這些樣本通常具有正常的非腫瘤形態(tài)或具有明顯極性的細(xì)胞。這些結(jié)果表明,此模型能夠準(zhǔn)確地識別出腫瘤組織和正常組織之間的差異,從而為病理診斷提供有力的支持。

圖5模型性能及年級和階段的多組學(xué)評估

4.生物標(biāo)志物

直接從H&E染色組織病理學(xué)圖像推斷分子特征的工具,將充分利用組學(xué)研究的優(yōu)勢,使診斷病理學(xué)圖像更容易獲取,增強(qiáng)傳統(tǒng)診斷病理學(xué)技術(shù)的能力,并擴(kuò)展回顧性分子分析,無需基因組測序即可推斷生物樣本的突變情況。所有突變預(yù)測任務(wù)均顯示出顯著差異,表明這些模型可用于區(qū)分具有常見突變的腫瘤(圖6A)。使用tSNE對泛癌TP53突變模型學(xué)習(xí)到的特征進(jìn)行提取和可視化(圖6B),觀察到預(yù)測的TP53突變簇中具有高級腫瘤特征的腫瘤浸潤淋巴細(xì)胞;在預(yù)測的KRAS突變簇中,觀察到較大的細(xì)胞核、開放的染色質(zhì)和腺體特征;在預(yù)測的STK11突變體中發(fā)現(xiàn)了豐富的中性粒細(xì)胞、大細(xì)胞和腺體結(jié)構(gòu),并且惡性細(xì)胞顯示出聚集的染色質(zhì);與預(yù)測的TP53突變體相比,這些腫瘤浸潤淋巴細(xì)胞的細(xì)胞更少、炎癥更多、壞死更多。在EGFR突變簇中也觀察到了類似的模式。預(yù)測的PTEN突變簇顯示出細(xì)長的致密腺體,這是子宮內(nèi)膜癌的典型特征。TCGA FFPE 驗(yàn)證證實(shí)了TP53和PTEN的普遍性。多模式整合結(jié)合對 TP53 野生型與突變樣本的盲法全切片病理學(xué)評估,表明該模型一致地再現(xiàn)了TP53突變型癌癥的典型組織學(xué)特征。? ??

圖6 生物標(biāo)志物的性能、可視化和特征提取

5.Panoptes Web

為了方便集成到臨床和轉(zhuǎn)化研究工作流程中,本研究團(tuán)隊(duì)開發(fā)了Panoptes Web這一具有直觀可視化功能的工具(http://panoptes.fenyo.cloud),用于評估模型的性能。該工具可實(shí)現(xiàn)模型的可視化,并采用簡單的工作流程進(jìn)行逐塊預(yù)測(圖7A)。結(jié)果以概率分?jǐn)?shù)和班級結(jié)果的直觀箱線圖進(jìn)行展示,同時提供基于網(wǎng)絡(luò)的查看器(圖7B),詳細(xì)說明每個圖塊的預(yù)測情況。?? ?

文章小結(jié)

這篇文章可以說在應(yīng)用價值和創(chuàng)新性方面都有可圈可點(diǎn)之處,通過利用已公開的大量本臨床數(shù)據(jù),使用時下非常熱門的卷積神經(jīng)網(wǎng)絡(luò)(CNN)模型和深度學(xué)習(xí)的研究方法,就能輕松發(fā)出14+的Cell子刊,可謂性價比極高。你心動了嗎?如果你想了解更多生信方面的創(chuàng)新點(diǎn),發(fā)出高分文章,就把握住機(jī)器學(xué)習(xí)的熱點(diǎn)方向,快快行動起來吧!



14分+cell子刊!機(jī)器學(xué)習(xí)及人工智能在泛癌水平上整合組織病理學(xué)和蛋白質(zhì)組學(xué)!的評論 (共 條)

分享到微博請遵守國家法律
田阳县| 龙井市| 仪征市| 曲周县| 贺兰县| 邳州市| 新龙县| 江阴市| 清水县| 三江| 虹口区| 营口市| 宣城市| 石台县| 策勒县| 奉节县| 深州市| 府谷县| 安宁市| 峨眉山市| 百色市| 安阳县| 嵊泗县| 康乐县| 日土县| 汤阴县| 方正县| 聂荣县| 伊宁市| 桃源县| 武义县| 恩施市| 偏关县| 济源市| 襄城县| 陆川县| 佛山市| 乌鲁木齐县| 锡林浩特市| 衡水市| 井陉县|