項(xiàng)目文章 | 多組學(xué)聯(lián)合人工智能開發(fā)監(jiān)測(cè)早期肺癌的新手段
新春伊始,博奧晶典單細(xì)胞空間測(cè)序平臺(tái)迎來開門紅。2月2日,北京大學(xué)人民醫(yī)院王俊院士團(tuán)隊(duì)和北京大學(xué)基礎(chǔ)醫(yī)學(xué)院尹玉新教授團(tuán)隊(duì)合作在?Science Translational Medicine?雜志上發(fā)表了關(guān)于肺癌早期診斷標(biāo)志物的多組學(xué)研究,通過利用單細(xì)胞轉(zhuǎn)錄組學(xué)、血漿脂質(zhì)組學(xué)和質(zhì)譜成像綜合分析早期肺癌的脂代謝特征,開發(fā)了一套人工智能輔助的早期肺癌代謝檢測(cè)方法。該研究中單細(xì)胞轉(zhuǎn)錄組測(cè)序服務(wù)由博奧晶典提供。

【發(fā)表期刊】Science?Translational?Medicine
【發(fā)布時(shí)間】2022年2月
【影響因子】17.956
【檢測(cè)技術(shù)】10x Genomics?單細(xì)胞轉(zhuǎn)錄組測(cè)序、脂質(zhì)組學(xué)、質(zhì)譜成像
研究背景
肺癌的死亡率高居惡性腫瘤之首,據(jù)全球癌癥統(tǒng)計(jì),2020年有超過200萬人被確診為肺癌,并且有180萬人死于肺癌。I期肺腺癌患者的5年生存率在60%以上,因此早期發(fā)現(xiàn)是提高肺癌患者生存率的關(guān)鍵。然而,目前尚無可靠的血液檢測(cè)手段用于肺癌的早期診斷。
研究路線

研究結(jié)果
1. 單細(xì)胞測(cè)序揭示早期肺癌中出現(xiàn)脂代謝異常
研究人員對(duì)來自5名早期肺癌患者的組織樣本進(jìn)行單細(xì)胞測(cè)序,對(duì)比公共數(shù)據(jù)庫中的8例健康人肺組織單細(xì)胞數(shù)據(jù)進(jìn)行分析發(fā)現(xiàn),早期肺癌患者組織中 T 細(xì)胞、B 細(xì)胞和漿細(xì)胞占比增加,且單核吞噬細(xì)胞和內(nèi)皮細(xì)胞的占比降低。進(jìn)一步利用拷貝數(shù)變異分析推測(cè)腫瘤細(xì)胞,發(fā)現(xiàn)腫瘤細(xì)胞的表達(dá)譜具有明顯的個(gè)體差異。
通過分析腫瘤細(xì)胞與正常的上皮細(xì)胞間差異基因發(fā)現(xiàn),腫瘤細(xì)胞中上調(diào)表達(dá)的基因涉及經(jīng)典的腫瘤特征,而下調(diào)表達(dá)的基因主要富集在脂代謝及相關(guān)途徑。對(duì)單細(xì)胞數(shù)據(jù)分析得到的9種細(xì)胞類型分別進(jìn)行分析發(fā)現(xiàn),與健康人相比,肺癌患者中甘油酯代謝、甘油磷脂代謝、脂肪酸合成和不飽和脂肪酸合成等多條代謝通路均發(fā)生異常變化,其中甘油酯和甘油磷脂代謝在早期肝癌患者的大部分類型細(xì)胞中下調(diào)。

2. 早期肺癌患者血漿脂質(zhì)組學(xué)分析
為進(jìn)一步了解早期肺癌患者血漿中脂質(zhì)代謝的變化,研究人員收集了171名早期肺癌患者術(shù)前血漿樣本和140例健康對(duì)照的血漿樣本進(jìn)行脂質(zhì)組學(xué)檢測(cè),并利用機(jī)器學(xué)習(xí)算法對(duì)測(cè)試集和驗(yàn)證集樣本進(jìn)行分析,綜合比較模型準(zhǔn)確性、特異性和靈敏度,發(fā)現(xiàn)基于支持向量機(jī)算法構(gòu)建的模型優(yōu)于隨機(jī)森林和 AdaBoost 算法構(gòu)建的模型,并最終采用支持向量機(jī)算法篩選出9個(gè)血漿脂質(zhì)標(biāo)志物,建立了人工智能分類模型 LCAID。利用該模型對(duì)測(cè)試隊(duì)列數(shù)據(jù)的分類準(zhǔn)確率為98.90%,平均 AUC 為0.9994。

3. 肺癌評(píng)估模型 LCAID 的評(píng)估效果分析
為進(jìn)一步測(cè)試 LCAID 模型的分類效果,研究人員對(duì)包含1003名參與者血漿樣本數(shù)據(jù)的獨(dú)立隊(duì)列進(jìn)行分析,結(jié)果發(fā)現(xiàn)測(cè)試集中模型的準(zhǔn)確性達(dá)96.98%、特異性97.08%、靈敏度96.92%,而在隨后的驗(yàn)證集中該模型的分類效果也達(dá)到了94.96%的準(zhǔn)確性、100%特異性和92.93%靈敏度。
此外,研究人員還利用 LCAID 模型對(duì)1個(gè) LDCT 篩查隊(duì)列和2個(gè)前瞻性單盲隊(duì)列數(shù)據(jù)進(jìn)行分析。在前瞻性隊(duì)列中86人被診斷為肺癌(臨床分期為I到III),23人被診斷為良性疾病,而利用 LCAID 模型評(píng)估的準(zhǔn)確率達(dá)91.74%,特異性達(dá)95.65%,而靈敏度也達(dá)到了90.70%。在篩查隊(duì)列中,該模型預(yù)測(cè)的準(zhǔn)確率更是達(dá)到了96.53%,同時(shí)特異性(96.58%)和靈敏度(92.31%)方面也有不錯(cuò)表現(xiàn),并且利用該模型準(zhǔn)確分析篩查出90%以上的I期肺癌患者。分析過程還發(fā)現(xiàn),基于 LCAID 模型的打分是肺癌預(yù)測(cè)的獨(dú)立影響因子,與患者年齡、性別、吸煙習(xí)慣無關(guān),并且打分越高,患者的生存期越低。

4.???LCAID?模型中的特征脂質(zhì)物在肺腺癌組織中的原位表達(dá)
為了解9種脂質(zhì)代謝物在癌癥組織中的表達(dá)情況,研究人員利用基質(zhì)輔助激光解吸/電離質(zhì)譜成像(MALDI-MSI)技術(shù),在12例樣本中對(duì)8種脂質(zhì)代謝物進(jìn)行原位分析,結(jié)果發(fā)現(xiàn)與鄰近的癌旁組織相比,癌癥組織中5種磷脂酰膽堿(PC 16:0–18:1,PC 18:0–18:1,PC 18:0–18:2,PC 16:0–22:6和PC 16:0–18:2)的含量升高,3種溶血磷脂酰膽堿(LPC 16:0,LPC18:0和LPC 20:4)的含量下降,這些結(jié)果也證明模型所使用的脂質(zhì)代謝物在肺腺癌中的含量確實(shí)發(fā)生了異常改變。

研究結(jié)論
本研究通過分析單細(xì)胞轉(zhuǎn)錄組測(cè)序數(shù)據(jù),成功鎖定腫瘤細(xì)胞中脂代謝通路的異常變化,并通過脂質(zhì)組學(xué)結(jié)合支持向量機(jī)算法,最終基于9個(gè)血漿脂質(zhì)標(biāo)志物建立了肺癌人工智能檢測(cè)器(LCAID),該模型可用于肺癌的早期檢測(cè)或高危人群的大規(guī)模篩查。這種方法的臨床應(yīng)用將可能使肺癌患者獲益于早期、準(zhǔn)確的診斷,進(jìn)而提高肺癌的生存率。
參考文獻(xiàn):WangGuangxi, Qiu Mantang, Xing Xudong et al. Lung cancer scRNA-seq and lipidomics reveal aberrant lipid metabolism for early-stage diagnosis.?Sci Transl Med, 2022, 14(630): eabk2756.