北京大學(xué)研發(fā)基于機(jī)器學(xué)習(xí)的多能干細(xì)胞分化系統(tǒng),高效、穩(wěn)定制備功能性細(xì)胞
內(nèi)容一覽:20 世紀(jì)以來(lái),干細(xì)胞與再生醫(yī)學(xué)技術(shù)一直是國(guó)際生物醫(yī)學(xué)領(lǐng)域的熱點(diǎn)前沿之一?,F(xiàn)如今,研究人員已開(kāi)始探索將干細(xì)胞轉(zhuǎn)變?yōu)樘囟愋图?xì)胞。然而,這一過(guò)程中干細(xì)胞會(huì)出現(xiàn)不規(guī)則生長(zhǎng)或自發(fā)分化為不同類型細(xì)胞的情況,因此,如何控制干細(xì)胞的生長(zhǎng)和分化成為研究人員面臨的挑戰(zhàn)之一。本文中,北京大學(xué)趙揚(yáng)課題組等研究員嘗試將機(jī)器學(xué)習(xí)應(yīng)用于多能干細(xì)胞分化過(guò)程中,并有效改善了這一情況,同時(shí)為再生醫(yī)學(xué)帶來(lái)了新的方向。
關(guān)鍵詞:多能干細(xì)胞 ? 圖像分析 機(jī)器學(xué)習(xí)
本文首發(fā)自 HyperAI 超神經(jīng)微信公眾平臺(tái)~
多能干細(xì)胞 (pluripotent stem cell, PSC) 是一類具有自我更新、自我復(fù)制能力的多潛能細(xì)胞,其可以體外無(wú)限增殖和分化成各種細(xì)胞類型,替代受損細(xì)胞,促進(jìn)受損組織功能恢復(fù),為眼部疾病、心血管系統(tǒng)疾病及神經(jīng)系統(tǒng)疾病等領(lǐng)域治療帶來(lái)了新希望。
然而,目前多能干細(xì)胞定向分化過(guò)程會(huì)出現(xiàn)細(xì)胞系間 (line-to-line) 和批次間 (batch-to-batch) 分化不穩(wěn)定等問(wèn)題,從而使制備功能性細(xì)胞耗時(shí)而費(fèi)力,嚴(yán)重阻礙多能干細(xì)胞臨床應(yīng)用產(chǎn)品的研發(fā)及規(guī)?;圃?。因此,實(shí)現(xiàn)對(duì)多能干細(xì)胞分化過(guò)程的實(shí)時(shí)監(jiān)控顯得尤為重要。
近日,北京大學(xué)趙揚(yáng)課題組、張鈺課題組聯(lián)合北京交通大學(xué)劉一研課題組研發(fā)了一個(gè)基于活細(xì)胞明場(chǎng)動(dòng)態(tài)圖像和機(jī)器學(xué)習(xí)的分化系統(tǒng),能夠?qū)崟r(shí)智能調(diào)節(jié)和優(yōu)化多能干細(xì)胞分化過(guò)程,實(shí)現(xiàn)對(duì)功能性細(xì)胞的高效、穩(wěn)定性生產(chǎn)。目前,該研究成果已發(fā)表在《Cell Discovery》期刊上,題目為《A live-cell image-based machine learning strategy for reducing variability in PSC differentiation systems》。

該研究成果已發(fā)表在《Cell Discovery》期刊上
論文地址:
https://www.nature.com/articles/s41421-023-00543-1
實(shí)驗(yàn)概述
目前,顯微技術(shù)可以對(duì)細(xì)胞進(jìn)行圖像采集,機(jī)器學(xué)習(xí)方法可以對(duì)細(xì)胞圖像進(jìn)行分析。因此,本研究利用機(jī)器學(xué)習(xí)??算法?對(duì)明場(chǎng)圖像中的細(xì)胞進(jìn)行識(shí)別和分類,以確定它們的譜系或細(xì)胞成分,幫助研究人員更好地理解細(xì)胞??結(jié)構(gòu)?和功能。
經(jīng)驗(yàn)證,本研究成果可有效優(yōu)化并且改進(jìn)多能干細(xì)胞向心肌細(xì)胞 (cardiomyocyte,? CM) 以及肝、腎嵌體細(xì)胞分化過(guò)程,整套研究方法及流程如下:

圖 1:機(jī)器學(xué)習(xí)優(yōu)化 PSC-to-CM
a:上半部分圖顯示,PSC 每個(gè)分化過(guò)程都存在變異性,下半部分圖顯示,機(jī)器學(xué)習(xí)應(yīng)用于上述分化過(guò)程中,有效減少了變異性。
b:使用小分子調(diào)節(jié)劑調(diào)控 canonical Wnt 信號(hào)通路的 PSC-to-CM 分化過(guò)程,綠色箭頭表示第一階段調(diào)節(jié) CHIR 的持續(xù)時(shí)間和濃度,彩色圓點(diǎn)表示機(jī)器學(xué)習(xí)的檢查點(diǎn)。
c:10 天時(shí)間內(nèi),延遲明場(chǎng)圖像和 cTnT 熒光結(jié)果。
d:整個(gè)過(guò)程中,分化成功和失敗的細(xì)胞位置及形態(tài)。
e:成功分化細(xì)胞第 5 天到 12 天,紋理及形態(tài)變化。
f:分化效率的線對(duì)線變異性。
g:不同批次細(xì)胞分化變異性。
h:不同 CHIR 劑量,分化圖像局部特征變化。
實(shí)驗(yàn)過(guò)程
實(shí)驗(yàn)數(shù)據(jù)集?
研究人員以 PSC-to-CM 分化為主要示例,通過(guò)蔡司 Cell Discover 7 活細(xì)胞全自動(dòng)成像平臺(tái),實(shí)時(shí)采集分化過(guò)程中的明場(chǎng)圖像,追蹤整個(gè)過(guò)程,如上圖 1b 所示。分化結(jié)束時(shí),通過(guò) cTnT(一種心肌細(xì)胞的特異標(biāo)志物)熒光標(biāo)記識(shí)別成功分化的 CM。這個(gè)過(guò)程中,為了增加圖像多樣性,研究人員引入了幾個(gè)變量(不同 PSC、初始細(xì)胞密度、分化培養(yǎng)基、不同 CHIR 劑量),最終收集了超 720 萬(wàn)張圖像。
實(shí)驗(yàn)成果?
結(jié)合活細(xì)胞成像技術(shù)和機(jī)器學(xué)習(xí),本實(shí)驗(yàn)獲得以下 4 點(diǎn)成果:
* 機(jī)器學(xué)習(xí)能準(zhǔn)確識(shí)別分化細(xì)胞狀態(tài)并預(yù)估分化效率。
研究人員發(fā)現(xiàn)在分化過(guò)程的第 6 天,最終能夠成功分化成 CM 的細(xì)胞,即 CPC(心臟祖細(xì)胞)開(kāi)始呈現(xiàn)紡錘型,因此,他們采用弱監(jiān)督模型識(shí)別了明場(chǎng)圖像中的此類細(xì)胞,并將其命名為「圖像識(shí)別心肌祖細(xì)胞(Image-Recognized CPC, IR-CPC) 。如下圖 2 所示,研究人員得出 IR-CPC 占總細(xì)胞比例與真實(shí)分化效率相關(guān)性達(dá) 88%。

圖 2:IR-CPC 比例與真實(shí)分化效率相關(guān)性
同時(shí),研究人員采用 pix2pix 深度學(xué)習(xí)模型對(duì) CM 誘導(dǎo)階段(即分化第一階段)的明場(chǎng)圖像進(jìn)行預(yù)測(cè),如下圖所示,預(yù)測(cè)分化效率與真實(shí)分化效率相關(guān)性達(dá) 93%。

圖 3:預(yù)測(cè)與真實(shí)分化效率相關(guān)性
以上實(shí)驗(yàn)表明,機(jī)器學(xué)習(xí)能夠識(shí)別分化不同階段的細(xì)胞狀態(tài),并能對(duì)分化結(jié)果進(jìn)行實(shí)時(shí)預(yù)測(cè)。
* 機(jī)器學(xué)習(xí)能實(shí)時(shí)預(yù)測(cè)分化時(shí)間和誘導(dǎo)因子濃度。
分化過(guò)程中,研究人員發(fā)現(xiàn)在中胚層階段 (0-3 天),誘導(dǎo)物 CHIR99021 (CHIR) 的劑量(濃度與處理時(shí)間)對(duì)分化效率影響較大。他們基于分化初期 (0-12h) 明場(chǎng)圖像中與 CHIR 有關(guān)特征構(gòu)建了一個(gè)邏輯??回歸?模型,用來(lái)預(yù)測(cè)孔中 CHIR 濃度(偏低、適中、偏高),如下圖所示,在選定 CHIR 處理時(shí)間為 24h 時(shí),模型對(duì)每個(gè)孔(一種有多個(gè)小孔的實(shí)驗(yàn)室用品)濃度判斷準(zhǔn)確率達(dá) 93.1%。

圖 4:模型對(duì)孔內(nèi) CHIR 濃度預(yù)測(cè)
同時(shí),研究人員將不同 CHIR 處理時(shí)間 (24h、36h 或 48h) 下模型的預(yù)測(cè)結(jié)果(即偏差分?jǐn)?shù))進(jìn)行比較,可以得到最優(yōu) CHIR 處理時(shí)間。如下圖 5 所示,最優(yōu) CHIR 處理時(shí)間約為 12 小時(shí)(偏差分?jǐn)?shù)最?。4送?,如圖 6 所示,根據(jù)模型預(yù)測(cè)結(jié)果,還可以調(diào)整 CHIR 濃度,提高分化效率。

圖 5:模型預(yù)測(cè)最優(yōu) CHIR 處理時(shí)間

圖 6:調(diào)整、未調(diào)整 CHIR 濃度的分化結(jié)果
以上實(shí)驗(yàn)表明,機(jī)器學(xué)習(xí)能實(shí)現(xiàn)對(duì)誘導(dǎo)劑劑量的干預(yù)。
* 機(jī)器學(xué)習(xí)能實(shí)時(shí)判斷 PSC 起始分化的最佳狀態(tài)。
研究人員發(fā)現(xiàn)即使在 CHIR 濃度適量的情況下,也會(huì)出現(xiàn)分化失敗的細(xì)胞,他們提出這是由空間異質(zhì)性 (spatially variable differentiation) 造成的,即分化第 0 天處于 PSC 集落邊緣的細(xì)胞易成功,而位于 PSC 集落中心的細(xì)胞易失敗。
對(duì)此,研究人員建立了基于隨機(jī)森林的機(jī)器學(xué)習(xí)模型,用來(lái)識(shí)別分化成功率高的起始細(xì)胞圖像特征,模型結(jié)果表明,細(xì)胞面積中等、邊緣越長(zhǎng)且越坑洼的細(xì)胞容易分化成功,這與實(shí)際觀察一致?;谶@個(gè)模型,研究人員發(fā)現(xiàn)通過(guò)識(shí)別起始 PSC 狀態(tài)預(yù)測(cè)與真實(shí)分化效率的相關(guān)性達(dá) 76%,結(jié)果如下圖 7 所示。
據(jù)此,研究人員還通過(guò)人工干預(yù)、改變細(xì)胞的起始形態(tài),有效將分化效率從 21.6% ± 2.7% 提升至 88.8% ± 10.5% 。

圖 7:識(shí)別細(xì)胞起始狀態(tài)與預(yù)測(cè)分化效率相關(guān)性
以上結(jié)果表明,機(jī)器學(xué)習(xí)能對(duì)對(duì) PSC 起始狀態(tài)進(jìn)行質(zhì)控。
* 機(jī)器學(xué)習(xí)能幫助篩選小分子化合物,提高分化穩(wěn)定性。
研究人員發(fā)現(xiàn) CHIR 濃度是影響分化的重要因素之一,因此他們嘗試開(kāi)展小分子篩選,用新的化合物抵消不恰當(dāng)?shù)?CHIR 濃度。如下圖所示,研究人員基于分化過(guò)程第 6 天的明場(chǎng)活細(xì)胞圖像和已建立的弱監(jiān)督模型,構(gòu)建了小分子篩選平臺(tái),最終在 3,000 多個(gè)小分子中成功篩選出了 BI-1347 這一化合物。

圖 8:機(jī)器學(xué)習(xí)篩選小分子化合物過(guò)程
以上實(shí)驗(yàn)表明,基于機(jī)器學(xué)習(xí)模型,研究人員可以建立一個(gè)小分子篩選平臺(tái),從而縮短篩選實(shí)驗(yàn)周期,降低篩選成本,并且通過(guò)這一技術(shù)篩選的小分子又拓寬了 CHIR 劑量范圍,從而整體提高了 PSC 分化過(guò)程穩(wěn)定性。
最后,為擴(kuò)展應(yīng)用場(chǎng)景,研究者將本研究成果應(yīng)用在腎祖細(xì)胞和肝細(xì)胞分化早期階段,同樣取得了準(zhǔn)確預(yù)測(cè)效果,可知,該研究成果能為多能干細(xì)胞分化過(guò)程提供實(shí)時(shí)指導(dǎo)。
細(xì)胞治療:或成生物醫(yī)藥新賽道
細(xì)胞治療是一種新興的療法,對(duì)眾多疾病(癌癥、遺傳疾?。┒颊宫F(xiàn)出良好的治療效果。其主要治療方式分為免疫細(xì)胞治療和干細(xì)胞治療,其中,干細(xì)胞憑借其多向分化、免疫調(diào)節(jié)以及分泌細(xì)胞因子等功能,成為該領(lǐng)域的核心研究方向之一。
目前看來(lái),我國(guó)細(xì)胞治療領(lǐng)域發(fā)展較短,但未來(lái)前景卻十分廣闊。一方面,從數(shù)據(jù)上來(lái)看,未來(lái)十年或?qū)⒊蔀樵擃I(lǐng)域快速增長(zhǎng)期。據(jù)相關(guān)數(shù)據(jù)預(yù)計(jì),我國(guó)細(xì)胞治療市場(chǎng)規(guī)模將由 2021 年的 13 億元,增長(zhǎng)至 2030 年的 584 億元,年均增速高達(dá) 53%。另有數(shù)據(jù)顯示,我國(guó)細(xì)胞和基因治療市場(chǎng)有望在 2025 年達(dá)到 25.9 億美元,以 276% 的復(fù)合增長(zhǎng)率增長(zhǎng)。
另一方面,各地政府也不斷出臺(tái)扶持、鼓勵(lì)該領(lǐng)域的相關(guān)政策。比如北京、上海、天津、深圳等地都在大力發(fā)展細(xì)胞治療產(chǎn)業(yè)。上海推出《上海市促進(jìn)細(xì)胞治療科技創(chuàng)新與產(chǎn)業(yè)發(fā)展行動(dòng)方案(2022—2024 年)》,提出力爭(zhēng)到 2024 年上海細(xì)胞治療產(chǎn)業(yè)規(guī)模達(dá)到 100 億元。去年,深圳接連發(fā)布扶持生物醫(yī)藥產(chǎn)業(yè)發(fā)展的文件,將重點(diǎn)支持包括細(xì)胞治療藥物在內(nèi)的產(chǎn)業(yè)集群高質(zhì)量發(fā)展。
數(shù)據(jù)集及代碼地址:
https://GitHub.com/zhaoyanglab/ML-for-psc-differentiation
參考鏈接:
[1]https://www.thepaper.cn/newsDetail_forward_23417694
[2]http://www.cls.edu.cn/Research/Research_Achievements6067.shtml
[3]https://stcsm.sh.gov.cn/zwgk/ghjh/20221104/f7b02ab5db40439e8d93f15b9dd206da.html
[4]http://legacy.frostchina.com/wp-content/uploads/2021/11/20211116-2.pdf
—— 完 ——
本文首發(fā)自 HyperAI 超神經(jīng)微信公眾平臺(tái)~