生信大牛||人工智能的熱潮讓單細胞與基因組學大放異彩

科研背景
細胞生物學的相關研究一直受限于數(shù)據(jù)的完整性和表型的完整性,對應激狀態(tài)和穩(wěn)態(tài)下的細胞區(qū)別觀察不夠充分。過去五年中,計算機視覺和語音識別領域通過對大量的無標簽數(shù)據(jù)進行學習、建模,很好的解決了數(shù)據(jù)不足的問題。同樣在最近的研究中,機器學習方法使用單細胞數(shù)據(jù)進行擾動建模也推動了細胞生物領域前進。對于生物學家來講,無論研究基因、轉錄本、修飾、蛋白功能,都要頻繁的進行人為干預,實現(xiàn)對感興趣變量的正向或者反向改變,觀察細胞表型的變化。整個過程需要對干預工具的構建、導入、實驗觀察,從而得出表型結論。擾動建模的目的就是想要通過數(shù)學模型的建立,通過對已有數(shù)據(jù)的分析、歸納和總結,對一個分子的功能在沒有實驗時做出預判,對于生物學家和藥物研發(fā)者來講,好的模型一定能夠幫助加深對生物機制的理解,推動藥物的研發(fā)進程
“單細胞多組學技術”和“空間轉錄組技術”先后在2019年和2020年被Nature Methods評為年度技術方法。時間和空間維度多維研究技術結合,將以全新研究思路出發(fā),既能夠獲得單個細胞間異質性,又能獲得細胞在組織空間上的結構位置信息,發(fā)現(xiàn)更多未知且精細化結果??偠灾?,單細胞測序+空間轉錄組測序:優(yōu)勢互補,同時獲得細胞類型群體,以及基因表達和細胞的空間位置信息??臻g轉錄組能夠定位和區(qū)分功能基因在特定組織區(qū)域內的活躍表達,為研究和診斷提供寶貴見解。10x Visium 的推出使空間轉錄組成為了新的研究熱點,受到廣大研究者的青睞,其不僅可以提供研究對象的轉錄組等數(shù)據(jù)信息,同時還能定位其在組織中的空間位置,這對于癌癥發(fā)病機制、神經科學、發(fā)育生物學等眾多領域的研究都有重要意義。
深度學習已經被廣泛應用于基因組學研究中,利用已知的訓練集對數(shù)據(jù)的類型和應答結果進行預測,深度學習,可以進行預測和降維分析。深度學習模型的能力更強且更靈活,在適當?shù)挠柧殧?shù)據(jù)下,深度學習可以在較少人工參與的情況下自動學習特征和規(guī)律。調控基因組學,變異檢測,致病性評分成功應用。深度學習可以提高基因組數(shù)據(jù)的可解釋性,并將基因組數(shù)據(jù)轉化為可操作的臨床信息。深度學習通過強大的深度神經網(wǎng)絡模型從高維大數(shù)據(jù)中自動挖掘數(shù)據(jù)潛在特征得以實現(xiàn),過去10年,深度學習在計算機視覺、語音識別、自然語言處理領域取得了巨大成功?;蚪M學大數(shù)據(jù)與疾病表型間的復雜關系難以解析,運用深度學習挖掘多組學數(shù)據(jù)探索復雜疾病致病機制及藥物反應機制將會極大的提升精準醫(yī)學和轉化醫(yī)學的進度。,近兩年國內外頂尖課題組MIT、Harvard University、UPenn、清華大學、復旦大學等都在從事深度學習基因組學的研究,這一研究成果更是多次發(fā)表在Nature Reviews Genetics、Nature Methods、Science Advances、Cancer Cell、Nature Biotechnology?等知名國際頂刊上,為我們發(fā)表頂刊鑒定了基礎。
比較基因組學(Comparative Genomics)利用模式生物基因組與人類基因組之間編碼順序上和結構上的同源性,克隆人類疾病基因,揭示基因功能和疾病分子機制,闡明物種進化關系,及基因組的內在結構。比較不同物種的整個基因組,增強對各個基因組功能及發(fā)育相關性的認識。比較不同物種的整個基因組,增強對各個基因組功能及發(fā)育相關性的認識。比較基因組學分析已成為生物學尤其是遺傳學相關研究的重要手段。通過對生物基因組上遺傳信息的挖掘與研究能夠促進對不同生物具有的生物學形狀下的遺傳機制差異、性狀演化歷史等生物學問題進行深入的了解與研究。