從大數(shù)據(jù)角度揭示癌癥相關基因發(fā)表趨勢、通路和細胞系信息,助力科研設計

很多生物醫(yī)學小伙伴們都在為實驗和基金設計犯愁,該如何篩選疾病相關基因和細胞系呢,這些基因近年來的發(fā)表趨勢如何呢?有什么功能呢?細胞系上千種,該如何選擇最佳的呢?今天小編就給大家安利一個癌癥基因與通路探索綜合在線數(shù)據(jù)庫:CGPE(Cancer Gene and Pathway Explorer,https://cgpe.soic.iupui.edu/)。該數(shù)據(jù)庫集成了PubMed、GEO、TCGA、DepMap和CCLE等數(shù)據(jù)和分析工具,可以簡化生物醫(yī)學研究人員在研究初期收集、處理和分析公開數(shù)據(jù)的工作,有助于從大數(shù)據(jù)的角度揭示基因功能和細胞功能之間的潛在聯(lián)系。
該數(shù)據(jù)庫總共包含三個在線分析和可視化功能模塊:Gene Hotlndex、OnlineGSEA和CellLine Search,涵蓋了PubMed的出版趨勢、從公共數(shù)據(jù)集推斷人類基因(或基因集)的基因富集分析、以及基于靶向基因的細胞系搜索。下面,就由小編來給大家依次介紹下這些模塊的具體用法吧。

Gene Hotlndex
Gene Hotlndex功能模塊基于PubMed數(shù)據(jù)庫對基因相關的出版物進行信息挖掘和分類,包括該基因的研究趨勢、癌癥類型相關性、相關基因以及在多種腫瘤中的發(fā)表論文數(shù)統(tǒng)計結(jié)果,可以幫助研究者更好地了解基因特異性出版物的趨勢。
?在主頁面點擊“Gene Hotlndex”,在該功能模塊的主頁面正中央可以看見有一個搜索框,在搜索框輸入Gene Symbol和Ensembl ID進行查詢。如下圖所示:
?

點擊Search后,可以看到基因的相關信息,包括完整的基因名、染色體位置以及外顯子數(shù)目等。同時,還可以看到該基因每年發(fā)表的文章數(shù)目和發(fā)表數(shù)量的大致趨勢,如下圖所示:

在搜索結(jié)果的界面里還可以看到該基因在不同腫瘤類型中的研究情況。例如以PTEN為例,把光標放在腫瘤類型的柱子上,就會顯示PTEN在該腫瘤中的研究情況,右邊的方框里還會顯示發(fā)表數(shù)量。如下圖所示:

搜索結(jié)果的界面里還提供了與搜索基因相關的熱度關聯(lián)詞以及常與該基因相研究的相關基因的發(fā)表數(shù)量,為生物醫(yī)學研究的小伙伴提供了另類的研究視角。如下圖所示:

OnlineGSEA
OnlineGSEA功能模塊集成TCGA數(shù)據(jù)集、GEO數(shù)據(jù)集和GSEA算法,可以幫助生物醫(yī)學研究人員基于數(shù)千名癌癥患者的基因表達數(shù)據(jù)研究基因相關功能。
在主頁面點擊“OnlineGSEA”進入該功能模塊界面。如下圖所示:

點擊Start Onlin-GSEA進行GSEA分析。左邊Use Public Datasets分析框表示使用經(jīng)過預處理好的公共數(shù)據(jù)集進行GSEA分析;右邊Upload Your Own Data分析框表示上傳自己的數(shù)據(jù)做GSEA分析。

點擊Use Public Datasets后,進入該界面后,可以在右邊欄選擇相關數(shù)據(jù)集,在左邊欄里可以看到該數(shù)據(jù)集的簡介。選擇合適的數(shù)據(jù)集后輸入基因名后可以實現(xiàn)對GSEA的分析以及結(jié)果的可視化。如下圖所示:

CellLine Search
CellLine Search功能模塊提供了綜合的癌癥細胞系信息和直觀的可視化。本功能模塊包含11種腫瘤細胞系,結(jié)合了細胞系依賴性、基因表達以及通路活性熱圖,可以為相關實驗最佳細胞株的選擇提供一定的參考和幫助。
在主頁面點擊“CellLine Search”進入該能模塊界面。點擊Run CellLine Search進行搜索。如下圖所示:

輸入腫瘤類型、基因名和通路數(shù)據(jù)庫進行搜索,如圖所示:

本文以BRCA和PTEN為例,點擊Show Cell Line Information,可以得到以下查詢結(jié)果:
1)基因的基因信息,包含基因名、染色體等內(nèi)容,如下圖所示:

2)基因的dependency score和表達量。Dependency score越高表示細胞系特異性越高。如下圖所示:

3)基因在不同細胞系中的研究情況。點擊相關橫柱就能得到基因在細胞系中詳細信息。

4)通路活性熱圖。該圖是基于GSVA計算出來的不同細胞系不同通路的活性。

?以上就是對CGPE數(shù)據(jù)庫功能的簡單介紹,該數(shù)據(jù)庫整體操作起來相對簡單,還可以為大家設計實驗和基金的時候提供基因、細胞系、通路等相關信息,大家趕緊實操起來,為研究設計增磚添瓦吧!
