生信經(jīng)典數(shù)據(jù)庫課程包一次性統(tǒng)統(tǒng)送給你!
?“大數(shù)據(jù)”時代已經(jīng)降臨,在商業(yè)、經(jīng)濟及其他領(lǐng)域中,決策將日益基于數(shù)據(jù)和分析而作出,而并非基于經(jīng)驗和直覺。在生物學(xué)領(lǐng)域,大數(shù)據(jù)的整合分析更是亟不可待。在大數(shù)據(jù)時代,如何充分利用數(shù)據(jù),讓數(shù)據(jù)不再沉睡?如何結(jié)合自己的數(shù)據(jù)和已有的數(shù)據(jù)比較分析、充分挖掘數(shù)據(jù)的意義?如何基于臨床研究設(shè)計科研課題,整合多組學(xué)數(shù)據(jù),形成科研論文?
這些問題都需要靠生物信息學(xué)來解決。生信學(xué)習(xí)入門不易,網(wǎng)上能夠找到的資料支離破碎,需要耗費大量時間自學(xué)才能領(lǐng)悟一二,這顯然不符合醫(yī)生科研精力不足的現(xiàn)狀。為此,解螺旋制作了生信經(jīng)典數(shù)據(jù)庫課程包,手把手教你如何利用生信工具產(chǎn)生課題的火種。
本課程包含有4部分內(nèi)容,從腫瘤經(jīng)典數(shù)據(jù)庫oncomine和TCGA入門,這兩個操作比較簡單。接下來學(xué)習(xí)高通量基因表達數(shù)據(jù)庫GEO進階,最后學(xué)習(xí)R語言,走上碼農(nóng)的道路達到統(tǒng)計作圖大成之境。
?
Oncomine??



Oncomine是目前世界上最大的癌基因芯片數(shù)據(jù)庫和整合數(shù)據(jù)挖掘平臺,旨在挖掘癌癥基因信息。到目前為止,該數(shù)據(jù)庫已經(jīng)收集了715個基因表達數(shù)據(jù)集,86733個癌癥組織和正常組織的樣本數(shù)據(jù)。Oncomine擁有最全的癌癥突變譜、基因表達數(shù)據(jù)以及相關(guān)的臨床信息,可利于發(fā)現(xiàn)新的生物標記物或新的治療靶點。?
Oncomine整合了文獻及芯片數(shù)據(jù)庫中高質(zhì)量標準的腫瘤組織芯片結(jié)果,14個注釋數(shù)據(jù)庫的分析,并且oncomine里的數(shù)據(jù)會隨著這些數(shù)據(jù)可的跟新而及時跟新。通過oncomine網(wǎng)站分析,可以得到差異表達的結(jié)果,共表達分析,富集分析,相互作用的網(wǎng)絡(luò)、及meta分析。
?本Oncomine教程一共48頁,涵蓋了基因差異表達分析,臨床相關(guān)性分析和多基因共表達分析三種常見應(yīng)用,按步驟圖文并茂解釋,堪稱傻瓜式教程,不怕你學(xué)不會,只怕你不開始。
?
TCGA??
?對于做腫瘤研究的小伙伴來說,TCGA數(shù)據(jù)庫有大名不可不謂如雷貫耳。其中收錄了超過11000位患者、33種腫瘤及配對正常組織的高通量芯片或測序數(shù)據(jù),包括10種罕見腫瘤,無疑是一座巨大寶庫。
TCGA數(shù)據(jù)庫數(shù)據(jù)涉及到相關(guān)癌癥基因的mRNA/microRNA表達譜、拷貝數(shù)變異、突變等大量的生物信息學(xué)數(shù)據(jù)。TCGA網(wǎng)絡(luò)中,數(shù)據(jù)類型包括拷貝數(shù)結(jié)果、雜合缺失、SNP等。
?



雖然TCGA只提供癌癥基因表達譜,不能夠提供相關(guān)分析,但仍有其他眾多工具可以實現(xiàn)各種各樣的研究需求。而這些TCGA的檢索技巧、初步的Analysis、數(shù)據(jù)下載和拓展應(yīng)用,都融和在這份89頁的解螺旋單元課PPT里~
?
GEO??
Gene Expression Omnibus(GEO)是一個儲存高通量功能基因組學(xué)數(shù)據(jù)的數(shù)據(jù)庫,這些高通量功能基因組學(xué)數(shù)據(jù)來自芯片和新一代的測序儀得到的試驗數(shù)據(jù)。GEO除了收錄基因表達數(shù)據(jù)之外還收錄其它數(shù)據(jù),例如基因組拷貝數(shù)變異數(shù)據(jù)、基因組-蛋白相互作用數(shù)據(jù)以及基因組甲基化數(shù)據(jù)等。
GEO數(shù)據(jù)庫被分為兩個部分收錄在Entrez中,分別是GEO Profiles數(shù)據(jù)庫(它負責收錄一個基因在一次試驗中的定量基因表達數(shù)據(jù))和GEO DataSets 數(shù)據(jù)庫(收錄整個試驗的數(shù)據(jù))。目前,GEO數(shù)據(jù)庫共收錄了由世界各地的實驗室提交的超過1871121個樣本試驗數(shù)據(jù),16088個芯片平臺記錄,71339種實驗項目以及3848種研究類型的基因表達譜數(shù)據(jù)。
?


R語言??
R語言能夠“無中生有”通過挖掘和統(tǒng)計分析獲得可用于發(fā)表SCI的研究數(shù)據(jù),故追求者眾。掌握此技能,年輸出SCI過3篇并不罕見。如此給力的科研技能,當然不是隨隨便便就能學(xué)會的。?
市面上幾千塊的生信培訓(xùn)班,聽的時候感覺都懂,自己實操每一步都會卡殼。錢多錢少,并不是能否學(xué)會的衡量標準。而這分精美詳細的圖文學(xué)習(xí)手冊,匯總了軟件安裝、基本概念和語法、操作技巧和注意事項等基礎(chǔ)知識,供初入門的小伙們隨時查閱。
?


?
同時,教程里還整理了一套R語言分析TCGA部分數(shù)據(jù)的案例,從入門到實操一脈貫通。更重要的是提供“傻瓜式代碼”。?R語言學(xué)習(xí)路徑上95%的坑,我們都解決過了。
五、領(lǐng)取方式
①轉(zhuǎn)發(fā)本條動態(tài)到朋友圈? ?
②報名免費訓(xùn)練營,營內(nèi)學(xué)習(xí)領(lǐng)取? ? 報名戳:? ? ?