【多組學(xué)】-集成多組學(xué)數(shù)據(jù)的機器學(xué)習(xí)在生物醫(yī)學(xué)中的應(yīng)用
理解?種疾病的某種現(xiàn)象僅使用?種數(shù)據(jù)類型是遠遠不夠的,隨著高通量測序和多組學(xué)的快速發(fā)展,生物醫(yī)學(xué)研究開始采取多組學(xué)技術(shù)結(jié)合的方法,傳統(tǒng)的信息數(shù)據(jù)處理算法不能滿足大數(shù)據(jù)的處理要求,機器學(xué)習(xí)作為從數(shù)據(jù)中進行學(xué)習(xí)的算法,可以對不同組學(xué)來源(如基因組學(xué)、轉(zhuǎn)錄組學(xué)、蛋白質(zhì)組學(xué)、代謝組學(xué))的數(shù)據(jù)進行綜合分析,開發(fā)針對個體多樣性的多因素預(yù)測模型,可以顯著減少需要考慮的潛在治療組合的空間,并識別其他可能被忽視的組合,并可以添加實驗驗證的步驟,以提供額外的證據(jù),從而證明預(yù)測治療可能存在的有效性。機器學(xué)習(xí)在疾病亞型識別、生物標(biāo)志物發(fā)現(xiàn)、通路分析以及藥物發(fā)現(xiàn)及其再利用有著更廣泛的前景和應(yīng)用空間。然而,機器學(xué)習(xí)的應(yīng)用仍存在一些瓶頸,人工智能研究項目所需的技能和知識匱乏缺失制約著該方向的發(fā)展。
1.?本次課程共講授六天,每天六個學(xué)時,共36個學(xué)時,采用“3+3”教學(xué)體系,分兩階段授課,給與學(xué)員充分鞏固和練習(xí)時間;采用在線直播的形式,培訓(xùn)結(jié)束提供無限次直播回放視頻,發(fā)送全部案例代碼,建立永不解散的課程群,長期互動答疑。第一階段旨基礎(chǔ)部分講授三天,旨在讓初學(xué)多組學(xué)聯(lián)合機器學(xué)習(xí)體系課程的學(xué)員們快速掌握多組學(xué)以及機器學(xué)習(xí)基礎(chǔ)理論和在生物醫(yī)學(xué)中的簡單應(yīng)用。適用于前期無編程基礎(chǔ),對機器學(xué)習(xí),生物組學(xué)感興趣的學(xué)員。第一階段進階部分講授三天,旨在幫助學(xué)員提升與掌握多組學(xué)聯(lián)合分析以及深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的應(yīng)用。適用于前期有一定編程基礎(chǔ)(Python),對機器學(xué)習(xí)有一些了解,對生物組學(xué)及在生物醫(yī)學(xué)感興趣的學(xué)員。
2.?基礎(chǔ)主要講授內(nèi)容:機器學(xué)習(xí)基本概念,明確機器學(xué)習(xí)方法的適用性,優(yōu)勢等。有針對的講授python語言基礎(chǔ)、數(shù)據(jù)的基本處理、高維組學(xué)數(shù)據(jù)預(yù)處理與分析以及在多組學(xué)整合分析中最常使用的幾種機器學(xué)習(xí)模型、深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)在多組學(xué)分析的應(yīng)用等。
3.?進階主要講授內(nèi)容:生物標(biāo)志物的挖掘、疾病預(yù)測以及生物分子作用機制、前沿神經(jīng)網(wǎng)絡(luò)如卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)、注意力機制、自編碼器、圖神經(jīng)網(wǎng)絡(luò)在生物組學(xué)中的應(yīng)用、基于基因表達特征建立疾病與小分子藥物之間的關(guān)聯(lián)關(guān)系,運用轉(zhuǎn)錄組學(xué)、蛋白組學(xué)、機器學(xué)習(xí)算法進行藥物重定位、基于生成對抗模型進行單細胞轉(zhuǎn)錄組數(shù)據(jù)深度特征提取。
4.?課程通過基礎(chǔ)入門+進階實例演練的講授思路,從初學(xué)及應(yīng)用研究角度出發(fā),帶大家實戰(zhàn)演練機器學(xué)習(xí)在多組學(xué)整合分析中的數(shù)據(jù)處理、預(yù)測模型以及生物學(xué)意義闡述等,助力大家掌握多種機器學(xué)習(xí)算法模型的構(gòu)建以及在多組學(xué)聯(lián)合分析在腫瘤及慢性病中的實際應(yīng)用,并介紹當(dāng)下深度學(xué)習(xí)算法高維組學(xué)數(shù)據(jù)處理,生物網(wǎng)絡(luò)挖掘的前沿方法,有助于研究創(chuàng)新機器學(xué)習(xí)算法解決生物學(xué)及臨床疾病問題與需求。
?
集成多組學(xué)數(shù)據(jù)的機器學(xué)習(xí)在生物醫(yī)學(xué)中的應(yīng)用
機器學(xué)習(xí)及生物組學(xué)基礎(chǔ)
(提前贈送視頻)
學(xué)習(xí)目標(biāo):對機器學(xué)習(xí)基本概念進行介紹,讓大家對機器學(xué)習(xí)基本概念有大致了解。明確機器學(xué)習(xí)方法的適用性,優(yōu)勢,以及局限性等
什么是機器學(xué)習(xí)
機器學(xué)習(xí)的應(yīng)用實例
生物組學(xué)簡介(基因組學(xué),轉(zhuǎn)錄組學(xué),蛋白組學(xué),代謝組學(xué))
機器學(xué)習(xí)在在多組學(xué)數(shù)據(jù)分析的應(yīng)用
python語言基礎(chǔ)
(提前贈送視頻)
學(xué)習(xí)目標(biāo):機器學(xué)習(xí)主流實現(xiàn)是python語言。學(xué)習(xí)機器學(xué)習(xí)之前,有針對性的對python進行系統(tǒng)的學(xué)習(xí),數(shù)據(jù)的基本處理,以方便將來開展機器學(xué)習(xí)的學(xué)習(xí)
python安裝與開發(fā)環(huán)境的搭建
基本數(shù)據(jù)類型、組合數(shù)據(jù)類型
函數(shù)、列表 、元組、字典、集合
控制結(jié)構(gòu)、循環(huán)結(jié)構(gòu)
Numpy模塊——矩陣的科學(xué)計算
Matplotlib模塊——數(shù)據(jù)處理與繪圖
Pandas模塊——csv數(shù)據(jù)處理與分析
Sklearn模塊——機器學(xué)習(xí)模型基礎(chǔ)軟件包調(diào)用
2?案例教學(xué)一:利用Python pandas讀取組學(xué)CSV數(shù)據(jù)并進行數(shù)據(jù)初步分析
生物組學(xué)大數(shù)據(jù)預(yù)處理與探索分析
?
學(xué)習(xí)目標(biāo):在對高維組學(xué)數(shù)據(jù)進行統(tǒng)計方法分析及機器學(xué)習(xí)建模過程前,需要對數(shù)據(jù)進行預(yù)處理,如缺失值填補,降維可視化等,大數(shù)據(jù)預(yù)處理與探索分析是檢驗數(shù)據(jù)質(zhì)量與了解數(shù)據(jù)分布的必要過程。
高維組學(xué)數(shù)據(jù)的預(yù)處理框架
常用數(shù)據(jù)預(yù)處理方法:缺失值填補,標(biāo)準(zhǔn)化,歸一化,對數(shù)轉(zhuǎn)化
常用的降維方法,PCA,tSNE等
數(shù)據(jù)探索分析(EDA)
2?案例教學(xué)二:利用Python讀取組學(xué)CSV數(shù)據(jù)并進行數(shù)據(jù)探索可視化分析(Exploratory data analysis,EDA)
經(jīng)典機器學(xué)習(xí)模型及多組學(xué)應(yīng)用
學(xué)習(xí)目標(biāo):對在多組學(xué)整合分析中最常使用的幾種機器學(xué)習(xí)模型進行介紹,總結(jié)它們的優(yōu)缺點及適用范圍,通過動手實踐快速掌握幾種方法
線性模型(線性回歸、梯度下降、正則化、回歸的評價指標(biāo))
決策樹(決策樹原理、ID3算法、C4.5算法、CART算法)
支持向量機(線性支持向量機、可分、不可分支持向量機)
集成學(xué)習(xí)(AdaBoost和GBDT算法、XGBoost算法、LightGBM算法)
模型選擇與性能優(yōu)化(數(shù)據(jù)清洗、特征工程、數(shù)據(jù)建模)
Scikit-learn機器學(xué)習(xí)庫的使用
2?案例教學(xué)三:基于轉(zhuǎn)錄組學(xué)數(shù)據(jù)進行端到端的機器學(xué)習(xí)項目泛癌預(yù)測(數(shù)據(jù)預(yù)處理,數(shù)據(jù)建模,模型評估)
2?案例教學(xué)四:基于蛋白組學(xué)-代謝組學(xué)在COVID-19中生物標(biāo)志物發(fā)現(xiàn)研究
深度學(xué)習(xí)在組學(xué)數(shù)據(jù)中的應(yīng)用
?
學(xué)習(xí)目標(biāo):隨著高通量組學(xué)平臺的發(fā)展,生物醫(yī)學(xué)研究大多采取了多組學(xué)技術(shù)結(jié)合的方法,不同組學(xué)來源(如轉(zhuǎn)錄組學(xué)、蛋白質(zhì)組學(xué)和代謝組學(xué))的數(shù)據(jù)可以通過基于深度學(xué)習(xí)的預(yù)測算法進行整合,以揭示系統(tǒng)生物學(xué)的復(fù)雜工作。在這一部分我們會重點對基于深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)進行系統(tǒng)的講解,學(xué)習(xí)常見的神經(jīng)網(wǎng)絡(luò)架構(gòu)在多組學(xué)分析的應(yīng)用。
??深度學(xué)習(xí)介紹,常用神經(jīng)網(wǎng)絡(luò)架構(gòu)介紹
??監(jiān)督學(xué)習(xí)介紹,神經(jīng)網(wǎng)絡(luò)在轉(zhuǎn)錄組學(xué)+代謝組學(xué)的疾病預(yù)測為例
??無監(jiān)督學(xué)習(xí)介紹,高維組學(xué)數(shù)據(jù)降維,聚類分析,以單細胞轉(zhuǎn)錄組數(shù)據(jù)為例
2?案例教學(xué)五:基于t-SNE和UMAP進行單細胞轉(zhuǎn)錄組學(xué)數(shù)據(jù)降維,細胞亞型聚類分析。
深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)基礎(chǔ)與實踐
學(xué)習(xí)目標(biāo):從零開始手動實現(xiàn)一個神經(jīng)網(wǎng)絡(luò),在這一過程中對所涉及的原理進行系統(tǒng)講解及實踐,讓大家能夠更深刻的理解算法背后的原理以及實現(xiàn)方法,之后有利于對其他機器學(xué)習(xí)更全面快速掌握
深度學(xué)習(xí)與機器學(xué)習(xí)區(qū)別與聯(lián)系
Perceptron, 神經(jīng)元基礎(chǔ)
神經(jīng)網(wǎng)絡(luò)的梯度下降法與損失函數(shù)
神經(jīng)網(wǎng)絡(luò)中的前向傳播與反向傳播
神經(jīng)網(wǎng)絡(luò)的模型評估
超參數(shù)優(yōu)化,batch size, learning rate
深度學(xué)習(xí)工具——Pytorch的使用
深度學(xué)習(xí)工具——Keras的使用
2?案例教學(xué)六:基于高維轉(zhuǎn)錄組學(xué)及手動構(gòu)建神經(jīng)網(wǎng)絡(luò)進行特征篩選及預(yù)測
多組學(xué)聯(lián)合分析,闡明疾病分子機制
?
學(xué)習(xí)目標(biāo):從常見的多組學(xué)聯(lián)合分析策略出發(fā),如轉(zhuǎn)錄組+代謝組,蛋白組+代謝組等,對常用的數(shù)理統(tǒng)計分析方法進行介紹,之后學(xué)習(xí)如何利用數(shù)據(jù)庫如KEGG等進行生物功能富集分析,結(jié)合機器學(xué)習(xí)方法進行生物標(biāo)志物的挖掘,疾病預(yù)測以及生物分子作用機制等。
常用生物組學(xué)實驗與分析方法,如轉(zhuǎn)錄組學(xué),代謝組學(xué)
常用組學(xué)數(shù)據(jù)庫介紹,如TCGA,PathBank,HMDB,KEGG
Python批量處理組學(xué)數(shù)據(jù)-歸一化處理,差異分析,相關(guān)性分析
生物功能分析:GO 功能分析、代謝通路富集、分子互作等
基于轉(zhuǎn)錄組學(xué)的差異基因篩選,疾病預(yù)測
基于差異基因,聯(lián)合代謝組學(xué)分析疾病分子發(fā)生機制
??組學(xué)數(shù)據(jù)可視化,如火山圖,t-SNE降維,代謝通路網(wǎng)絡(luò)分析
??組學(xué)特征(基因,蛋白,代謝物)選擇(隨機森林分析)
??單細胞轉(zhuǎn)錄組學(xué)數(shù)據(jù)分析及可視化分析
2?案例教學(xué)七:(包含以下內(nèi)容)
2?轉(zhuǎn)錄組+代謝組的多組學(xué)分析胃癌,實現(xiàn)從“因”和“果”兩個層面來探究生物學(xué)問題,相互間進行驗證
2?從海量的數(shù)據(jù)中篩選出關(guān)鍵基因、代謝物及代謝通路
2?深度解析胃癌腫瘤標(biāo)志物解釋腫瘤發(fā)生發(fā)展的復(fù)雜性和整體性案例
深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)進階
?
學(xué)習(xí)目標(biāo):學(xué)習(xí)前沿神經(jīng)網(wǎng)絡(luò)如卷積神經(jīng)網(wǎng)絡(luò),循環(huán)神經(jīng)網(wǎng)絡(luò),注意力機制,自編碼器,圖神經(jīng)網(wǎng)絡(luò)在生物組學(xué)及藥物篩選的應(yīng)用,遷移學(xué)習(xí)應(yīng)用等。
卷積神經(jīng)網(wǎng)絡(luò)基礎(chǔ)及其應(yīng)用(影像組學(xué))
循環(huán)神經(jīng)網(wǎng)絡(luò)基礎(chǔ)及其應(yīng)用(蛋白組學(xué))
注意力機制基礎(chǔ)及其應(yīng)用
自編碼器基礎(chǔ)及其應(yīng)用(轉(zhuǎn)錄組學(xué))
圖神經(jīng)網(wǎng)絡(luò)基礎(chǔ)及其應(yīng)用(代謝組學(xué))
遷移學(xué)習(xí)
深度學(xué)習(xí)框架——transformer的應(yīng)用
2?案例教學(xué)八:基于自編碼器進行藥物/代謝物分子生成
深度學(xué)習(xí)在組學(xué)數(shù)據(jù)藥物發(fā)現(xiàn)的應(yīng)用
學(xué)習(xí)目標(biāo):基于基因表達特征建立疾病與小分子藥物之間的關(guān)聯(lián)關(guān)系,運用轉(zhuǎn)錄組學(xué),蛋白組學(xué),機器學(xué)習(xí)算法進行藥物重定位。
基于生物組學(xué)的藥物發(fā)現(xiàn)基礎(chǔ)介紹
藥物分子化學(xué)特征提?。ǚ肿又讣y,描述符,分子圖)
圖神經(jīng)網(wǎng)絡(luò)預(yù)測藥物分子性質(zhì)
基于胰腺癌差異表達基因進行藥物重定位
2?案例教學(xué)九:基于機器學(xué)習(xí)與圖神經(jīng)網(wǎng)絡(luò)進行代謝物/藥物分子的性質(zhì)預(yù)測
2?案例教學(xué)十:以阿爾茨海默病為例,基于轉(zhuǎn)錄組學(xué)差異表達基因與深度學(xué)習(xí)模型進行藥物重定位
AI+Science
學(xué)習(xí)目標(biāo):人工智能領(lǐng)域前沿內(nèi)容,讓大家了解最新的多組學(xué)與機器學(xué)習(xí)領(lǐng)域的研究動態(tài),同時介紹幾種更為先進的機器學(xué)習(xí)算法。
集成學(xué)習(xí)在多組學(xué)數(shù)據(jù)聯(lián)合分析中的應(yīng)用
多組學(xué)數(shù)據(jù)庫在生物信息網(wǎng)絡(luò)的挖掘與應(yīng)用
生成模型在多組學(xué)數(shù)據(jù)的應(yīng)用與挑戰(zhàn)
影像組學(xué)進階,弱監(jiān)督學(xué)習(xí)進行影像組學(xué)的數(shù)據(jù)自動標(biāo)注與分類
2?案例教學(xué)十一:基于生成對抗模型進行單細胞轉(zhuǎn)錄組數(shù)據(jù)深度特征提取
時間:
?2022年12月02日-12月04日???在線直播(授課三天)
?2022年12月16日-12月18日???在線直播(授課三天)
講師:
由教育部直屬全國重點大學(xué),國家“雙一流”A類,“985”,?“211”重點建設(shè)高校醫(yī)學(xué)院副教授,碩士生導(dǎo)師主講。中科院院士團隊骨干成員,美國Top50大學(xué)博士,博士后。近五年發(fā)表SCI論文10余篇。主持和參與國家級,省部級自然科學(xué)基金項目多項,擁有多年生物醫(yī)學(xué)數(shù)據(jù)挖掘結(jié)合人工智能算法研究經(jīng)驗。主要擅長多組學(xué)聯(lián)合分析在腫瘤等疾病的機制研究和生物多組學(xué)的算法開發(fā)。
?
費用:
每人¥5600元(含報名費、培訓(xùn)費、資料費)
費用提供用于報銷正規(guī)機打發(fā)票及蓋有公章的紙質(zhì)通知文件;如需開具會議費的單位請聯(lián)系招生老師索取會議邀請函;
增值服務(wù):
1、凡報名學(xué)員將獲得本次所學(xué)班的培訓(xùn)書本教材(或PPT課件)及隨堂全部案例代碼資料
2、提前發(fā)送軟件安裝及理論部分及python語言基礎(chǔ)教學(xué)視頻,培訓(xùn)結(jié)束可獲得本期全部無限次回放.
3、價格優(yōu)惠:
優(yōu)惠一:2022年11月11日前報名并繳費可享受400元優(yōu)惠(僅限前十名);
優(yōu)惠二:老客戶參加或者推薦學(xué)員可享受額外優(yōu)惠(具體請咨詢招生聯(lián)系人)
4、學(xué)員提出的各自遇到的問題在課程結(jié)束后可以長期得到老師的解答與指導(dǎo);
5、參加培訓(xùn)并通過考試的學(xué)員,可以獲得:北京軟研國際信息技術(shù)研究院培訓(xùn)中心頒發(fā)的《機器學(xué)習(xí)多組學(xué)與生物醫(yī)學(xué)應(yīng)用工程師》專業(yè)技能結(jié)業(yè)證書;
聯(lián)系方式:
官方聯(lián)系人:? 科宇老師 ?????電話/微信:13520456594 ????????????