人工智能與組學(xué)研究專題培訓(xùn)內(nèi)容
? ? ? ??
? 如果您在從事生物醫(yī)學(xué)方面的研究
? ? ? ? ? ? ? ?并且有發(fā)頂刊的想法
下面這篇內(nèi)容會(huì)給你思路和方法
? ? ? ? ? ? ? ? ? ?四大專題內(nèi)容
專題一:機(jī)器學(xué)習(xí)在蛋白質(zhì)組學(xué)實(shí)踐應(yīng)用專題線上培訓(xùn)
專題二:機(jī)器學(xué)習(xí)在代謝組學(xué)實(shí)踐應(yīng)用專題線上培訓(xùn)
專題三:深度學(xué)習(xí)在基因組學(xué)實(shí)踐應(yīng)用專題線上培訓(xùn)
專題四:機(jī)器學(xué)習(xí)在微生物組學(xué)時(shí)間應(yīng)用專題線上培訓(xùn)
課程內(nèi)容一:機(jī)器學(xué)習(xí)在蛋白質(zhì)組學(xué)實(shí)踐應(yīng)用
? ? ? ???
1.人工智能早已在生物醫(yī)學(xué)領(lǐng)域被廣泛應(yīng)用。在蛋白質(zhì)組領(lǐng)域,人工智能也逐漸滲透到了蛋白質(zhì)組的基礎(chǔ)鑒定、定量技術(shù),以及質(zhì)譜信息和臨床研究相結(jié)合的數(shù)據(jù)挖掘中。
2.蛋白質(zhì)組學(xué)+AI,會(huì)不會(huì)是下一個(gè)研究焦點(diǎn)?
答案是:會(huì)是的!
3.醫(yī)學(xué)TOP期刊Nature Medicine(影響因子: 87.241)
JACC雜志上(IF 24.094).......
? ? ???能夠快速運(yùn)用到自己的科研項(xiàng)目和課題上,助力學(xué)員發(fā)表Nature、Science、Cell等正刊及子刊!(在新技術(shù)加持下,用更少的經(jīng)費(fèi),發(fā)更高質(zhì)量的文章)
主講老師
? ? ? ? ??
? ? ??機(jī)器學(xué)習(xí)與蛋白組學(xué)實(shí)戰(zhàn)應(yīng)用培訓(xùn)班主講老師來(lái)自國(guó)內(nèi)高校李老師授課,有十余年的微生物組數(shù)據(jù)分析經(jīng)驗(yàn)。研究領(lǐng)域涉及機(jī)器學(xué)習(xí),芯片數(shù)據(jù)分析,微生物組數(shù)據(jù)分析,DNA,RNA,甲基化測(cè)序數(shù)據(jù)分析,單細(xì)胞測(cè)序數(shù)據(jù)分析,miRNA及靶基因分析等,發(fā)表SCI論文30余篇,其中一作及并列一作15篇。

課程內(nèi)容
課程一:機(jī)器學(xué)習(xí)在蛋白質(zhì)組學(xué)實(shí)踐應(yīng)用專題線上培訓(xùn)班課表
第一天
機(jī)器學(xué)習(xí)及蛋白組學(xué)簡(jiǎn)介
1.機(jī)器學(xué)習(xí)基本概念介紹
2.常用機(jī)器學(xué)習(xí)模型介紹
3.混淆矩陣
4.ROC曲線
5.主成分分析(PCA)
6.蛋白組學(xué)基本概念
R語(yǔ)言簡(jiǎn)介及實(shí)操
1.R語(yǔ)言概述
2.R軟件及R包安裝
3.R語(yǔ)言語(yǔ)法及數(shù)據(jù)類型
4.條件語(yǔ)句
5.循環(huán)
6.函數(shù)
7.常用的機(jī)器學(xué)習(xí)相關(guān)R包介紹
第二天
機(jī)器學(xué)習(xí)在蛋白組學(xué)數(shù)據(jù)分析中的應(yīng)用案例分享
1.利用機(jī)器學(xué)習(xí)鑒定疾病相關(guān)蛋白標(biāo)志物
2.利用機(jī)器學(xué)習(xí)基于蛋白組學(xué)數(shù)據(jù)預(yù)測(cè)表型
3.利用機(jī)器學(xué)習(xí)基于蛋白組學(xué)數(shù)據(jù)進(jìn)行分類
4.利用機(jī)器學(xué)習(xí)基于蛋白組學(xué)數(shù)據(jù)構(gòu)建預(yù)后模型
蛋白組學(xué)相關(guān)數(shù)據(jù)庫(kù)介紹
1.Uniport
2.HPA
3.TCPA
4.CPTAC
第三天(實(shí)操)
零代碼工具利用機(jī)器學(xué)習(xí)分析蛋白組學(xué)數(shù)據(jù)
利用PLOS Computational Biology(IF:5分)發(fā)表零代碼工具,輕松完成差異表達(dá)分析,常見統(tǒng)計(jì)分析,常見可視化,內(nèi)置7種機(jī)器學(xué)習(xí)方法,輕松調(diào)用。
1.數(shù)據(jù)導(dǎo)入(兩套數(shù)據(jù),二分類,多分類)
2.數(shù)據(jù)可視化(散點(diǎn)圖,熱圖,柱形圖,相關(guān)性熱圖,火山圖,層次聚類圖)
3.缺失值填充
4.數(shù)據(jù)歸一化
5.離群值檢測(cè)/清理
6.常見統(tǒng)計(jì)方法應(yīng)用(t-test, limma, Kruskal-Wallis?,ANOVA, PCA, k-means,?相關(guān)性分析)
7.機(jī)器學(xué)習(xí)方法應(yīng)用(RF,?lasso,?SVM等)
第四天(實(shí)操)
利用機(jī)器學(xué)習(xí)基于蛋白組學(xué)數(shù)據(jù)預(yù)測(cè)表型,基于蛋白組學(xué)數(shù)據(jù)復(fù)現(xiàn)cell中機(jī)器學(xué)習(xí)分析結(jié)果
實(shí)操內(nèi)容
1.蛋白組學(xué)數(shù)據(jù)處理,差異表達(dá)分析
2.火山圖,多分組熱圖,多組箱型圖展示差異表達(dá)分析結(jié)果
3.構(gòu)建Random Forest模型
4.重要蛋白篩選
5.繪制ROC曲線
6.獨(dú)立測(cè)試集檢測(cè)模型表現(xiàn)
利用機(jī)器學(xué)習(xí)鑒定疾病相關(guān)蛋白標(biāo)志物,基于Olink數(shù)據(jù),復(fù)現(xiàn)影響因子17分文章中,蛋白數(shù)據(jù)常規(guī)分析+時(shí)序蛋白聚類分析+機(jī)器學(xué)習(xí)分析結(jié)果
實(shí)操內(nèi)容
1.讀取蛋白表達(dá)數(shù)據(jù)
2.差異蛋白挑選,火山圖繪制,箱型圖繪制
3.時(shí)序蛋白表達(dá)數(shù)據(jù)聚類分析
4.構(gòu)建隨機(jī)森林模型
5.挑選重要特征
6.獨(dú)立測(cè)試集進(jìn)行驗(yàn)證
第五天(實(shí)操)
利用機(jī)器學(xué)習(xí)基于質(zhì)譜的蛋白質(zhì)組學(xué)數(shù)據(jù),構(gòu)建肝病相關(guān)分類和預(yù)后模型,復(fù)現(xiàn)Nature?Medicine文章中的機(jī)器學(xué)習(xí),生存分析,預(yù)后模型相關(guān)的結(jié)果。
實(shí)操內(nèi)容
1.鑒定與不同肝病顯著相關(guān)的蛋白
2.比較22種不同的機(jī)器學(xué)習(xí)分類器,挑選最優(yōu)算法構(gòu)建不同肝病的分類模型
3.獨(dú)立隊(duì)列驗(yàn)證模型準(zhǔn)確性
4.構(gòu)建預(yù)后模型
繪制生存曲線和時(shí)間依賴的ROC曲線
機(jī)器學(xué)習(xí)模型構(gòu)建,特征篩選,模型評(píng)估(ROC曲線)圖

蛋白差異表達(dá)分析火山圖

課程內(nèi)容二:機(jī)器學(xué)習(xí)在代謝組學(xué)實(shí)踐應(yīng)用? ? ??
代謝組學(xué)是通過(guò)比較對(duì)照組和實(shí)驗(yàn)組,以尋找代謝譜差異的研究方法,近年來(lái),代謝組學(xué)在疾病診斷,病理研究,新藥開發(fā),藥物毒理學(xué),動(dòng)植物、微生物,營(yíng)養(yǎng)學(xué)等醫(yī)學(xué)與人類健康和疾病密切相關(guān)的領(lǐng)域有著廣泛的應(yīng)用,在復(fù)雜數(shù)據(jù)中,人工智能算法用于生物標(biāo)志物挖掘的組合是解決問(wèn)題和實(shí)施健康科學(xué)新技術(shù)的常用方法。利用機(jī)器學(xué)習(xí)作為從質(zhì)譜數(shù)據(jù)中識(shí)別疾病的手段,旨在開發(fā)診斷和預(yù)后生物標(biāo)志物、治療靶點(diǎn)和患者管理系統(tǒng)。
? ? ???能夠快速運(yùn)用到自己的科研項(xiàng)目和課題上,助力學(xué)員發(fā)表Nature、Science、Cell等正刊及子刊?。ㄔ谛录夹g(shù)加持下,用更少的經(jīng)費(fèi),發(fā)更高質(zhì)量的文章)
主講老師

? ? ? ? ??
? ? ?機(jī)器學(xué)習(xí)代謝組學(xué)主講老師來(lái)自985高校神經(jīng)科學(xué)博士,主要利用代謝組學(xué)、轉(zhuǎn)錄組學(xué)和分子生物學(xué)等技術(shù)研究神經(jīng)內(nèi)科慢性病的發(fā)病機(jī)制和生物標(biāo)志物。擅長(zhǎng)高效液相色譜-質(zhì)譜聯(lián)用(LC-MS)技術(shù)進(jìn)行非靶向和靶向代謝組學(xué)從樣本制備到數(shù)據(jù)分析的全流程研究,以及多組學(xué)大數(shù)據(jù)的生物信息學(xué)整合分析。5年內(nèi)在J Clin Invest, EBioMedicine, Cell Death Dis, Cell Death Discov, Nanotoxicology等雜志發(fā)表SCI論文10篇。
課程內(nèi)容
課程二:機(jī)器學(xué)習(xí)在代謝組學(xué)實(shí)踐應(yīng)用專題線上培訓(xùn)課表
第一天上午:
A1?代謝物及代謝組學(xué)的發(fā)展與應(yīng)用
(1)?????代謝生理功能;
(2)?????代謝疾??;
(3) ????非靶向與靶向代謝組學(xué);
(4) ????空間代謝組學(xué)與質(zhì)譜成像 ?(MSI) ?;
(5) ????代謝流與機(jī)制研究;
(6) ????代謝組學(xué)與藥物和生物標(biāo)志物。
A2?代謝組學(xué)實(shí)驗(yàn)流程簡(jiǎn)介
第一天下午:
A3?色譜?、質(zhì)譜硬件原理
(1) ????色譜分析原理;
(2) ????色譜的氣相、液相和固相;
(3) ????色譜儀和色譜柱的選擇;
(4) ????質(zhì)譜分析原理及動(dòng)畫演示;
(5)?????正?、負(fù)離子電離模式;
(6) ????色譜質(zhì)譜聯(lián)用技術(shù);
(7) ????LC-MS?的液相系統(tǒng)
A4?代謝通路及代謝數(shù)據(jù)庫(kù)
(1) ????幾種經(jīng)典代謝通路簡(jiǎn)介;
(2)?????能量代謝通路;
(3) ????三大常見代謝物庫(kù): ??HMDB?、METLIN?和?KEGG;
(4) ????代謝組學(xué)原始數(shù)據(jù)庫(kù):?Metabolomics?Workbench?和?Metabolights.
第二天上午:
B1?代謝物樣本處理與抽提
(1) ????組織?、血液和體液樣本的提取流程與注意事項(xiàng);
(2) ????用?ACN?抽提代謝物的流程與注意事項(xiàng);
(3) ????樣本及代謝物的運(yùn)輸與保存問(wèn)題;
B2?LC-MS?數(shù)據(jù)質(zhì)控與搜庫(kù)
(1) ????LC-MS?實(shí)驗(yàn)過(guò)程中QC?樣本的設(shè)置方法;
(2) ????LC-MS?上機(jī)過(guò)程的數(shù)據(jù)質(zhì)控監(jiān)測(cè)和分析;
(3) ????XCMS?軟件數(shù)據(jù)轉(zhuǎn)換與提峰;
第二天下午:
B3?R?軟件基礎(chǔ)
(1) ????R?和?Rstudio?的安裝;
(2) ????Rstudio?的界面配置;
(3)?????R?的基本數(shù)據(jù)結(jié)構(gòu)和語(yǔ)法;
(4)?????下載與加載包;
(5) ????函數(shù)調(diào)用和?debug;
B4 ggplot2
(1) ????安裝并使用?ggplot2
(2) ????ggplot2?的畫圖哲學(xué);
(3) ????ggplot2?的配色系統(tǒng);
(4) ????ggplot2?畫組合圖和火山圖;
第三天上午:??機(jī)器學(xué)習(xí)
C1?無(wú)監(jiān)督式機(jī)器學(xué)習(xí)在代謝組學(xué)數(shù)據(jù)處理中的應(yīng)用
(1) ????大數(shù)據(jù)處理中的降維;
(2)?????PCA?分析作圖;
(3) ????三種常見的聚類分析:K-means?、層次分析與?SOM
(4) ????熱圖和?hcluster?圖的?R?語(yǔ)言實(shí)現(xiàn);
C2?一組代謝組學(xué)數(shù)據(jù)的降維與聚類分析的?R?演練
(1)?數(shù)據(jù)解析;
(2)?演練與操作;
第三天下午:
C3?有監(jiān)督式機(jī)器學(xué)習(xí)在代謝組學(xué)數(shù)據(jù)處理中的應(yīng)用
(1) ????數(shù)據(jù)用?PCA?降維處理后仍然無(wú)法找到差異怎么辦?
(2) ????PLS-DA?找出最可能影響差異的代謝物;
(3) ????VIP?score?和?coef?的意義及選擇;
(4) ????分類算法:支持向量機(jī),隨機(jī)森林
C4?一組代謝組學(xué)數(shù)據(jù)的分類算法實(shí)現(xiàn)的?R?演練
(1)?數(shù)據(jù)解讀;
(2)?演練與操作;
第四天上午:
D1?代謝組學(xué)數(shù)據(jù)清洗與?R?語(yǔ)言進(jìn)階
(1) ????代謝組學(xué)中的?t?、fold-change?和響應(yīng)值;
(2)?????數(shù)據(jù)清洗流程;
(3) ????R?語(yǔ)言?tidyverse
(4) ????R?語(yǔ)言正則表達(dá)式;
(5) ????代謝組學(xué)數(shù)據(jù)過(guò)濾;
(6) ????代謝組學(xué)數(shù)據(jù)?Scaling?原理與?R?實(shí)現(xiàn);
(7) ????代謝組學(xué)數(shù)據(jù)的?Normalization;
(8) ????代謝組學(xué)數(shù)據(jù)清洗演練;
第四天下午:
D2?在線代謝組分析網(wǎng)頁(yè)?Metaboanalyst?操作
(1) ????用?R?將數(shù)據(jù)清洗成網(wǎng)頁(yè)需要的格式;
(2) ????獨(dú)立組、配對(duì)組和多組的數(shù)據(jù)格式問(wèn)題;
(3) ????Metaboanalyst?的?pipeline?和注意事項(xiàng);
(4) ????Metaboanalyst?的結(jié)果查看和導(dǎo)出;
(5) ????Metaboanalyst?的數(shù)據(jù)編輯;
(6) ????全流程演練與操作。
第五天上午:
E1?機(jī)器學(xué)習(xí)與代謝組學(xué)頂刊解讀??(2-3?篇) ?;
(1) ????Nature Communication?一篇代謝組學(xué)小鼠腦組織樣本?database?類型的文獻(xiàn);
(2) ????Cell?一篇代謝組學(xué)患者血液樣本的機(jī)器學(xué)習(xí)與疾病判斷的文獻(xiàn);
(3)?????1-2?篇代謝組學(xué)與轉(zhuǎn)錄組學(xué)和蛋白組學(xué)結(jié)合的文獻(xiàn)。
第五天下午:
E2?文獻(xiàn)數(shù)據(jù)分析部分復(fù)現(xiàn)??(1篇)
(1)?????文獻(xiàn)深度解讀;
(2) ????實(shí)操:從原始數(shù)據(jù)下載到圖片復(fù)現(xiàn);
(3)?????學(xué)員實(shí)操。
? ? ? ? ? ? ?
課程內(nèi)容三:機(jī)器學(xué)習(xí)在微生物組學(xué)實(shí)踐應(yīng)用? ? ? ?
? ? ? ? ??自然微生物綜述( IF:31.851)于2018年在線發(fā)表了微生物組領(lǐng)域的研究方法綜述,不僅系統(tǒng)總結(jié)了過(guò)去,更為未來(lái)3-5年內(nèi)本領(lǐng)域研究方法的選擇,提供了清晰的技術(shù)路線,讓大家做出更好的研究,微生物組學(xué)研究主要涉及兩方面技術(shù):測(cè)序技術(shù)和數(shù)據(jù)分析技術(shù),隨著基因測(cè)序技術(shù)的進(jìn)步和測(cè)序成本不斷下降,大樣本量的微生物組學(xué)研究激增。傳統(tǒng)的統(tǒng)計(jì)方法已經(jīng)不再適用于極度高維、稀疏的微生物組數(shù)據(jù)分析,而適用于復(fù)雜數(shù)據(jù)分析的機(jī)器學(xué)習(xí)逐漸成為微生物組學(xué)數(shù)據(jù)分析的首選方法。機(jī)器學(xué)習(xí)已被證明是分析微生物群落數(shù)據(jù)并對(duì)特定結(jié)果進(jìn)行預(yù)測(cè)(包括人類和環(huán)境健康)的有效方法,基于微生物群落數(shù)據(jù)的機(jī)器學(xué)習(xí)已被成功用于預(yù)測(cè)人類健康中的疾病狀態(tài)、環(huán)境質(zhì)量和環(huán)境中污染的存在,并可以作為法醫(yī)學(xué)中的微量證據(jù)。機(jī)器學(xué)習(xí)算法已經(jīng)在腸道微生物、微生物組數(shù)組表型、環(huán)境微生物、微生物生態(tài)學(xué)、皮膚微生物、土壤微生物、植物微生物、人體微生物等領(lǐng)域應(yīng)用廣泛,通過(guò)查閱文獻(xiàn)發(fā)現(xiàn)近幾年機(jī)器學(xué)習(xí)在微生物組研究發(fā)刊分值都很高,特別是在Nature Communications、Advanced Materials(IF=30.849)、Water Research Nature Microbiology、Environment International 、Nature Methods、Cell Regeneration、JAIMS等期刊多次發(fā)表!
主講老師
? ? ? ? ??
? ? ?機(jī)器學(xué)習(xí)微生物組學(xué)與蛋白組學(xué)主講老師來(lái)自國(guó)內(nèi)高校李老師授課,有十余年的微生物組數(shù)據(jù)分析經(jīng)驗(yàn)。研究領(lǐng)域涉及機(jī)器學(xué)習(xí),芯片數(shù)據(jù)分析,微生物組數(shù)據(jù)分析,DNA,RNA,甲基化測(cè)序數(shù)據(jù)分析,單細(xì)胞測(cè)序數(shù)據(jù)分析,miRNA及靶基因分析等,發(fā)表SCI論文30余篇,其中一作及并列一作15篇。
課程內(nèi)容
課程三:機(jī)器學(xué)習(xí)在微生物組學(xué)實(shí)踐應(yīng)用專題線上培訓(xùn)班課表
第一天
機(jī)器學(xué)習(xí)及微生物學(xué)簡(jiǎn)介
1.機(jī)器學(xué)習(xí)基本概念介紹
2.常用機(jī)器學(xué)習(xí)模型介紹(GLM,BF,SVM,lasso,KNN等等)
3.混淆矩陣
4.ROC曲線
5.主成分分析(PCA)
6.微生物學(xué)基本概念
7.微生物學(xué)常用分析介紹
R語(yǔ)言簡(jiǎn)介及實(shí)操
1.R語(yǔ)言概述
2.R軟件及R包安裝
3.R語(yǔ)言語(yǔ)法及數(shù)據(jù)類型
4.條件語(yǔ)句
5.循環(huán)
6.函數(shù)
7.常用的機(jī)器學(xué)習(xí)和微生物數(shù)據(jù)相關(guān)的R包介紹
第二天
機(jī)器學(xué)習(xí)在微生物學(xué)中的應(yīng)用案例分享
1.利用機(jī)器學(xué)習(xí)基于微生物組學(xué)數(shù)據(jù)預(yù)測(cè)宿主表型
2.利用機(jī)器學(xué)習(xí)基于微生物組學(xué)數(shù)據(jù)預(yù)測(cè)疾病狀態(tài)
3.利用機(jī)器學(xué)習(xí)預(yù)測(cè)微生物風(fēng)險(xiǎn)
4.機(jī)器學(xué)習(xí)研究飲食對(duì)腸道微生物的影響
微生物學(xué)常用分析(實(shí)操)
1.微生物豐度分析
2.α-diversity,β-diversity分析
3.進(jìn)化樹構(gòu)建
4.降維分析
5.基于OTU的差異表達(dá)分析,熱圖,箱型圖繪制
6.微生物biomarker鑒定
第三天(實(shí)操)
零代碼工具利用機(jī)器學(xué)習(xí)分析微生物組學(xué)數(shù)據(jù)
1.加載數(shù)據(jù)及數(shù)據(jù)歸一化
2.構(gòu)建訓(xùn)練模型(GLM, RF, SVM)
3.模型參數(shù)優(yōu)化
4.模型錯(cuò)誤率曲線繪制
5.混淆矩陣計(jì)算
6.重要特征篩選
7.模型驗(yàn)證,ROC曲線繪制
8.利用模型進(jìn)行預(yù)測(cè)
第四天(實(shí)操)
利用機(jī)器學(xué)習(xí)基于微生物組學(xué)數(shù)據(jù)預(yù)測(cè)宿主表型(二分類變量以及連續(xù)變量)
1.加載數(shù)據(jù)(三套數(shù)據(jù))
2.數(shù)據(jù)歸一化
3.OUT特征處理
4.機(jī)器學(xué)習(xí)模型構(gòu)建(RF, KNN, SVM, Lasso等9種機(jī)器學(xué)習(xí)方法)
5.5倍交叉驗(yàn)證
6.繪制ROC?曲線,比較不同機(jī)器學(xué)習(xí)模型
7.模型性能評(píng)估
第五天(實(shí)操)
利用機(jī)器學(xué)習(xí)預(yù)測(cè)微生物風(fēng)險(xiǎn)(多分類)
1.加載數(shù)據(jù)
2.機(jī)器學(xué)習(xí)模型構(gòu)建(RF, gbm, SVM, LogitBoost等等)
3.10倍交叉驗(yàn)證
4.模型性能評(píng)估
利用機(jī)器學(xué)習(xí)預(yù)測(cè)刺激前后腸道菌群變化
1.數(shù)據(jù)加載及預(yù)處理
2.α-diversity,β-diversity分析
3.RF模型構(gòu)建(比較分別基于OUT,KO,phylum的模型效果)
4.10倍交叉驗(yàn)證,?留一法驗(yàn)證
5.特征篩選及重要特征可視化
外部數(shù)據(jù)測(cè)試模型
課程內(nèi)容四:深度學(xué)習(xí)在基因組學(xué)實(shí)踐應(yīng)用? ? ? ??
? ? ? ? ???深度學(xué)習(xí)已經(jīng)被廣泛應(yīng)用于基因組學(xué)研究中,利用已知的訓(xùn)練集對(duì)數(shù)據(jù)的類型和應(yīng)答結(jié)果進(jìn)行預(yù)測(cè),深度學(xué)習(xí),可以進(jìn)行預(yù)測(cè)和降維分析。深度學(xué)習(xí)模型的能力更強(qiáng)且更靈活,在適當(dāng)?shù)挠?xùn)練數(shù)據(jù)下,深度學(xué)習(xí)可以在較少人工參與的情況下自動(dòng)學(xué)習(xí)特征和規(guī)律。調(diào)控基因組學(xué),變異檢測(cè),致病性評(píng)分成功應(yīng)用。深度學(xué)習(xí)可以提高基因組數(shù)據(jù)的可解釋性,并將基因組數(shù)據(jù)轉(zhuǎn)化為可操作的臨床信息。深度學(xué)習(xí)通過(guò)強(qiáng)大的深度神經(jīng)網(wǎng)絡(luò)模型從高維大數(shù)據(jù)中自動(dòng)挖掘數(shù)據(jù)潛在特征得以實(shí)現(xiàn),過(guò)去10年,深度學(xué)習(xí)在計(jì)算機(jī)視覺(jué)、語(yǔ)音識(shí)別、自然語(yǔ)言處理領(lǐng)域取得了巨大成功。基因組學(xué)大數(shù)據(jù)與疾病表型間的復(fù)雜關(guān)系難以解析,運(yùn)用深度學(xué)習(xí)挖掘多組學(xué)數(shù)據(jù)探索復(fù)雜疾病致病機(jī)制及藥物反應(yīng)機(jī)制將會(huì)極大的提升精準(zhǔn)醫(yī)學(xué)和轉(zhuǎn)化醫(yī)學(xué)的進(jìn)度。,近兩年國(guó)內(nèi)外頂尖課題組MIT、Harvard University、UPenn、清華大學(xué)、復(fù)旦大學(xué)等都在從事深度學(xué)習(xí)基因組學(xué)的研究,這一研究成果更是多次發(fā)表在Nature Reviews Genetics、Nature Methods、Science Advances、Cancer Cell、Nature Biotechnology等知名國(guó)際頂刊上,為我們發(fā)表頂刊鑒定了基礎(chǔ)。
主講老師
主講老師劉老師,生物信息學(xué)博士,有十余年的測(cè)序數(shù)據(jù)分析經(jīng)驗(yàn)。研究領(lǐng)域涉及人工智能、自然語(yǔ)言處理、功能基因組學(xué)、轉(zhuǎn)錄組學(xué)、miRNA及靶基因網(wǎng)絡(luò)分析,單細(xì)胞測(cè)序數(shù)據(jù)分析,基因調(diào)控網(wǎng)絡(luò)時(shí)序分析,蛋白質(zhì)互作網(wǎng)絡(luò)分析,多組學(xué)聯(lián)合分析等。主持省自然科學(xué)基金等項(xiàng)目4項(xiàng),出版醫(yī)學(xué)實(shí)用教材《Python醫(yī)學(xué)實(shí)戰(zhàn)分析》,發(fā)表SCI論文22篇,其中一作及并列一作9篇。
課程內(nèi)容
課程四:深度學(xué)習(xí)在基因組學(xué)實(shí)踐應(yīng)用專題線上培訓(xùn)班課表
第一天
理論部分
深度學(xué)習(xí)算法介紹
1.有監(jiān)督學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)算法
1.1全連接深度神經(jīng)網(wǎng)絡(luò)DNN在基因組學(xué)中的應(yīng)用舉例
1.2卷積神經(jīng)網(wǎng)絡(luò)CNN在基因組學(xué)中的應(yīng)用舉例
1.3循環(huán)神經(jīng)網(wǎng)絡(luò)RNN在基因組學(xué)中的應(yīng)用舉例
1.4圖卷積神經(jīng)網(wǎng)絡(luò)GCN在基因組學(xué)中的應(yīng)用舉例
2.無(wú)監(jiān)督的神經(jīng)網(wǎng)絡(luò)算法
2.1自動(dòng)編碼器AE在基因組學(xué)中的應(yīng)用舉例
2.2生成對(duì)抗網(wǎng)絡(luò)GAN在基因組學(xué)中的應(yīng)用舉例
實(shí)操內(nèi)容
1.Linux操作系統(tǒng)
1.1常用的Linux命令
1.2 Vim編輯器
1.3基因組數(shù)據(jù)文件管理, 修改文件權(quán)限
1.4查看探索基因組區(qū)域
2.Python語(yǔ)言基礎(chǔ)
2.1.Python包安裝和環(huán)境搭建
2.2.常見的數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)類型
第二天
理論部分
基因組學(xué)基礎(chǔ)
1.基因組數(shù)據(jù)庫(kù)
2.表觀基因組
3.轉(zhuǎn)錄基因組
4.蛋白質(zhì)組
5.功能基因組
實(shí)操內(nèi)容
基因組常用深度學(xué)習(xí)框架
1.安裝并介紹深度學(xué)習(xí)工具包tensorflow, keras,pytorch
2.在工具包中識(shí)別深度學(xué)習(xí)模型要素
2.1.數(shù)據(jù)表示
2.2.張量運(yùn)算
2.3.神經(jīng)網(wǎng)絡(luò)中的“層”
2.4.由層構(gòu)成的模型
2.5.損失函數(shù)與優(yōu)化器
2.6.數(shù)據(jù)集分割
2.7.過(guò)擬合與欠擬合
3.基因組數(shù)據(jù)處理
3.1安裝并使用keras_dna處理各種基因序列數(shù)據(jù)如BED、 GFF、GTF、BIGWIG、BEDGRAPH、WIG等
3.2使用keras_dna設(shè)計(jì)深度學(xué)習(xí)模型
3.3使用keras_dna分割訓(xùn)練集、測(cè)試集
3.4使用keras_dna選取特定染色體的基因序列等
4.深度神經(jīng)網(wǎng)絡(luò)DNN在識(shí)別基序特征中應(yīng)用
4.1實(shí)現(xiàn)單層單過(guò)濾器DNN識(shí)別基序
4.2實(shí)現(xiàn)多層單過(guò)濾器DNN識(shí)別基序
4.3實(shí)現(xiàn)多層多過(guò)濾器DNN識(shí)別基序
第三天
理論部分
卷積神經(jīng)網(wǎng)絡(luò)CNN在基因調(diào)控預(yù)測(cè)中的應(yīng)用
1.Chip-Seq中識(shí)別基序特征G4,如DeepG4
2.Chip-Seq中預(yù)測(cè)DNA甲基化,DeepSEA
3.Chip-Seq中預(yù)測(cè)轉(zhuǎn)錄調(diào)控因子結(jié)合,DeepSEA
4.DNase-seq中預(yù)測(cè)染色體親和性,Basset
5.DNase-seq中預(yù)測(cè)基因表達(dá)eQTL,Enformer
實(shí)操內(nèi)容
復(fù)現(xiàn)卷積神經(jīng)網(wǎng)絡(luò)CNN識(shí)別基序特征DeepG4、非編碼基因突變DeepSEA,預(yù)測(cè)染色體親和性Basset,基因表達(dá)eQTL
1.復(fù)現(xiàn)DeepG4從Chip-Seq中識(shí)別G4特征
2.安裝selene_sdk,復(fù)現(xiàn)DeepSEA從Chip-Seq中預(yù)測(cè)DNA甲基化,非編碼基因突變
3.復(fù)現(xiàn)Basset,從Chip-Seq中預(yù)測(cè)染色體親和性
4.復(fù)現(xiàn)Enformer,從Chip-Seq中預(yù)測(cè)基因表達(dá)eQTL
第四天
理論部分
深度學(xué)習(xí)在識(shí)別拷貝數(shù)變異DeepCNV、調(diào)控因子DeepFactor上的應(yīng)用
1.SNP微陣列中預(yù)測(cè)拷貝數(shù)變異CNV,DeepCNV
2.RNA-Seq中預(yù)測(cè)premiRNA,dnnMiRPre
3.從蛋白序列中預(yù)測(cè)調(diào)控因子蛋白質(zhì),DeepFactor
實(shí)操內(nèi)容
1.復(fù)現(xiàn)DeepCNV利用SNP微陣列聯(lián)合圖像分析識(shí)別拷貝數(shù)變異
2.復(fù)現(xiàn)循環(huán)神經(jīng)網(wǎng)絡(luò)RNN工具?dnnMiRPre,從RNA-Seq中預(yù)測(cè)premiRNA?
3.復(fù)現(xiàn)DeepFactor,從蛋白序列中識(shí)別轉(zhuǎn)錄調(diào)控因子蛋白質(zhì)
第五天
理論部分
深度學(xué)習(xí)在識(shí)別及疾病表型及生物標(biāo)志物上的應(yīng)用
1.從基因表達(dá)數(shù)據(jù)中識(shí)別乳腺癌分型的深度學(xué)習(xí)工具DeepType
2.從高維多組學(xué)數(shù)據(jù)中識(shí)別疾病表型,XOmiVAE
3.基因序列及蛋白質(zhì)相互作用網(wǎng)絡(luò)中識(shí)別關(guān)鍵基因的深度學(xué)習(xí)工具DeepHE
實(shí)操內(nèi)容
1.復(fù)現(xiàn)DeepType,從METABRIC乳腺癌數(shù)據(jù)中區(qū)分乳腺癌亞型
2.復(fù)現(xiàn)XOmiVAE,從TCGA多維數(shù)據(jù)庫(kù)中識(shí)別乳腺癌亞型
3.復(fù)現(xiàn)DeepHE利用基因序列及蛋白質(zhì)相互作用網(wǎng)絡(luò)識(shí)別關(guān)鍵基因
第六天
理論部分
深度學(xué)習(xí)在預(yù)測(cè)藥物反應(yīng)機(jī)制上的應(yīng)用
1.聯(lián)合腫瘤基因標(biāo)記及藥物分子結(jié)構(gòu)預(yù)測(cè)藥物反應(yīng)機(jī)制的深度學(xué)習(xí)工具SWnet
實(shí)操內(nèi)容
1.預(yù)處理藥物分子結(jié)構(gòu)信息
2.計(jì)算藥物相似性
3.在不同數(shù)據(jù)集上構(gòu)建self-attention SWnet
4.評(píng)估self-attention SWnet
5.構(gòu)建多任務(wù)的SWnet
6.構(gòu)建單層SWnet
7.構(gòu)建帶權(quán)值層的SWnet
五、培訓(xùn)對(duì)象
全國(guó)各大高校、企業(yè)、科研院所從事人工智能、生命科學(xué)、代謝工程、有機(jī)合成、天然產(chǎn)物、藥物、微生物、生態(tài)科學(xué)、地球科學(xué)、生物信息學(xué)、植物學(xué),動(dòng)物學(xué)、化學(xué)化工,醫(yī)學(xué)、基因組學(xué)、農(nóng)業(yè)科學(xué)、,臨床醫(yī)學(xué)、食品科學(xué)與工程、腫瘤免疫與靶向治療、 全基因組泛癌分析、人黏連蛋白折疊基因組機(jī)、病毒檢測(cè)、功能基因組、遺傳圖譜、基因挖掘變異、代謝組學(xué)、蛋白質(zhì)組學(xué)、轉(zhuǎn)錄組學(xué)、生物醫(yī)學(xué)、癌癥、核酸、毒物學(xué)等研究科研人員
六、培訓(xùn)特色及福利
1、課程特色--全面的課程技術(shù)應(yīng)用、原理流程、實(shí)例聯(lián)系全貫穿
? ? ? ? ? ?2、學(xué)習(xí)模式--理論知識(shí)與上機(jī)操作相結(jié)合,讓零基礎(chǔ)學(xué)員快速熟練掌握
? ? ? ? ? ?3、課程服務(wù)答疑--主講老師將為您實(shí)際工作中遇到的問(wèn)題提供專業(yè)解答
? ? ? ?福利:報(bào)名繳費(fèi)成功贈(zèng)送報(bào)名班型全套預(yù)習(xí)視頻,課后學(xué)習(xí)完畢提供全程錄像視頻回放,針對(duì)與培訓(xùn)課程內(nèi)容進(jìn)行長(zhǎng)期答疑,微信解疑群永不解散,參加本次課程的學(xué)員可免費(fèi)再參加一次本單位后期組織的相同的專題培訓(xùn)班(任意一期都可以)
? ? ? ? 授課方式:通過(guò)騰訊會(huì)議線上直播,理論+實(shí)操的授課模式,老師手把手帶著操作,從零基礎(chǔ)開始講解,電子PPT和教程開課前一周提前發(fā)送給學(xué)員,所有培訓(xùn)使用軟件都會(huì)發(fā)送給學(xué)員,有什么疑問(wèn)采取開麥共享屏幕和微信群解疑,學(xué)員和老師交流、學(xué)員與學(xué)員交流,培訓(xùn)完畢后老師長(zhǎng)期解疑,培訓(xùn)群不解散,往期培訓(xùn)學(xué)員對(duì)于培訓(xùn)質(zhì)量和授課方式一致評(píng)價(jià)極高!
騰訊會(huì)議問(wèn)題實(shí)時(shí)解答及學(xué)員反饋?

? ?學(xué)員對(duì)培訓(xùn)非常認(rèn)可,我們也保證二次學(xué)習(xí)是免費(fèi)的

七、授課時(shí)間及地點(diǎn)
機(jī)器學(xué)習(xí)蛋白質(zhì)組學(xué)培訓(xùn)班
2023.5.7全天授課(上午09.00-11.30 下午13.30-17.00)
20235.8 -----2023.5.11晚上授課(晚上19.00-22.00)
2023.5.13----2023.5.14 全天授課(上午 09.00-11.30 下午13.30-17.00)
機(jī)器學(xué)習(xí)代謝組學(xué)培訓(xùn)班
2023.4.22 -----2023.4.23 全天授課(上午09.00-11.30 下午13.30-17.00)
2023.5.6-----2023.5.7全天授課(上午09.00-11.30 下午13.30-17.00)
2023.5.10 -----2023.5.11晚上授課 (晚上19.00-22.00)
機(jī)器學(xué)習(xí)微生物組學(xué)培訓(xùn)班
2023.4.22 ----- 全天授課(上午09.00-11.30 下午13.30-17.00)
2023.4.24 -----4.27晚上授課 (晚上19.00-22.00)
2023.4.29-----2023.4.30 全天授課(上午09.00-11.30 下午13.30-17.00)
深度學(xué)習(xí)在基因組學(xué)培訓(xùn)班
2023.5.6-----2023.5.7全天授課(上午09.00-11.30 下午13.30-17.00)
2023.5.8 -----2023.5.9 晚上授課 (晚上19.00-22.00)
2023.5.11——2023.5.12晚上授課 (晚上19.00-22.00)
2023.5.13----2023.5.14 全天授課(上午 09.00-11.30 下午 13.30-17.00)
?(線上培訓(xùn) ? 騰訊會(huì)議直播授課)

八、報(bào)名費(fèi)用
機(jī)器學(xué)習(xí)微生物組學(xué)、機(jī)器學(xué)習(xí)代謝組學(xué)、機(jī)器學(xué)習(xí)蛋白組學(xué)
公費(fèi)價(jià):每人每班¥4680元 (含報(bào)名費(fèi)、培訓(xùn)費(fèi)、資料費(fèi))
自費(fèi)價(jià):每人每班¥4280元 (含報(bào)名費(fèi)、培訓(xùn)費(fèi)、資料費(fèi))
深度學(xué)習(xí)基因組學(xué)
公費(fèi)價(jià):每人每班¥5880元 (含報(bào)名費(fèi)、培訓(xùn)費(fèi)、資料費(fèi))
自費(fèi)價(jià):每人每班¥5480元 (含報(bào)名費(fèi)、培訓(xùn)費(fèi)、資料費(fèi))
優(yōu)惠政策
優(yōu)惠一:兩班同報(bào):9880元?三班同報(bào):13880元? ? 四班同報(bào):17880元
優(yōu)惠二:提前報(bào)名繳費(fèi)學(xué)員+轉(zhuǎn)發(fā)到朋友圈或者到學(xué)術(shù)交流群可享受每人300元優(yōu)惠(僅限15名)
優(yōu)惠三:報(bào)名兩班免費(fèi)贈(zèng)送一個(gè)學(xué)習(xí)名額(贈(zèng)送班任選)
優(yōu)惠四:報(bào)名五個(gè)培訓(xùn)班免費(fèi)贈(zèng)送三個(gè)學(xué)習(xí)名額(贈(zèng)送班任選)
報(bào)名費(fèi)用可開具正規(guī)報(bào)銷發(fā)票及提供相關(guān)繳費(fèi)證明、邀請(qǐng)函,可提前開具報(bào)銷發(fā)票、文件用于報(bào)銷?
證書:參加培訓(xùn)并通過(guò)考試的學(xué)員,可以申請(qǐng)獲得工業(yè)和信息化部工業(yè)文化發(fā)展中心頒發(fā)的“工業(yè)強(qiáng)國(guó)建設(shè)素質(zhì)素養(yǎng)提升尚工行動(dòng)”崗位能力適應(yīng)評(píng)測(cè)證書。該證書可在中心官網(wǎng)查詢,可作為能力評(píng)價(jià),考核和任職的重要依據(jù)。評(píng)測(cè)證書查詢網(wǎng)址:www.miit-icdc.org(自愿申請(qǐng),須另行繳納考試費(fèi)500元/人)
報(bào)名咨詢方式(請(qǐng)二維碼掃描下方微信)
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?微信/QQ:766728764
? ? ? ? ? ? ? ? ? ? ? ? ? ? ?
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ??報(bào)名電話:15238680799? ? ? ?
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?
? ??? ?