Data Science In Python: Regression & Forecasting
語言:英語|尺寸:3.19 GB |持續(xù)時間:8小時31米
學(xué)習(xí)Python用于數(shù)據(jù)科學(xué)和機器學(xué)習(xí),并通過實踐項目構(gòu)建回歸和預(yù)測模型
你將學(xué)到什么
掌握Python中回歸分析的機器學(xué)習(xí)基礎(chǔ)
對模型特征、目標(biāo)及其之間的關(guān)系進(jìn)行探索性數(shù)據(jù)分析
使用Statsmodels和Scikit Learn構(gòu)建和解釋簡單和多元線性回歸模型
使用假設(shè)檢驗、殘差圖和平均誤差度量等工具評估模型性能
診斷并修復(fù)對線性回歸模型假設(shè)的違反
通過數(shù)據(jù)拆分、驗證和交叉驗證以及模型評分來調(diào)整和測試您的模型
利用正則化回歸算法提高測試模型的性能和準(zhǔn)確性
采用時間序列分析技術(shù)來識別趨勢和季節(jié)性,進(jìn)行分解并預(yù)測未來價值
要求
我們強烈建議您先參加我們的數(shù)據(jù)準(zhǔn)備和EDA課程
Jupyter筆記本(免費下載,我們將完成安裝)
建議熟悉基本Python和Pandas,但不是必需的
描述
這是一門基于項目的實踐課程,旨在幫助您掌握Python中回歸分析的基礎(chǔ)。我們將從回顧數(shù)據(jù)科學(xué)工作流程開始,討論回歸分析的主要目標(biāo)和類型,并深入了解我們將在整個課程中使用的回歸建模步驟。您將學(xué)會執(zhí)行探索性數(shù)據(jù)分析,擬合簡單的多元線性回歸模型,并使用假設(shè)檢驗、殘差圖和誤差度量等工具建立解釋模型和評估其性能的直覺。我們還將回顧線性回歸的假設(shè),并學(xué)習(xí)如何診斷和修復(fù)每一個假設(shè)。從那里,我們將介紹有助于確保我們的模型在新的、看不見的數(shù)據(jù)上表現(xiàn)良好的模型測試和驗證步驟,包括數(shù)據(jù)拆分、調(diào)整和模型選擇的概念。您還將學(xué)習(xí)如何利用特征工程技術(shù)和正則化回歸算法來提高模型性能。在整個課程中,您將在專注于客戶定價策略的團(tuán)隊中擔(dān)任Maven咨詢集團(tuán)的副數(shù)據(jù)科學(xué)家。利用你在整個課程中學(xué)到的技能,你將使用Python來探索他們的數(shù)據(jù)并建立回歸模型,以幫助公司準(zhǔn)確預(yù)測價格并了解影響價格的變量。最后但并非最不重要的是,你將了解時間序列分析和預(yù)測技術(shù)。您將學(xué)習(xí)分析趨勢和季節(jié)性,執(zhí)行分解和預(yù)測未來價值。課程大綱:數(shù)據(jù)科學(xué)簡介介紹數(shù)據(jù)科學(xué)和機器學(xué)習(xí)領(lǐng)域,復(fù)習(xí)基本技能,并介紹數(shù)據(jù)科學(xué)工作流程的每個階段回歸101復(fù)習(xí)回歸的基礎(chǔ),包括關(guān)鍵術(shù)語、回歸分析的類型和目標(biāo),以及回歸建模工作流預(yù)建模數(shù)據(jù)準(zhǔn)備和EDARecap執(zhí)行建模所需的數(shù)據(jù)準(zhǔn)備和EDA步驟,包括探索目標(biāo)、特征、,及其關(guān)系簡單線性回歸在Python中構(gòu)建簡單的線性回歸模型,了解有助于評估其質(zhì)量和輸出的指標(biāo)和統(tǒng)計測試多重線性回歸在Python中構(gòu)建多重線性回歸模型并評估模型擬合度,執(zhí)行變量選擇,并使用誤差度量對模型進(jìn)行比較模型假設(shè)查看需要滿足的線性回歸模型假設(shè),以確保模型的預(yù)測和解釋是有效的模型測試和驗證通過拆分?jǐn)?shù)據(jù)、使用訓(xùn)練和驗證數(shù)據(jù)調(diào)整模型、選擇最佳模型來測試模型性能,并在測試數(shù)據(jù)上進(jìn)行評分特征工程將特征工程技術(shù)應(yīng)用于回歸模型,包括偽變量、交互項、裝箱和更多正則化回歸引入正則化回歸技術(shù),這些技術(shù)是線性回歸的替代品,包括Ridge、Lasso、,和彈性網(wǎng)回歸時間序列分析學(xué)習(xí)探索時間序列數(shù)據(jù)的方法,以及如何使用線性回歸和Facebook Prophet進(jìn)行時間序列預(yù)測__________準(zhǔn)備好深入研究了嗎?立即加入,終身訪問以下內(nèi)容:8.5小時的高質(zhì)量視頻14個家庭作業(yè)10個測驗3個項目Python中的數(shù)據(jù)科學(xué):回歸電子書(230多頁)可下載的項目文件和解決方案專家支持和問答論壇30天Udemy滿意度保證如果你是一位有抱負(fù)的數(shù)據(jù)科學(xué)家,正在尋找Python回歸建模世界的介紹,這是你的課程。學(xué)習(xí)愉快-Chris Bruehl(數(shù)據(jù)科學(xué)專家兼首席Python講師,Maven Analytics)
概述
第1節(jié):入門
第1講課程簡介
第二講本系列
第三講課程結(jié)構(gòu)與大綱
第4講閱讀我:給新生的重要筆記
第5講下載:課程資源
第六講課程項目介紹
第7講設(shè)定期望
講座8 Jupyter的安裝和發(fā)布
第二節(jié):數(shù)據(jù)科學(xué)導(dǎo)論
第九講什么是數(shù)據(jù)科學(xué)?
第10講數(shù)據(jù)科學(xué)技能
第11講什么是機器學(xué)習(xí)?
第12講常見的機器學(xué)習(xí)算法
第13講數(shù)據(jù)科學(xué)工作流程
第14講第1步:界定項目范圍
第15講第2步:收集數(shù)據(jù)
第16講第3步:清理數(shù)據(jù)
第17講第4步:探索數(shù)據(jù)
第18講第5步:建模數(shù)據(jù)
第19講第6步:分享見解
第20講回歸建模
第21講主要收獲
第3節(jié):回歸101
第22講回歸101
第23講回歸目標(biāo)
第24講回歸的類型
第25講回歸建模工作流程
第26講主要收獲
第4節(jié):建模前數(shù)據(jù)準(zhǔn)備和EDA
第27講回歸EDA
第28講探索目標(biāo)
第29講探索特色
第30講作業(yè):探索目標(biāo)和特點
第31講解決方案:探索目標(biāo)和特點
第32講線性關(guān)系與相關(guān)性
第33講Python中的線性關(guān)系
第34講特征-目標(biāo)關(guān)系
第35講特征-特征關(guān)系
第36講專業(yè)提示:配對圖與就業(yè)
第37講任務(wù):探索人際關(guān)系
第38講解決方案:探索人際關(guān)系
第39講建模準(zhǔn)備
第40講要點
第5節(jié):簡單線性回歸
第41講簡單線性回歸
第42講線性回歸模型
第43講最小二乘誤差
第44講Python中的線性回歸
第45講統(tǒng)計模型中的線性回歸
第46講模型解讀
第47講預(yù)測
第48講R-Squared
第49講假設(shè)檢驗
第50講F-Test
第51講系數(shù)估計與P值
第52講殘差圖
第53講案例研究:健康保險價格建模
第54講作業(yè):簡單線性回歸
第55講解決方案:簡單線性回歸
第56講要點
第6節(jié):多元線性回歸
第57講多元線性回歸方程
第58講擬合多元線性回歸
第59講多元線性回歸模型的解釋
第60講變量選擇
第61講作業(yè):多元線性回歸
第62講解決方案:多元線性回歸
第63講平均誤差度量
第64講DEMO:平均誤差度量
第65講調(diào)整后的R平方
第66講作業(yè):平均誤差度量
第67講解決方案:平均誤差度量
第68講主要收獲
第7節(jié):模型假設(shè)
第69講線性回歸的假設(shè)
第70講線性
第71講錯誤的獨立性
第72講誤差的正態(tài)性
第73講DEMO:錯誤的正常性
第74講PRO TIP:解釋轉(zhuǎn)換目標(biāo)
第75講沒有完美多共線
第76講誤差的等方差
第77講局外人、杠桿和影響力
第78講RECAP:線性回歸的假設(shè)
第79講作業(yè):模型假設(shè)
第80講解決方案:模型假設(shè)
第81講要點
第8節(jié):模型測試與驗證
第82講模型評分步驟
第83講數(shù)據(jù)拆分
第84講合身與不合身
第85講偏差-方差權(quán)衡
第86講驗證數(shù)據(jù)
第87講模型調(diào)整
第88講模型評分
第89講交叉驗證
第90講簡單與交叉驗證
第91講作業(yè):模型測試與驗證
第92講解決方案:模型測試與驗證
第93講要點
第9節(jié):特征工程
第94講特征工程導(dǎo)論
第95講特征工程技術(shù)
第96講多項式項
第97講結(jié)合特色
第98講互動術(shù)語
第99講分類特征
第100講虛擬變量
第101講DEMO:虛擬變量
第102講分類數(shù)據(jù)的二進(jìn)制化
第103講二進(jìn)制數(shù)字?jǐn)?shù)據(jù)
第104講DEMO:附加功能工程理念
第105講作業(yè):特征工程
第106講解決方案:特征工程
第107講主要收獲
第10節(jié):項目1:舊金山租金價格
第108講項目簡介
第109講解決方案演練
第11節(jié):正則回歸
第110講正則回歸導(dǎo)論
第111講山脊回歸
第112講標(biāo)準(zhǔn)化
第113講擬合嶺回歸模型
第114講演示:擬合嶺回歸
第115講專業(yè)提示:RidgeCV
第116講作業(yè):嶺回歸
第117講解決方案:嶺回歸
第118講拉索回歸
第119講PRO提示:LassoCV
第120講作業(yè):拉索回歸
第121講解決方案:拉索回歸
第122講彈性網(wǎng)絡(luò)回歸
第123講DEMO:擬合彈性網(wǎng)絡(luò)回歸
第124講PRO提示:ElasticNetCV
第125講作業(yè):彈性網(wǎng)絡(luò)回歸
第126講解決方案:彈性網(wǎng)絡(luò)回歸
第127講RECAP:正則化回歸模型
第128講預(yù)覽:基于樹的模型
第129講要點
第12節(jié):項目1:舊金山租金價格(續(xù))
第130講項目簡介
第131講解決方案演練
第13節(jié):時間序列分析
第132講時間序列簡介
第133講移動平均線
第134講演示:移動平均數(shù)
第135講指數(shù)平滑
第136講作業(yè):平滑
第137講解決方案:平滑
第138講分解
第139講DEMO:分解
第140講PRO TIP:自相關(guān)圖
第141講作業(yè):分解
第142講解決方案:分解
第143講預(yù)測
第144講趨勢與季節(jié)的線性回歸
第145講DEMO:趨勢與季節(jié)的線性回歸
第146講Facebook先知
第147講作業(yè):預(yù)測
第148講解決方案:預(yù)測
第149講主要收獲
第14節(jié):項目2:用電量
第150講項目簡介
第151講解決方案演練
第15節(jié):下一步行動
第152講附加課
鏈接:https://pan.baidu.com/s/1RMVeU1_sj0zGVbA1b8vd0A?
提取碼:lylo?
--來自百度網(wǎng)盤超級會員V6的分享