機器學習數(shù)據(jù)不均衡處理教程
機器學習數(shù)據(jù)不均衡處理教程
學習對數(shù)據(jù)進行過采樣和欠采樣、應(yīng)用 SMOTE、集成方法和成本敏感型學習假設(shè)
課程英文名:Machine Learning with Imbalanced Data
此視頻教程共13.5小時,中英雙語字幕,畫質(zhì)清晰無水印,源碼附件全

下載地址
課程編號:335
百度網(wǎng)盤地址:https://pan.baidu.com/s/1_eoVIwUijTDjw8v5pVDccA?pwd=ndku
不限速??!! 阿里云盤地址:https://www.aliyundrive.com/s/h6VPyoJbaDm
課程內(nèi)容
你將會學到的
應(yīng)用隨機欠采樣從多數(shù)類中刪除觀察結(jié)果
通過刪除難以分類的觀察來執(zhí)行欠采樣
通過在類分離的邊界保留觀察值來進行欠采樣
應(yīng)用隨機過采樣來增加少數(shù)類
創(chuàng)建綜合數(shù)據(jù)以增加少數(shù)類的示例
實施 SMOTE 及其變體以綜合生成數(shù)據(jù)
使用集成方法和采樣技術(shù)來提高模型性能
更改模型優(yōu)化的錯誤分類成本以適應(yīng)少數(shù)類
使用最適合不平衡數(shù)據(jù)集的指標確定模型性能
本課程包括:
11 小時 長的隨選視頻
20 篇文章
2 個可下載資源
在移動設(shè)備和電視上觀看
結(jié)業(yè)證書
要求
了解機器學習基本算法,即回歸、決策樹和最近鄰
Python 編程,包括熟悉 NumPy、Pandas 和 Scikit-learn
Python 和 Jupyter 筆記本安裝
說明
歡迎使用不平衡數(shù)據(jù)集進行機器學習。在本課程中,您將學習多種可用于不平衡數(shù)據(jù)集的技術(shù),以提高機器學習模型的性能。
如果您現(xiàn)在正在使用不平衡的數(shù)據(jù)集并希望提高模型的性能,或者您只是想了解更多有關(guān)如何解決數(shù)據(jù)不平衡的信息,本課程將向您展示如何解決。
我們將通過引人入勝的視頻教程逐步指導您,并教您有關(guān)使用不平衡數(shù)據(jù)集的所有知識。在這門綜合課程中,我們幾乎涵蓋了處理不平衡數(shù)據(jù)集的所有可用方法,討論了它們的邏輯、它們在 Python 中的實現(xiàn)、它們的優(yōu)點和缺點,以及使用該技術(shù)時的注意事項。具體來說,您將學習:
隨機抽樣不足或側(cè)重于突出某些樣本群體的抽樣方法
隨機過采樣方法以及根據(jù)現(xiàn)有觀察創(chuàng)建新示例的方法
利用多個弱學習器的力量與采樣技術(shù)相結(jié)合來提高模型性能的集成方法
成本敏感的方法,對少數(shù)群體的錯誤決定進行更嚴厲的懲罰
在不平衡數(shù)據(jù)集上評估模型性能的適當指標
在課程結(jié)束時,您將能夠決定哪種技術(shù)適合您的數(shù)據(jù)集,和/或應(yīng)用和比較不同方法在多個數(shù)據(jù)集上返回的性能改進。
這個全面的機器學習課程包括超過 10 小時視頻的 50 多場講座,所有主題都包括動手 Python 代碼示例,您可以將其用作參考和練習,并在您自己的項目中重復使用。
此外,代碼會定期更新,以跟上新趨勢和新 Python 庫的發(fā)布。
那你還在等什么?立即注冊,了解如何處理不平衡數(shù)據(jù)集并構(gòu)建更好的機器學習模型。
此課程面向哪些人:
處理不平衡數(shù)據(jù)集的數(shù)據(jù)科學家和機器學習工程師
希望提高在不平衡數(shù)據(jù)集上訓練的模型性能的數(shù)據(jù)科學家
想要學習機器學習中級內(nèi)容的學生
處理不平衡的多類目標的學生