李航《統(tǒng)計學習方法》書訓練營(含無監(jiān)督學習部分)
02 幾種集成方法
學習了那么多經(jīng)典的分類算法,我們會發(fā)現(xiàn),算法有各自的優(yōu)勢和缺點;處理了那么多數(shù)據(jù),我們會發(fā)現(xiàn),數(shù)據(jù)有好壞均衡之分;那么你有沒有想過,將不同的分類器、不同的數(shù)據(jù)集擇優(yōu)訓練,結(jié)合得到一個更好的分類器呢?
這就是集成方法,集成方法有這樣幾種思路:
不同基本分類器的集成
同一基本分類器在不同參數(shù)設(shè)置下的集成
數(shù)據(jù)集不同部分分配給不同或相同基本分類器后的集成(Bagging(相同分類器時))
同一數(shù)據(jù)集不同權(quán)值分配給同一基本分類器的集成(Boosting)
其中第三種思路,數(shù)據(jù)集不同部分分配給相同基本分類器后的集成,叫做自舉匯聚法(Bootstrap Aggregating),即Bagging;第四種思路,同一數(shù)據(jù)集不同權(quán)值分配給同一基本分類器的集成叫提升方法,即Boosting,也是本文的重點。
標簽: