實驗四 支持向量機分類和回歸模型
一、? 實驗要求
1、深刻理解支持向量機學習器的原理,如帶有不等式約束的目標函數(shù)的建立到拉格朗日對偶的轉(zhuǎn)換,以及KKT調(diào)節(jié),尤其是SMO算法的原理和流程。
2、掌握SVM引入核函數(shù)的動機和核函數(shù)思想,會選用合適的核函數(shù),對數(shù)據(jù)集進行分類或回歸。
3、理解軟間隔和硬間隔,尤其是KKT條件的不同;針對正則化系數(shù)C,會進行調(diào)參和選擇模型。
4、掌握支持向量回歸的原理,其對偶形式和KKT條件、損失函數(shù),會根據(jù)誤差間隔帶參數(shù)進行調(diào)參。
二、? 實驗內(nèi)容
1、SVM分類模型
從網(wǎng)址(https://sci2s.ugr.es/keel/category.php?cat=clas)自行選擇合適的二分類數(shù)據(jù)集,并對數(shù)據(jù)集進行適當?shù)慕忉尅?/p>
完成如下實驗內(nèi)容:
(1)? 結(jié)合視頻P43(https://www.bilibili.com/video/BV14p4y1h7ay?p=43),分別設計線性核函數(shù)、多項式核函數(shù)、高斯核函數(shù)。
(2)??對數(shù)據(jù)集采用三種核函數(shù)進行分類預測,并適當?shù)倪M行參數(shù)設置。
(3)? 采用sklearn中自帶函數(shù)svm.SVC()(API: https://scikit-learn.org/stable/modules/generated/sklearn.svm.SVC.html)對模型進行訓練,并進行交叉驗證網(wǎng)格搜素或貝葉斯優(yōu)化的方法,選擇最優(yōu)的參數(shù)。
(4)???對模型進行評價,對結(jié)果進行解釋說明,對可視化繪圖進行解釋說明。
2、SVM回歸模型
從網(wǎng)址(https://sci2s.ugr.es/keel/category.php?cat=reg)下載數(shù)據(jù)集concrete.dat,該數(shù)據(jù)集共有1030個樣本,8個屬性,因變量為ConcreteCompressiveStrength。
完成如下實驗內(nèi)容:
(1)使用sklearn庫中的函數(shù)svm.SVR() (API: https://scikit-learn.org/stable/modules/generated/sklearn.svm.SVR.html),建立支持向量回歸,劃分數(shù)據(jù)集為訓練集和測試集,選擇不同的核函數(shù),分析不同核函數(shù)情況下的擬合優(yōu)度和均方誤差。
(2)選用其中一個核函數(shù), 適當調(diào)參,分析模型。