機器學(xué)習(xí)之回歸模型
回歸是監(jiān)督學(xué)習(xí)的一個重要問題,回歸用于預(yù)測輸入變量和輸出變量之間的關(guān)系,特別是當(dāng)輸入變量的值發(fā)生變化時,輸出變量的值也隨之發(fā)生變化。
回歸模型是一種表示從輸入變量到輸出變量之間映射的函數(shù)
對連續(xù)值的預(yù)測
可以用合適的曲線揭示樣本點隨著自變量的變化關(guān)系
實驗要求
基本要求
將數(shù)據(jù)集winequality-white.csv按照4:1劃分為訓(xùn)練集和測試集。
構(gòu)造線性回歸模型,并采用批量梯度下降和隨機梯度下降進行優(yōu)化;輸出訓(xùn)練集和測試集的均方誤差(MSE),畫出MSE收斂曲線。
對于批量梯度下降和隨機梯度下降,采用不同的學(xué)習(xí)率并進行MSE曲線展示,分析選擇最佳的學(xué)習(xí)率。
特別需要注意:
劃分數(shù)據(jù)集時盡可能保持數(shù)據(jù)分布的一致性,保持樣本類別比例相似,可采用分層采樣的方式。
需要對數(shù)據(jù)集進行一定的預(yù)處理
中級要求
探究回歸模型在機器學(xué)習(xí)和統(tǒng)計學(xué)上的差異。
回歸模型在機器學(xué)習(xí)領(lǐng)域和統(tǒng)計學(xué)領(lǐng)域中都十分常用,而且使用方法也相似,但其實際的含義具有本質(zhì)的區(qū)別。我們希望同學(xué)們從回歸模型的角度更加充分地理解機器學(xué)習(xí)和統(tǒng)計學(xué)的區(qū)別。

高級要求
編程實現(xiàn)嶺回歸算法,求解訓(xùn)練樣本的嶺回歸模型,平均訓(xùn)練誤差和平均測試誤差(解析法、批量梯度下降法和隨機梯度下降法均可)。
完整代碼:
中級要求
高級要求