11 模型選擇 + 過擬合和欠擬合【動手學深度學習v2】
2023-08-01 22:16 作者:_undefined- | 我要投稿

一般對訓練數(shù)據(jù)集五五分,一半當訓練集,另一半當驗證集。
訓練集來訓練模型參數(shù)
驗證集來調整模型的超參數(shù)
盡管說訓練集、驗證集還要一個測試集,但一般為了方便編碼是沒有測試集的,測試集有也只使用一次。若存在的話,測試集用來做泛化評估的。
偷懶時實,我們只有訓練集和驗證集時,我們用驗證集來看泛化誤差的時候,這值可能是虛高的。
為了嚴謹,不偷懶,我們可以將訓練集、驗證集以及測試集劃分為6:2:2(當數(shù)據(jù)量不是很大的時候(萬級別以下)),若是數(shù)據(jù)很大,可以將訓練集、驗證集、測試集比例調整為98:1:1;
但是當可用的數(shù)據(jù)很少的情況下也可以使用一些高級的方法,比如K折交叉驗證等。
標簽: