時(shí)間序列:模型的選擇
當(dāng)我們擬合歷史數(shù)據(jù)得到一個(gè)模型之后,這個(gè)模型有可能只在見過的歷史數(shù)據(jù)上有一個(gè)好的預(yù)測結(jié)果(準(zhǔn)確率高,比如可以用預(yù)測值與真實(shí)值的均方誤差表示準(zhǔn)確率),但是在它沒見過的數(shù)據(jù)上,預(yù)測結(jié)果不好,這就是過擬合(bias)了。但是,如果對歷史數(shù)據(jù)的預(yù)測效果不好的話,那就是欠擬合了。如何平衡?
選擇合適的模型,即平衡擬合與過擬合的一種方法:Akaike information criterion(AIC)
一個(gè)有個(gè)參數(shù)的模型,可以計(jì)算它的
:

是
時(shí)刻的預(yù)測誤差。式子中第一項(xiàng)衡量擬合度(goodness of fit),第二項(xiàng)衡量過擬合(bias)。注意,每增加一個(gè)參數(shù),第二項(xiàng)增加2。我們希望每增加一個(gè)參數(shù),擬合度增加,預(yù)測誤差減小,如果這種減少超過了2,那么AIC就會(huì)減少,這樣我們就可以增加這個(gè)參數(shù)。如果AIC變得更大了,那么就不要增加這個(gè)參數(shù)。
標(biāo)簽: