16種常用的數(shù)據(jù)分析方法-時(shí)間序列分析
時(shí)間序列(time series)是系統(tǒng)中某一變量的觀測(cè)值按時(shí)間順序(時(shí)間間隔相同)排列成一個(gè)數(shù)值序列,展示研究對(duì)象在一定時(shí)期內(nèi)的變動(dòng)過(guò)程,從中尋找和分析事物的變化特征、發(fā)展趨勢(shì)和規(guī)律。它是系統(tǒng)中某一變量受其它各種因素影響的總結(jié)果。
研究時(shí)間序列主要目的可以進(jìn)行預(yù)測(cè),根據(jù)已有的時(shí)間序列數(shù)據(jù)預(yù)測(cè)未來(lái)的變化。時(shí)間序列預(yù)測(cè)關(guān)鍵:確定已有的時(shí)間序列的變化模式,并假定這種模式會(huì)延續(xù)到未來(lái)。
時(shí)間序列的基本特點(diǎn)
假設(shè)事物發(fā)展趨勢(shì)會(huì)延伸到未來(lái)
預(yù)測(cè)所依據(jù)的數(shù)據(jù)具有不規(guī)則性
不考慮事物發(fā)展之間的因果關(guān)系
時(shí)間序列數(shù)據(jù)用于描述現(xiàn)象隨時(shí)間發(fā)展變化的特征。
時(shí)間序列考慮因素
時(shí)間序列分析就其發(fā)展歷史階段和所使用的統(tǒng)計(jì)分析方法看分為傳統(tǒng)的時(shí)間序列分析和現(xiàn)代時(shí)間序列分析,根據(jù)觀察時(shí)間的不同,時(shí)間序列中的時(shí)間可以是可以是年份、季度、月份或其他任何時(shí)間形式。
時(shí)間序列分析時(shí)的主要考慮的因素是:
l長(zhǎng)期趨勢(shì)(Long-term trend)?
時(shí)間序列可能相當(dāng)穩(wěn)定或隨時(shí)間呈現(xiàn)某種趨勢(shì)。
時(shí)間序列趨勢(shì)一般為線(xiàn)性的(linear),二次方程式的 (quadratic)或指數(shù)函數(shù)(exponential function)。
l季節(jié)性變動(dòng)(Seasonal variation)
按時(shí)間變動(dòng),呈現(xiàn)重復(fù)性行為的序列。
季節(jié)性變動(dòng)通常和日期或氣候有關(guān)。
季節(jié)性變動(dòng)通常和年周期有關(guān)。
l周期性變動(dòng)(Cyclical variation)
相對(duì)于季節(jié)性變動(dòng),時(shí)間序列可能經(jīng)歷“周期性變動(dòng)”。
周期性變動(dòng)通常是因?yàn)榻?jīng)濟(jì)變動(dòng)。
l隨機(jī)影響(Random effects)
除此之外,還有偶然性因素對(duì)時(shí)間序列產(chǎn)生影響,致使時(shí)間序列呈現(xiàn)出某種隨機(jī)波動(dòng)。時(shí)間序列除去趨勢(shì)、周期性和季節(jié)性后的偶然性波動(dòng),稱(chēng)為隨機(jī)性(random),也稱(chēng)不規(guī)則波動(dòng)(irregular variations)。
時(shí)間序列的主要成分
時(shí)間序列的成分可分為4種:
l趨勢(shì)(T)、
l季節(jié)性或季節(jié)變動(dòng)(S)、
l周期性或循環(huán)波動(dòng)(C)、
l隨機(jī)性或不規(guī)則波動(dòng)(I)。
傳統(tǒng)時(shí)間序列分析的一項(xiàng)主要內(nèi)容就是把這些成分從時(shí)間序列中分離出來(lái),并將它們之間的關(guān)系用一定的數(shù)學(xué)關(guān)系式予以表達(dá),而后分別進(jìn)行分析。
時(shí)間序列建?;静襟E
1)用觀測(cè)、調(diào)查、統(tǒng)計(jì)、抽樣等方法取得被觀測(cè)系統(tǒng)時(shí)間序列動(dòng)態(tài)數(shù)據(jù)。
2)根據(jù)動(dòng)態(tài)數(shù)據(jù)作相關(guān)圖,進(jìn)行相關(guān)分析,求自相關(guān)函數(shù)。
相關(guān)圖能顯示出變化的趨勢(shì)和周期,并能發(fā)現(xiàn)跳點(diǎn)和拐點(diǎn)。
跳點(diǎn)是指與其他數(shù)據(jù)不一致的觀測(cè)值。如果跳點(diǎn)是正確的觀測(cè)值,在建模時(shí)應(yīng)考慮進(jìn)去,如果是反常現(xiàn)象,則應(yīng)把跳點(diǎn)調(diào)整到期望值。
拐點(diǎn)則是指時(shí)間序列從上升趨勢(shì)突然變?yōu)橄陆第厔?shì)的點(diǎn)。如果存在拐點(diǎn),則在建模時(shí)必須用不同的模型去分段擬合該時(shí)間序列,例如采用門(mén)限回歸模型。
3)辨識(shí)合適的隨機(jī)模型,進(jìn)行曲線(xiàn)擬合,即用通用隨機(jī)模型去擬合時(shí)間序列的觀測(cè)數(shù)據(jù)。
對(duì)于短的或簡(jiǎn)單的時(shí)間序列,可用趨勢(shì)模型和季節(jié)模型加上誤差來(lái)進(jìn)行擬合。
對(duì)于平穩(wěn)時(shí)間序列,可用通用ARMA模型(自回歸滑動(dòng)平均模型)及其特殊情況的自回歸模型、滑動(dòng)平均模型或組合-ARMA模型等來(lái)進(jìn)行擬合。
當(dāng)觀測(cè)值多于50個(gè)時(shí)一般都采用ARMA模型。對(duì)于非平穩(wěn)時(shí)間序列則要先將觀測(cè)到的時(shí)間序列進(jìn)行差分運(yùn)算,化為平穩(wěn)時(shí)間序列,再用適當(dāng)模型去擬合這個(gè)差分序列。
spss時(shí)間序列分析過(guò)程
第一步:定義日期標(biāo)示量:
打開(kāi)數(shù)據(jù)文件,單擊"數(shù)據(jù)",選擇"定義日期和時(shí)間",彈出"定義日期"對(duì)話(huà)框,
數(shù)據(jù)中的起始時(shí)間就是數(shù)據(jù)文件里面的單元格第一個(gè)時(shí)間,我的第一個(gè)是1997年8月,每行表示的是月度銷(xiāo)售量,因此,需要從"定義日期"對(duì)話(huà)框的左側(cè)"個(gè)案是"框中選擇"年,月",在左側(cè)輸入‘1997’,月框中輸入‘8’,表示第一個(gè)個(gè)案的起始月是1997年8月,
最后點(diǎn)擊確認(rèn),這樣spss數(shù)據(jù)文件里面就會(huì)生成3個(gè)新的變量
如下圖:
第二步:了解時(shí)間序列的變化趨勢(shì)
了解時(shí)間序列的變化趨勢(shì)做一個(gè)序列表就可以了,單擊"分析",里面選擇"時(shí)間序列預(yù)測(cè),選擇"序列圖"對(duì)話(huà)框,然后把'平均值'移到"變量"框里面,‘DATE_’移到"時(shí)間軸標(biāo)簽"框中,單擊"確定"。結(jié)果如圖
根據(jù)序列圖的分析知道,序列的波動(dòng)隨著季節(jié)的波動(dòng)越來(lái)越大,所以我們選擇乘法模型;
第三步:分析
單擊“分析”,選擇時(shí)間序列預(yù)測(cè),然后選擇“季節(jié)性分解”,彈出“季節(jié)性分解”對(duì)話(huà)框,確認(rèn)無(wú)誤之后點(diǎn)擊確定,如圖:
多了四個(gè)變量:
lERR表示誤差分析;
lSAS表示季節(jié)因素校正后序列;
lSAF表示季節(jié)因子;
lSTC表示長(zhǎng)期趨勢(shì)和循環(huán)變動(dòng)序列。
我們可以把新出現(xiàn)的四個(gè)變量、平均值和DATE_做序列圖。先把ERR、SAS、STC和平均值和DATE_做個(gè)序列圖,效果如下:
再單獨(dú)做個(gè)SAT和DATE_的時(shí)間序列圖
?
第四步:預(yù)測(cè)
1、 單擊“分析”,選擇“時(shí)間序列預(yù)測(cè)”,然后選擇“創(chuàng)建傳統(tǒng)模型”,之后就會(huì)彈出“時(shí)間序列建?!睂?duì)話(huà)框。
2、 將“平均值”移至“因變量”框中,然后確定中間的“方法”,在下拉列表中選擇“專(zhuān)家建模器”項(xiàng),單擊右側(cè)的“條件”按鈕,彈出“時(shí)間序列建模器:專(zhuān)家建模器條件”對(duì)話(huà)框。
3、 在“時(shí)間序列建模器:專(zhuān)家建模器條件”對(duì)話(huà)框的“模型”選項(xiàng)卡中,在“模型類(lèi)型”框中選擇“所有模型”項(xiàng),并勾選“專(zhuān)家建模器考慮季節(jié)性模型”復(fù)選框,設(shè)置完,點(diǎn)“繼續(xù)”按鈕
4、 在“時(shí)間序列建模器”對(duì)話(huà)框中,切換至“保存”選項(xiàng)卡中,勾選“預(yù)測(cè)值”復(fù)選框,單擊“導(dǎo)出模型條件”框中“XML文件”后面的“瀏覽”按鈕,然后設(shè)置導(dǎo)出的模型文件和保存路徑,然后單擊“確定”按鈕就可以了。
做完上面的步驟之后,在原始數(shù)據(jù)上面就又會(huì)多一列預(yù)測(cè)值出現(xiàn)。如圖:
?
之前保存了預(yù)測(cè)的模型,我們現(xiàn)在就利用那個(gè)模型進(jìn)行預(yù)測(cè)數(shù)據(jù)。
1、 單擊“分析”,選擇“時(shí)間序列預(yù)測(cè)”,然后選擇“應(yīng)用傳統(tǒng)模型”,彈出“應(yīng)用模型序列”對(duì)話(huà)框。具體的操作如下圖:
?
最后一步切換至“保存”界面,勾選“預(yù)測(cè)值”之后單擊確定就可以了。
??????
從預(yù)測(cè)值直接看看不出來(lái),可以把預(yù)測(cè)的數(shù)據(jù)和原始數(shù)據(jù)放到一起看下,也是直接做序列圖就可以。
這樣就完成了一次時(shí)間序列的模型,具體的預(yù)測(cè)數(shù)據(jù)可以看原始數(shù)據(jù)上面的出現(xiàn)的新的一列數(shù)據(jù)。
- End -