卡爾曼濾波:過濾隨機(jī)游走
我們知道,隨機(jī)游走序列是到當(dāng)前時(shí)間為止白噪聲項(xiàng)的簡單求和。換句話說,隨機(jī)游走序列中的對下一個(gè)時(shí)間點(diǎn)值的估計(jì)(預(yù)測)是通過從高斯分布中抽樣獲得。還要注意,這與股票價(jià)格有關(guān),因?yàn)楣善眱r(jià)格的對數(shù)通常被建模為隨機(jī)游走。
現(xiàn)在假設(shè)有一個(gè)任務(wù)就是觀察隨機(jī)游走。觀察的結(jié)果是得到一個(gè)隨機(jī)游走序列。就股價(jià)而言,觀察任務(wù)意味著得到股票價(jià)格的時(shí)間序列。我們周期性地觀察股票的價(jià)格并記錄它們。股票的價(jià)格時(shí)序形成了隨機(jī)游走。
注意,我們觀察到的股票價(jià)格都是準(zhǔn)確無誤的,因此能夠無誤地觀察(observe)股價(jià)時(shí)序。問題是如果觀測(observation)是沒有錯(cuò)誤的,那么卡爾曼濾波模型就不適用了。為什么我們還需要這樣做(需要卡爾曼濾波)?
通常來說,任何時(shí)刻的股價(jià)都應(yīng)該體現(xiàn)供需平衡的情況,這個(gè)價(jià)格叫做均衡價(jià)格(equilibrium price)。在這種情況下,周期性測量方法相當(dāng)于使用特定時(shí)間的觀測價(jià)格作為時(shí)間間隔的均衡價(jià)格。所以,在每個(gè)時(shí)間間隔結(jié)尾得到的觀測價(jià)格相當(dāng)于是對這個(gè)時(shí)間間隔均衡價(jià)格的求近似值(approximation)。那么,觀測誤差(observation error)就變得有意義了。因而,可以把卡爾曼濾波方法用在股價(jià)上,具體是用在股價(jià)求對數(shù)之后的序列即一個(gè)隨機(jī)游走過程上。
現(xiàn)在從時(shí)間開始,觀測到的狀態(tài)(股價(jià))是
,實(shí)際的狀態(tài)(股價(jià))是
。觀測的式子表示為:

根據(jù)隨機(jī)游走,我們有:

我們把這些寫成一個(gè)序列:

用矩陣的方式表示:

進(jìn)一步表示成:

下標(biāo)的2表示估計(jì)的狀態(tài)的數(shù)目。我們有五個(gè)式子(方程),三個(gè)未知數(shù),
,
。因?yàn)槭阶颖任粗獢?shù)多,這種系統(tǒng)又叫做超定集(overdertermined set)。如果每個(gè)階段的誤差都是來自相同的,獨(dú)立的正態(tài)分布。對于超定集的解可以用最小二乘法獲得:

去到下一個(gè)觀測值,我們有以下的矩陣,我們對狀態(tài)的估計(jì)就是這個(gè)矩陣的解:

這個(gè)系統(tǒng)就有七個(gè)式子(方程),四個(gè)未知數(shù)。同樣我們解這些方程,就得到的估計(jì)。但是,隨著觀測值的增加,矩陣增大,計(jì)算的花費(fèi)也增大。而卡爾曼濾波方法就是救星。因?yàn)樵诳柭鼮V波中,前一步的結(jié)果用于下一步狀態(tài)的預(yù)測,比如前一步計(jì)算好的
及它的方差,可以用于
的預(yù)測。這樣,評(píng)估下一步的計(jì)算成本是相同的,無論我們計(jì)算多少的時(shí)間步長。

不管怎樣,卡爾曼濾波情況下狀態(tài)估計(jì)的最終結(jié)果與使用最小二乘法求解方程組的結(jié)果相同。注意,我們在這個(gè)過程中做出了一個(gè)重要的假設(shè),即每個(gè)時(shí)間步長的狀態(tài)方差等于觀測方差。(還有一個(gè)假設(shè)是誤差分布獨(dú)立性。)因此,根據(jù)前面的假設(shè),卡爾曼濾波器歸根結(jié)底是方程的最小二乘解。不同的是卡爾曼濾波中解是以遞歸方式計(jì)算的。因此,卡爾曼濾波器被稱為遞歸最小二乘法。
相同和獨(dú)立誤差分布(誤差是獨(dú)立同分布的)的假設(shè)體現(xiàn)在誤差的協(xié)方差矩陣中。獨(dú)立性也意味著誤差不相關(guān)。因此,協(xié)方差矩陣中的非對角元素均為零。協(xié)方差矩陣中的對角元素是誤差項(xiàng)的方差。如果它們來自相同的分布,那么方差應(yīng)該是相同的。因此,在這種情況下,協(xié)方差矩陣可以表示為單位矩陣乘以常數(shù)。

現(xiàn)在我們回到剛才的方程組的解的討論中。結(jié)果表明,該組方程在給定時(shí)間的估計(jì)狀態(tài)可以表示為觀測值的加權(quán)線性組合。此外,權(quán)重實(shí)際上是斐波那契數(shù)的比率。一個(gè)斐波那契數(shù)列是猶如以下的數(shù)列:

即前兩項(xiàng)之和等于第三項(xiàng):

對于狀態(tài)的估計(jì)可以表示為:

類似地,的估計(jì)表示為:

一般來說,我們有:

且,

注意,以上權(quán)重成立的前提假設(shè)是狀態(tài)的方差與觀測的方差是相同的。也就是說,如果我們要用以上的公式,那么每一步我們都要估計(jì)狀態(tài)的方差和觀測的方差。
在隨機(jī)游走中,狀態(tài)方差可以被估計(jì)為innovation的方差。將股票價(jià)格序列建模為隨機(jī)游走,innovation對應(yīng)于股價(jià)序列的周期收益。因此,這種情況下的狀態(tài)方差就是周期回報(bào)的方差。這種計(jì)算在金融界相當(dāng)普遍,通常被稱為歷史波動(dòng)率(historical volatility)。然而,觀測方差的估計(jì)有點(diǎn)不一樣。在一個(gè)時(shí)間段內(nèi)我們除了觀察收盤價(jià),我們還觀察了該時(shí)間段內(nèi)股價(jià)最高價(jià)和最低價(jià)。觀測誤差的方差是該時(shí)間段內(nèi)股價(jià)的波動(dòng)性。這種波動(dòng)性被最高價(jià)和最低價(jià)描述。存在幾種基于高-低價(jià)格估算波動(dòng)率的方法,可以使用任何一種方法來估計(jì)觀測方差。一旦狀態(tài)和觀測方差已知,我們就可以應(yīng)用卡爾曼濾波方法了。