最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

量化交易軟件策略:利用指數(shù)平滑法進(jìn)行時(shí)間序列預(yù)測(cè)

2023-08-01 15:35 作者:bili_45793681098  | 我要投稿

簡(jiǎn)介

目前較為知名的預(yù)測(cè)方法林林總總,這些方法僅基于時(shí)間序列過(guò)去值的分析,也就是說(shuō),其采用的原則通常用于技術(shù)分析。這些方法主要使用外推方案,其中在某特定時(shí)間延遲處識(shí)別的序列屬性超出了其限制。

同時(shí),它還假定未來(lái)的序列屬性與過(guò)去和當(dāng)前相同。一種更為復(fù)雜的外推方案在預(yù)測(cè)中不太常用,該方案涉及到對(duì)于序列特性中變化動(dòng)態(tài)的研究,并適當(dāng)注意到預(yù)測(cè)區(qū)間內(nèi)的此類(lèi)動(dòng)態(tài)。

基于外推的最具知名度的預(yù)測(cè)方法,可能就是采用 自回歸求和移動(dòng)平均線(xiàn)模型 (ARIMA) 的方法。而上述方法之所以流行,主要是因?yàn)?Box 和 Jenkins 的作品中提出并開(kāi)發(fā)了求和 ARIMA 集成模型。當(dāng)然,除了 Box 與 Jenkins 引入的模型之外,還有其他模型和預(yù)測(cè)方法。

編輯切換為居中

本文將簡(jiǎn)單介紹一下更簡(jiǎn)單的模型 - 由 Holt 和 Brown 早在 Box 與 Jenkins 作品問(wèn)世之前就提出的 指數(shù)平滑模型

盡管還有更加簡(jiǎn)單明晰的數(shù)學(xué)工具,但利用指數(shù)平滑模型預(yù)測(cè)產(chǎn)生的結(jié)果通常與使用 ARIMA 模型的結(jié)果差不多。這毫不奇怪,因?yàn)橹笖?shù)平滑模型就是 ARIMA 模型的一個(gè)特例。換句話(huà)說(shuō),本文研究的每種指數(shù)平滑模型都有一個(gè)對(duì)等的 ARIMA 模型。但本文不會(huì)研究這些等效模型,大家了解下就好。

我們都清楚,在每種特定情況下進(jìn)行預(yù)測(cè)都需要一套獨(dú)有的方法,而且通常都涉及到大量的流程。

例如:

  1. 缺失值與離群值時(shí)間序列分析。上述值的調(diào)整。

  2. 趨勢(shì)及其類(lèi)型的識(shí)別。序列周期性的確定。

  3. 序列穩(wěn)定性的檢查。

  4. 序列預(yù)處理分析(取對(duì)數(shù)、差分等)。

  5. 模型選擇。

  6. 模型參數(shù)確定。基于選定模型的預(yù)測(cè)。

  7. 模型預(yù)測(cè)精確度評(píng)估。

  8. 選定模型誤差分析。

  9. 確定選定模型是否合適,如有必要,更換模型并返回前項(xiàng)。

很明顯,這還遠(yuǎn)非有效預(yù)測(cè)所需操作的完整列表。

要強(qiáng)調(diào)的是,模型參數(shù)確定和預(yù)測(cè)結(jié)果的獲取,只是總體預(yù)測(cè)過(guò)程中的一小部分。但要在一篇文章里通過(guò)一種方式涵蓋與預(yù)測(cè)相關(guān)的全部問(wèn)題,似乎是不可能的。

因此,本文僅論述指數(shù)平滑模型,且使用未預(yù)處理過(guò)的貨幣報(bào)價(jià)作為測(cè)試序列。當(dāng)然,隨之而來(lái)的問(wèn)題,本文中并不會(huì)一一作答,而只會(huì)涉及那些對(duì)于模型的研究有必要的問(wèn)題。


1. 穩(wěn)定性

外推法概念本身就恰當(dāng)?shù)匕凳玖怂芯窟^(guò)程的未來(lái)發(fā)展與過(guò)去和現(xiàn)在別無(wú)二致。換句話(huà)說(shuō),它涉及到的是過(guò)程的穩(wěn)定性。從預(yù)測(cè)的角度來(lái)看,平穩(wěn)的過(guò)程極具吸引力,但遺憾的是它并不存在,因?yàn)槿魏螌?shí)際過(guò)程在其發(fā)展的過(guò)程中都會(huì)面臨變化。

在實(shí)際過(guò)程中,隨著時(shí)間的推移,無(wú)論是預(yù)期、方差還是分布都會(huì)出現(xiàn)顯著差異,但特性變化非常慢的過(guò)程可能歸結(jié)于平穩(wěn)的過(guò)程。這里所說(shuō)的“非常慢”,是指過(guò)程特性在有限觀測(cè)區(qū)間內(nèi)的變化似乎無(wú)關(guān)緊要、可以忽略。

很明顯,可用的觀測(cè)區(qū)間越短(短樣本),就越有可能對(duì)過(guò)程整體的穩(wěn)定性做出錯(cuò)誤決定。另一方面,如果我們更想了解過(guò)程以后的狀態(tài),同時(shí)計(jì)劃做一個(gè)短期預(yù)測(cè),則在某些情況下減少樣本量可能會(huì)提高預(yù)測(cè)精確度。

如果過(guò)程有所變化,在觀測(cè)區(qū)間內(nèi)確定的序列參數(shù)就會(huì)有所不同,并超過(guò)其限制范圍。因此,預(yù)測(cè)區(qū)間越長(zhǎng),序列特性變異對(duì)于預(yù)測(cè)誤差的影響就越強(qiáng)。有鑒于此,赫茲量化必須將自己局限于單純的短期預(yù)測(cè);預(yù)測(cè)區(qū)間內(nèi)如有大幅縮減,則能預(yù)計(jì)緩慢變化的序列特性,而不會(huì)導(dǎo)致相當(dāng)大的預(yù)測(cè)誤差。

此外,序列參數(shù)的變異還會(huì)導(dǎo)致按觀測(cè)區(qū)間進(jìn)行估測(cè)時(shí)獲取的值采用平均值,因?yàn)榇藚^(qū)間內(nèi)的參數(shù)未能保持恒定。因此,獲得的參數(shù)值不再與此區(qū)間的最后時(shí)刻相關(guān),但卻會(huì)由此反映出某個(gè)特定的平均值。遺憾的是,要完全消除這種惱人的現(xiàn)象是不可能的。但是,只要模型參數(shù)估計(jì)(研究區(qū)間)中涉及到的觀測(cè)區(qū)間長(zhǎng)度縮減到可能的程度,就能減少這種現(xiàn)象的發(fā)生。

同時(shí),研究區(qū)間并不能無(wú)限制地縮短,因?yàn)闃O度縮減一定會(huì)降低序列參數(shù)估計(jì)的精確度。要在序列特性變異相關(guān)誤差的影響與由于研究區(qū)間內(nèi)極端縮減導(dǎo)致的誤差增加之間尋求一種折中。

上述所有內(nèi)容均完全適用于利用指數(shù)平滑模型所做的預(yù)測(cè),因?yàn)樗鼈兿?ARIMA 模型一樣,都是基于過(guò)程穩(wěn)定性的假設(shè)。但是,為簡(jiǎn)單起見(jiàn),下文中我們還是按照慣例,假設(shè)研究中的所有序列參數(shù)在觀測(cè)區(qū)間內(nèi)都會(huì)發(fā)生緩慢且可忽略的變化。

因此,本文要處理的是基于指數(shù)平滑模型、與帶有緩慢變化特性的序列短期預(yù)測(cè)相關(guān)的問(wèn)題。這里所說(shuō)的“短期預(yù)測(cè)”是指提前一個(gè)、兩個(gè)或更多時(shí)間區(qū)間進(jìn)行的預(yù)測(cè),而不是經(jīng)濟(jì)學(xué)中通常所理解的短于一年周期的預(yù)測(cè)。


2. 測(cè)試序列

到撰寫(xiě)本文時(shí),此前保存的針對(duì) M1、M5、M30 和 H1 的 EURRUR、EURUSD、USDJPY 和 XAUUSD 報(bào)價(jià)均已用到。每一份保存文件中都包含了 1100 個(gè) "open" 值。最早的值位于文件開(kāi)頭,而最新值則位于文件末尾。文件中保存的最后一個(gè)值,對(duì)應(yīng)的是文件創(chuàng)建的時(shí)間。包含測(cè)試序列的文件均利用 HistoryToCSV.mq5 腳本創(chuàng)建。而其借以創(chuàng)建的數(shù)據(jù)文件和腳本則位于本文末尾處的 Files.zip 存檔中。

前面提到過(guò),本文使用的已保存報(bào)價(jià)均未經(jīng)過(guò)預(yù)處理,盡管這樣存在明顯問(wèn)題,我仍想提醒您注意一下。比如說(shuō):一天當(dāng)中的 EURRUR_H1 報(bào)價(jià)包含 12 到 13 個(gè)柱,而周五的 XAUUSD 報(bào)價(jià)包含的柱則比一周中的其他天少一個(gè)。上述示例表明,報(bào)價(jià)是利用不規(guī)則采樣區(qū)間生成的;對(duì)于專(zhuān)為使用正確時(shí)間序列(意味著有個(gè)統(tǒng)一的量化區(qū)間)而設(shè)計(jì)的算法而言,這完全不能接受。

即便是利用外推法重現(xiàn)缺失的報(bào)價(jià)值,關(guān)于周末報(bào)價(jià)缺失的問(wèn)題仍有討論余地。赫茲量化通過(guò)推測(cè)得知,周末在全球范圍發(fā)生的事件與工作日發(fā)生的事件對(duì)于世界經(jīng)濟(jì)的影響別無(wú)兩樣。革命、自然災(zāi)害、引人注目的丑聞、政府更迭等等,為數(shù)眾多的此類(lèi)大小事件隨時(shí)都可能發(fā)生。如果這種事件發(fā)生在周六,其對(duì)世界市場(chǎng)的影響,幾乎不亞于某個(gè)工作日發(fā)生的事件的影響。

很可能正是這些事件導(dǎo)致了一周工作結(jié)束后報(bào)價(jià)缺口的頻現(xiàn)。很顯然,就算外匯市場(chǎng)不運(yùn)營(yíng),這個(gè)世界還是會(huì)按其自有的規(guī)則持續(xù)運(yùn)轉(zhuǎn)。對(duì)于是否應(yīng)重現(xiàn)周末對(duì)應(yīng)報(bào)價(jià)中的值(旨在對(duì)其進(jìn)行技術(shù)分析),以及這樣做有何益處,目前尚不明確。

這些問(wèn)題明顯超出了本文范疇,但初步來(lái)看,似乎沒(méi)有任何制品的序列更適于分析,至少在判斷周期(季節(jié)性)分量方面是這樣。

用于未來(lái)分析的數(shù)據(jù)的初步準(zhǔn)備,其重要性如何高估都不過(guò)分;就本例而言,它與報(bào)價(jià)一樣都是一個(gè)重大的獨(dú)立問(wèn)題。而其于終端中的顯示方式,一般來(lái)說(shuō)不太適于技術(shù)分析。除了上述缺口相關(guān)問(wèn)題之外,還存在許多其他問(wèn)題。

比如說(shuō),生成報(bào)價(jià)時(shí),某個(gè)固定時(shí)間點(diǎn)會(huì)被賦予不屬于其的 "open" 和 "close" 值;這些值對(duì)應(yīng)訂單號(hào)的生成時(shí)間,而不是選定時(shí)間框架圖表的某個(gè)固定時(shí)刻,然而眾所周知,訂單號(hào)有時(shí)非常罕見(jiàn)。

完全無(wú)視采樣定理再舉一例,因?yàn)榫退闶窃谝粋€(gè)分鐘區(qū)間內(nèi),也沒(méi)人可以擔(dān)保采樣率滿(mǎn)足上述定理(更不必說(shuō)其他更大的區(qū)間了)。而且,大家要記住,變量點(diǎn)差在某些情況下可能與報(bào)價(jià)值重疊出現(xiàn)。

好了,赫茲量化還是不管本文范疇之外的這些問(wèn)題了,還是回到我們的主題上吧。


3. 指數(shù)平滑

我們先來(lái)看看最簡(jiǎn)單的模型


,

其中:

  • X(t) – (模擬的)研究過(guò)程;

  • L(t) – 變量過(guò)程級(jí)別;

  • r(t)– 零均值隨機(jī)變量。

可以看出,此模型由兩個(gè)分量的和構(gòu)成;我們特別感興趣的是過(guò)程級(jí)別 L(t),所以試著把它挑出來(lái)。

眾所周知,隨機(jī)序列求平均數(shù)可能會(huì)導(dǎo)致方差減少,即縮小其與平均值的偏差范圍。因此我們可以假設(shè),如果簡(jiǎn)單模型所描述的過(guò)程接受平均化(平滑),我們可能不具備完全擺脫隨機(jī)分量 r(t) 的能力,但至少可以實(shí)現(xiàn)相當(dāng)程度的弱化,并由此挑出目標(biāo)級(jí)別 L(t)。

為此,我們會(huì)采用一種簡(jiǎn)單的指數(shù)平滑法 (SES)。



在這個(gè)著名的公式中,平滑程度通過(guò) alpha 系數(shù)(從 0 到 1)的設(shè)置進(jìn)行定義。如將 alpha 設(shè)置為零,則輸入序列 X 的新進(jìn)值不會(huì)對(duì)平滑結(jié)果造成任何影響。任何時(shí)間點(diǎn)的平滑結(jié)果都會(huì)是一個(gè)恒定值。

因此,在這種極端情況中,不受歡迎的隨機(jī)分量會(huì)被完全抑制,而所研究的過(guò)程等級(jí)也會(huì)被平滑為一條水平直線(xiàn)。如將 alpha 系數(shù)設(shè)置為一,則輸入序列根本不會(huì)受到平滑的影響。在這種情況下,研究中的級(jí)別 L(t) 不會(huì)失真,隨機(jī)分量也不會(huì)受到抑制。

顯而易見(jiàn),如果選擇 alpha 值,則同時(shí)還要滿(mǎn)足相互沖突方面的要求。一方面,alpha 值要接近零,才能有效抑制隨機(jī)分量 r(t)。而另一方面,alpha 值的設(shè)置最好還要接近一,才能讓我們感興趣的 L(t) 分量不失真。要獲得最優(yōu) alpha 值,我們需要找到一個(gè)標(biāo)準(zhǔn),并依據(jù)它對(duì)該值進(jìn)行優(yōu)化。

確定該標(biāo)準(zhǔn)時(shí)請(qǐng)記住,本文要論述的是預(yù)測(cè),而不僅僅是序列的平滑。

就該簡(jiǎn)單指數(shù)平滑模型而言,在這種情況下,通常都是將在某指定時(shí)間獲取的值

視為在采取任意步驟之前的預(yù)測(cè)。


編輯


其中

是時(shí)間 t 處提前 m 步的預(yù)測(cè)。

因此,對(duì)于時(shí)間 t 處序列值的預(yù)測(cè),就會(huì)成為在上一步完成時(shí)進(jìn)行的提前一步預(yù)測(cè)



在這種情況下,可以將某個(gè)提前一步預(yù)測(cè)的誤差用作 alpha 系數(shù)值優(yōu)化的標(biāo)準(zhǔn)



因此,通過(guò)在整個(gè)樣本范圍內(nèi)實(shí)現(xiàn)這些誤差平方和的最小化,我們就可以確定某指定序列 alpha 系數(shù)的最優(yōu)值。當(dāng)然,alpha 最優(yōu)值也就是誤差平方和最小的那一個(gè)。

圖 1 顯示了提前一步預(yù)測(cè)誤差平方和與測(cè)試序列 USDJPY M1 某片斷 alpha 系數(shù)值的對(duì)比圖。


編輯

圖 1. 簡(jiǎn)單指數(shù)平滑法

效果圖上的最小值幾乎無(wú)法辨別,近似大概 0.8 的 alpha 值。但簡(jiǎn)單指數(shù)平滑法并不總是該圖所示的這種情況。當(dāng)我們嘗試獲取本文中使用的測(cè)試序列片斷 alpha 最優(yōu)值時(shí),通常都會(huì)見(jiàn)到一張 alpha 值持續(xù)下跌到一的圖。

平滑系數(shù)值如此之高,表明該簡(jiǎn)單模型并不足以完全描述我們的測(cè)試序列(報(bào)價(jià))。其中原因是過(guò)程級(jí)別 L(t) 變化過(guò)快,或是過(guò)程中出現(xiàn)了一個(gè)趨勢(shì)。

我們?cè)偌尤胍粋€(gè)分量,讓這個(gè)模型復(fù)雜一點(diǎn)


,

其中:

  • X(t) – (模擬的)研究過(guò)程;

  • L(t) - 變量過(guò)程級(jí)別;

  • T(t) - 線(xiàn)性趨勢(shì);

  • r(t)- 零均值隨機(jī)變量。

大家都知道,線(xiàn)性回歸系數(shù)可通過(guò)序列的雙平滑來(lái)確定:









至于以這種方式獲取的系數(shù) a1 和 a2,時(shí)間 t 處的提前 m 步預(yù)測(cè)將等于


編輯


要注意的是,上述公式也采用了相同的 alpha 系數(shù)執(zhí)行第一次平滑和重復(fù)平滑。此模型被稱(chēng)為線(xiàn)性增長(zhǎng)附加的單一參數(shù)模型。

赫茲量化來(lái)說(shuō)明下該簡(jiǎn)單模型與線(xiàn)性增長(zhǎng)模型之間的區(qū)別。

假定所研究過(guò)程在很長(zhǎng)一段時(shí)間內(nèi)都顯示為一個(gè)恒定分量,即在圖表上顯示為一條水平直線(xiàn),但在某處開(kāi)始呈現(xiàn)出線(xiàn)性趨勢(shì)。對(duì)于利用上述模型生成的該過(guò)程的預(yù)測(cè),請(qǐng)參見(jiàn)圖 2。


編輯

圖 2. 模型對(duì)比

可以看出,簡(jiǎn)單指數(shù)平滑模型明顯落后于線(xiàn)性變化輸入序列,而且,利用該模型所做的預(yù)測(cè)還在進(jìn)一步拉大差距。如果使用線(xiàn)性增長(zhǎng)模型,我們就會(huì)看到一個(gè)非常不同的圖案。趨勢(shì)出現(xiàn)后,該模型就像是要努力趕上線(xiàn)性變化序列似的,且其預(yù)測(cè)結(jié)果與變化輸入值的方向也更為貼近。

如果指定示例中的平滑系數(shù)較高,則線(xiàn)性增長(zhǎng)模型就能夠在指定時(shí)間內(nèi)“觸碰到”該輸入信號(hào),且其預(yù)測(cè)結(jié)果也將與輸入序列幾乎一致。

盡管處于穩(wěn)定狀態(tài)下的線(xiàn)性增長(zhǎng)模型在面對(duì)線(xiàn)性趨勢(shì)時(shí)顯示了良好效果,但也容易看出,它是花了一段時(shí)間才“趕上”這個(gè)趨勢(shì)的。因此,如果趨勢(shì)頻繁變化,該模型與輸入序列之間就會(huì)存在一段差距。此外,如果趨勢(shì)未呈線(xiàn)性增長(zhǎng)、而是呈平方律增長(zhǎng),則線(xiàn)性增長(zhǎng)模型就無(wú)法“趕上”該趨勢(shì)了。盡管有這些缺點(diǎn),但在面對(duì)線(xiàn)性趨勢(shì)的時(shí)候,該模型還是要優(yōu)于簡(jiǎn)單指數(shù)平滑模型。

前面提到過(guò),赫茲量化使用了一種線(xiàn)性增長(zhǎng)的單一參數(shù)模型。為了找到測(cè)試序列 USDJPY M1 某片斷 alpha 參數(shù)的最優(yōu)值,讓我們來(lái)繪制一個(gè)提前一步預(yù)測(cè)誤差的平方和與 alpha 系數(shù)值的對(duì)比圖。

此圖以圖 1 中相同的序列片斷為基礎(chǔ),如圖 3 所示。


編輯

圖 3. 線(xiàn)性增長(zhǎng)模型

對(duì)比圖 1 中的結(jié)果,可發(fā)現(xiàn)本例中 alpha 系數(shù)的最優(yōu)值已減至 0.4 左右。該模型中第一次與第二次平滑的系數(shù)相同,盡管理論上來(lái)講,兩者的值可以不同。至于包含兩個(gè)不同平滑系數(shù)的線(xiàn)性增長(zhǎng)模型,我們稍后再深入探討。

赫茲量化談到的兩種指數(shù)平滑模型在赫茲量化中都有著以指數(shù)形式存在的類(lèi)似物。這就是眾所周知的 EMADEMA - 原本設(shè)計(jì)用于序列值的平滑而非預(yù)測(cè)之用。

要注意的是,使用 DEMA 指標(biāo)時(shí),所顯示的是 a1 系數(shù)對(duì)應(yīng)的一個(gè)值,而非提前一步預(yù)測(cè)值。在這種情況下,不會(huì)計(jì)算或使用 a2 系數(shù)(參見(jiàn)上述線(xiàn)性增長(zhǎng)模型公式)。此外,平滑系統(tǒng)則會(huì)以對(duì)應(yīng)周期 n 的形式來(lái)計(jì)算


例如,等于 0.8 的 alpha 將對(duì)應(yīng)約等于 2 的 n;如果 alpha 為 0.4,則 n 等于 4。


4. 初始值

前面提到過(guò),平滑系數(shù)值要在應(yīng)用指數(shù)平滑法后以某種方式獲取。但這樣看似還不夠。由于指數(shù)平滑法中的當(dāng)前值是根據(jù)前一個(gè)值計(jì)算的,所以會(huì)存在該值在時(shí)間零點(diǎn)尚不存在的情況。換句話(huà)說(shuō),對(duì)于線(xiàn)性增長(zhǎng)模型中 S 或 S1 與 S2 的初始值,要通過(guò)某種方式在時(shí)間零點(diǎn)處計(jì)算得出。

要解決獲取初始值的問(wèn)題并不總是輕而易舉。如果(就像在 赫茲量化中使用報(bào)價(jià)的情況下)我們有一段很長(zhǎng)時(shí)間的可用歷史數(shù)據(jù),且初始值未準(zhǔn)確確定,則指數(shù)平滑曲線(xiàn)就有時(shí)間在到達(dá)某個(gè)當(dāng)前點(diǎn)之前保持穩(wěn)定,同時(shí)也已糾正了我們的初始誤差。大約需要 10 到 200 個(gè)(有時(shí)更多)周期,具體取決于平滑系數(shù)值。

在這種情況下,粗略估算一下初始值,再在目標(biāo)時(shí)間周期之前啟動(dòng)指數(shù)平滑過(guò)程的 200-300 個(gè)周期就足夠了。不過(guò),比如說(shuō)可用樣本包含 100 個(gè)值,其難度就好增大。

有關(guān)初始值選擇的文獻(xiàn)中,有著各種各樣的建議。比如說(shuō),簡(jiǎn)單指數(shù)平滑法中的初始值可以等同于序列中的第一個(gè)元素,或是被計(jì)算為序列中以平滑隨機(jī)離群值為目的的三四個(gè)初始元素的平均值。線(xiàn)性增長(zhǎng)模型中的初始值 S1 與 S2 可基于以下假設(shè),即預(yù)測(cè)曲線(xiàn)的初始級(jí)別應(yīng)相當(dāng)于序列中第一個(gè)元素、且線(xiàn)性趨勢(shì)的斜率應(yīng)為零。

雖然還可以在與初始值選擇相關(guān)的不同來(lái)源中發(fā)現(xiàn)更多建議,但沒(méi)有人可以確保在平滑算法的早期階段中沒(méi)有顯著誤差。在為了達(dá)到穩(wěn)定狀態(tài)而需要大量周期、并使用低值平滑系數(shù)時(shí),這一點(diǎn)尤其明顯。

因此,為了將初始值選擇相關(guān)問(wèn)題的影響降至最低(尤其是針對(duì)短序列),我們有時(shí)會(huì)采用一種方法,其中涉及到搜索導(dǎo)致預(yù)測(cè)誤差最少的此類(lèi)值。這就是一個(gè)針對(duì)初始值(整個(gè)序列內(nèi)以小幅增量變化)計(jì)算預(yù)測(cè)誤差的問(wèn)題。

在所有初始值可能組合的范圍內(nèi)計(jì)算誤差之后,即可選擇最適合的變量。但這種方法非常費(fèi)力,需要進(jìn)行大量計(jì)算,所以幾乎從未被直接使用。

所述問(wèn)題與某個(gè)多變量函數(shù)最小值的優(yōu)化或搜索有關(guān)。此類(lèi)問(wèn)題可利用各種專(zhuān)為大幅縮小所需計(jì)算范圍而開(kāi)發(fā)的算法來(lái)解決。我們會(huì)在稍后的預(yù)測(cè)中重新探討平滑參數(shù)和初始值的優(yōu)化問(wèn)題。


5. 預(yù)測(cè)精確度評(píng)估

預(yù)測(cè)流程與模型初始值或參數(shù)的選擇,引發(fā)了預(yù)測(cè)精確度評(píng)估這一問(wèn)題。在比較兩種不同模型或確定所獲預(yù)測(cè)的一致性時(shí),精確度評(píng)估也很重要。雖然針對(duì)預(yù)測(cè)精確度評(píng)估的知名估算法非常多,但其中任何一種算法都要求在每一步了解預(yù)測(cè)誤差的情況。

前面已經(jīng)提到,時(shí)間 t 處的提前一步預(yù)測(cè)誤差等于



其中:


– 時(shí)間 t 處的輸入序列值;


– 在前一步所做的時(shí)間 t 處的預(yù)測(cè)。

最常見(jiàn)的預(yù)測(cè)精確度評(píng)估法很可能就是利用均方誤差 (MSE) 來(lái)評(píng)估:


其中 n 為序列中的元素?cái)?shù)。

有時(shí)也有人指出,對(duì)于較大值偶爾出現(xiàn)的單個(gè)誤差的極端敏感也是 MSE 的一項(xiàng)劣勢(shì)。其原因是在計(jì)算 MSE 時(shí)對(duì)其誤差值求平方。作為替代方案,在這種情況下使用平均絕對(duì)誤差 (MAE) 也不錯(cuò)。



這里的均方誤差由誤差的絕對(duì)值所取代。人們認(rèn)為利用 MAE 得到的估算更為穩(wěn)定。

比如,兩種估算方法都非常適合采用不同模型參數(shù)或模型進(jìn)行的相同序列預(yù)測(cè)精確度的評(píng)估,但它們對(duì)于從不同序列中接收到的預(yù)測(cè)結(jié)果的對(duì)比似乎沒(méi)什么用處。

此外,這些估算值并不能明確表明預(yù)測(cè)結(jié)果的質(zhì)量。比如說(shuō),我們不能說(shuō)所獲得的 0,03 或任何其他值的 MAE 是好是壞。

要想對(duì)比不同序列的預(yù)測(cè)精確度,我們可以使用相對(duì)評(píng)估法 RelMSE 和 RelMAE:


編輯

這里將獲取的預(yù)測(cè)精確度估算值除以通過(guò)預(yù)測(cè)測(cè)試方法計(jì)算出的各個(gè)估算值。作為一種測(cè)試方法,它適合使用所謂的樸素法,即暗示過(guò)程的未來(lái)值將與當(dāng)前值相等。


編輯

如果預(yù)測(cè)誤差的平均值與利用樸素法獲得的誤差值相等,則相對(duì)估算值將等于一。如果相對(duì)估算值小于一,則意味著平均來(lái)講,該預(yù)測(cè)誤差值小于樸素法中的相應(yīng)值。換句話(huà)說(shuō),預(yù)測(cè)結(jié)果的精確度要高于使用樸素法時(shí)的精確度。反之,如果相對(duì)估算值大于一,則預(yù)測(cè)結(jié)果的精確度一般要低于預(yù)測(cè)時(shí)使用的樸素法。

這些評(píng)估還適用于提前兩步或更多步的預(yù)測(cè)精確度估測(cè)。計(jì)算中的提前一步預(yù)測(cè)誤差需要替換成相應(yīng)提前步驟的數(shù)量的預(yù)測(cè)誤差值。

比如說(shuō),下表中就包含利用線(xiàn)性增長(zhǎng)單一參數(shù)模型中 RelMAE 估算出的提前一步預(yù)測(cè)誤差,而這些錯(cuò)誤都是利用每個(gè)測(cè)試序列的最后 200 個(gè)值計(jì)算出來(lái)的。


量化交易軟件策略:利用指數(shù)平滑法進(jìn)行時(shí)間序列預(yù)測(cè)的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
翼城县| 普宁市| 湖南省| 阿图什市| 双桥区| 新野县| 齐齐哈尔市| 凤台县| 南澳县| 聂荣县| 盐源县| 镇康县| 安龙县| 琼中| 博野县| 霍林郭勒市| 岢岚县| 聂拉木县| 兴文县| 潼南县| 金溪县| 利辛县| 明水县| 宕昌县| 鹤壁市| 贺州市| 松阳县| 观塘区| 新民市| 三门县| 乌兰浩特市| 天峻县| 水富县| 新沂市| 遂宁市| 宁安市| 桐乡市| 二手房| 中牟县| 都匀市| 阿合奇县|