量化交易軟件:分析指標(biāo)統(tǒng)計(jì)參數(shù)
簡介
交易者中廣泛使用那些能夠“更清楚”顯示基本報(bào)價(jià)的指標(biāo),從而能夠讓他們執(zhí)行分析并預(yù)測市場價(jià)格變動(dòng)。轉(zhuǎn)換有效性與所得結(jié)果可信度的相關(guān)問題通常不予考慮,最多也就是替換成基于指標(biāo)的交易系統(tǒng)測試。
我很清楚,除非我們可以解決初始報(bào)價(jià)轉(zhuǎn)換以及所得結(jié)果可信度的相關(guān)問題,否則使用這些指標(biāo)沒什么意義,更不用說將其應(yīng)用于交易系統(tǒng)的創(chuàng)建了。赫茲量化將在本文中講述,得出這樣一個(gè)結(jié)論,是經(jīng)過嚴(yán)格推理的。赫茲量化會(huì)利用三個(gè)指標(biāo)來研究潛在問題:趨勢直線、指數(shù)移動(dòng)平均線及 霍德里克-普雷斯科特過濾器。

編輯切換為居中
1. 理論淺析
為方便讀者,我會(huì)講述一些以后將用到的概率理論與數(shù)學(xué)統(tǒng)計(jì)學(xué)方面的術(shù)語。我不會(huì)提供鏈接,因?yàn)檫@里用到的術(shù)語,與教科書中的概念完全一致。
1.1. 經(jīng)濟(jì)觀察的概率描述
赫茲量化觀察的報(bào)價(jià)是某些基本隨機(jī)過程的間接選擇性測量值(總數(shù)量未知),其中包括:
精確測得的確定型分量,比如,已執(zhí)行的貨幣買入或賣出交易;
帶誤差測得的確定型分量,比如在某個(gè)時(shí)間區(qū)間內(nèi)(如一天)賣出的貨幣量;
不能測得的隨機(jī)型分量 - 群體心理。大多數(shù)時(shí)間里,此分量的主要特性都是帶漂移的隨機(jī)變化。
這些分量的相互作用生成了一個(gè)隨機(jī)過程,其中包括:
趨勢(確定型和隨機(jī)型);
帶固定與隨機(jī)周期長度的循環(huán);
帶漂移隨機(jī)變化。
非定常性是隨機(jī)過程的一項(xiàng)共有特性,于貨幣報(bào)價(jià)中體現(xiàn)。對(duì)我們而言,非定常性隨機(jī)過程的概念之所以重要,就是因?yàn)樗鼛缀跷刺峁┤魏巫陨淼姆治龇椒?,所以必須將其劃分為一系列可行分析的單?dú)過程。應(yīng)用指標(biāo)時(shí),交易者并不考慮指標(biāo)對(duì)于某具體交易品種報(bào)價(jià)的適用性。但有經(jīng)濟(jì)學(xué)工具可以評(píng)估某指標(biāo)應(yīng)用的可能性以及應(yīng)用結(jié)果。
1.2.隨機(jī)事件。概率
隨機(jī)事件(本例中為買入和賣出貨幣)是指可能發(fā)生、也可能不發(fā)生的事件。赫茲量化都知道,不同日期和一天中不同時(shí)間的成交數(shù)量都會(huì)不同 - 實(shí)際上是一個(gè)隨機(jī)值,但最常見的情況卻是僅將離散時(shí)間點(diǎn)(比如分鐘、小時(shí)、天等)的事件納入考慮范圍。
隨機(jī)事件的相對(duì)頻率是指該事件發(fā)生次數(shù) M 與已完成查看總數(shù) N 的比率。隨著查看次數(shù)的增長(理論上可到無窮大),此頻率會(huì)越來越接近所謂的隨機(jī)事件概率數(shù)。根據(jù)定義,概率是指一個(gè)從零到一的值。本文中一般都會(huì)用術(shù)語“概率”來替代相對(duì)頻率。
隨機(jī)值是指一個(gè)利用特定概率取不同值的量。
總集代表的是隨機(jī)可取的所有值。赫茲量化始終是處理市場中總集的一個(gè)樣本,通常使用某時(shí)段的報(bào)價(jià)。使用樣本獲取的統(tǒng)計(jì)數(shù)據(jù)當(dāng)然會(huì)與根據(jù)總集計(jì)算得出的統(tǒng)計(jì)數(shù)據(jù)有所區(qū)別,因?yàn)橄鄬?duì)頻率和概率是有區(qū)別的。再執(zhí)行進(jìn)一步的計(jì)算,評(píng)估使用樣本獲取的統(tǒng)計(jì)數(shù)據(jù)與根據(jù)總集計(jì)算得出的統(tǒng)計(jì)數(shù)據(jù)之間的差異。如是指標(biāo),則此方法不可行,因?yàn)閮r(jià)格(比如收盤價(jià))在計(jì)算期間會(huì)被指標(biāo)視為確定型值。
還觀察到另一有趣現(xiàn)象。因?yàn)槲覀円囍^察總集,所以,可以忽略由不同交易中心提交的報(bào)價(jià)之間的差異,因?yàn)楦膱?bào)價(jià)值容易,而更改其統(tǒng)計(jì)屬性卻非常難。
1.3. 隨機(jī)變量的特性
1.3.1. 描述性統(tǒng)計(jì)
隨機(jī)量集(本例中為貨幣報(bào)價(jià))均以大量的參數(shù)為特征。其中某些參數(shù)進(jìn)一步也會(huì)用到。
直方圖是一種顯示隨機(jī)值頻率的圖表。極端情況下,它就是一個(gè)顯示概率分布密度的圖表。
算術(shù)平均值(平均)是所有觀察點(diǎn)的和,除以觀察點(diǎn)數(shù)量(本例中為時(shí)段數(shù)量)。它并非適用于所有分布,而最常見的,就是與中間值一致時(shí)可用于正態(tài)分布。嚴(yán)格來講,這就意味著,如果報(bào)價(jià)具有平均值存在所依據(jù)的分布法,則可應(yīng)用最受歡迎的移動(dòng)平均線指標(biāo)。
中間值會(huì)將一個(gè)樣本中的所有觀察點(diǎn)一分為二:第一種情況下,所有觀察點(diǎn)均低于中間值;而在第二種情況下,觀察點(diǎn)則高于中間值。任何分布都存在中間值,且對(duì)離群值不敏感。如果平均值等于(或近似)中間值,則其為正態(tài)分布法特征之一。
偏離平均值是一個(gè)非常有趣的問題。離差是從其數(shù)學(xué)期望值中隨機(jī)值方差平方的平均值。離差的平方根是一個(gè)均方(標(biāo)準(zhǔn))方差。
標(biāo)準(zhǔn)方差與離差不排斥離群值。
一個(gè)名為不對(duì)稱率(偏斜度)的無量綱量會(huì)充當(dāng)分布密度曲線不對(duì)稱度的指標(biāo)。如果偏斜度值小于?6 除以觀察點(diǎn)數(shù)量?,則隨機(jī)值的概率分布取決于正態(tài)律。
具備分布密度特征的另一值是峰度。通常它都等于 3。如果峰度大于 3,則頂部尖銳,且?厚? 尾以小角度下滑。
可以看出,有大量適用于具有正態(tài)分布律的隨機(jī)變量的概念。也不算太糟糕,因?yàn)殡m然觀察數(shù)量值增長了,但卻有大量的分布律被變成了正態(tài)分布律。
1.3.2. 正態(tài)分布
正態(tài)(高斯)分布是幾乎所有真實(shí)概率分布的一種極端情況。
李雅普諾夫的極限定理為理論基礎(chǔ),該定理稱:在有觀察點(diǎn)丟失且其作用很小的情況下,擁有任何初始分布的獨(dú)立隨機(jī)值之和的分布都會(huì)是正態(tài)的。因此,它被廣泛應(yīng)用于眾多的概率理論實(shí)際應(yīng)用中。
正態(tài)分布是一個(gè)對(duì)稱的鐘形曲線,遍及整個(gè)數(shù)軸。高斯分布取決于兩個(gè)參數(shù):μ (數(shù)學(xué)期望值)和 σ (標(biāo)準(zhǔn)方差)。
數(shù)學(xué)期望值和給定分布的中間值等于 μ,而離差則等于 σ2。概率密度曲線與數(shù)學(xué)期望值相對(duì)稱。不對(duì)稱率與超出值分別為 γ = 0、ε = 3。
正態(tài)分布密度通常不作為 x 變量函數(shù)描述,而是作為具有零數(shù)學(xué)期望值和等于 1 的離差 z = (x ? μ) / σ 變量函數(shù)來描述。
μ = 0 且 σ = 1 的分布,稱為標(biāo)準(zhǔn)正態(tài)分布 (i.i.i)。

編輯
圖 1. 正態(tài)分布
1.3.3. 學(xué)生的分布(t-分布)
主參數(shù)為自由度(樣本中的元素?cái)?shù)量)。隨著自由度數(shù)的增長,學(xué)生的分布會(huì)漸趨標(biāo)準(zhǔn)化的正態(tài)分布。而如果 n > 30,學(xué)生的分布可用正態(tài)分布替換。如果 n < 30,則學(xué)生的分布的尾更厚。

編輯
圖 2. 學(xué)生的分布
t-統(tǒng)計(jì)被廣泛應(yīng)用于統(tǒng)計(jì)假設(shè)檢驗(yàn)。
1.3.4. 卡方(皮爾遜分布)
如果 Хi 是擁有 i.i.i 的獨(dú)立隨機(jī)值,則其平方和受 χ2-分布的約束。密度取決于一個(gè)單獨(dú)參數(shù) ν (通常被稱為自由度數(shù)),與獨(dú)立隨機(jī)變量的數(shù)量相等。如果自由度數(shù) ν →∞,χ2-分布傾向于具有中心 v 和離差 2ν 的正態(tài)分布。分布密度為非對(duì)稱、單峰型,它還會(huì)變得更平,且與漸增的自由度對(duì)稱。

編輯
圖 3. 皮爾遜分布(卡方)
1.3.5. F - 費(fèi)歇爾分布
費(fèi)歇爾 F 分布是一種離差關(guān)系分布,即兩個(gè)離差系列的比率。
如果兩個(gè)獨(dú)立的隨機(jī)變量具備帶自由度的卡方分布(V1、V2),則其比率具備費(fèi)歇爾分布。

編輯
圖 4. 費(fèi)歇爾分布
1.3.6. R 平方?jīng)Q定系數(shù)
決定系數(shù)會(huì)顯示由獨(dú)立變量影響解釋的結(jié)果離差的比例。如是兩個(gè)變量,則為皮爾遜相關(guān)平方。它顯示了完全處于這兩個(gè)變量之間的離差量。
相關(guān)比率的顯著性,取決于觀察點(diǎn)數(shù)量和費(fèi)歇爾 F 統(tǒng)計(jì)數(shù)據(jù)。如果報(bào)價(jià)中的燭形圖數(shù)超過 100,即便觀察點(diǎn)于零有非常小的偏差,亦足以確認(rèn)指標(biāo)的顯著性。
1.4. 確定假設(shè)
如果我們有該參數(shù)的一個(gè)選擇值,那么就一些常規(guī)設(shè)置參數(shù),赫茲量化可以得出什么結(jié)論?此問題的答案,取決于我們是否擁有關(guān)于常規(guī)參數(shù)大小的先驗(yàn)信息。
如果沒有該參數(shù)常規(guī)量級(jí)的相關(guān)先驗(yàn)信息,我們則可以利用一個(gè)選擇值來評(píng)估該參數(shù),為其設(shè)置置信區(qū)間(即范圍),其值位于其中,且?guī)в刑囟ǖ闹眯鸥怕省?/p>
在實(shí)際情況中,赫茲量化通常需要檢查一些特定的、大多數(shù)情況下都是簡單的假設(shè)But。此假設(shè)被視為空。為測試假設(shè),采用 標(biāo)準(zhǔn)以接受或拒絕它。下面列出的各類統(tǒng)計(jì)數(shù)據(jù),通常都會(huì)用作標(biāo)準(zhǔn):t-統(tǒng)計(jì)數(shù)據(jù)、F-統(tǒng)計(jì)數(shù)據(jù)和卡方統(tǒng)計(jì)數(shù)據(jù)。使用某些特定的統(tǒng)計(jì)軟件(比如 STATISTICA)或經(jīng)濟(jì)學(xué)軟件(如 EViews),計(jì)算得出的標(biāo)準(zhǔn)伴有此標(biāo)準(zhǔn)的顯著性值 - p-值。比如說,p-值為 0.02 (2%) 則意味著對(duì)應(yīng)標(biāo)準(zhǔn)于 1% 顯著性水平時(shí)為不顯著,而于 5% 顯著性水平時(shí)為顯著。同樣,如果概率等于“1 - p-值”,則可以假設(shè)零假設(shè)不顯著。
p-值為主觀選擇,由某特定標(biāo)準(zhǔn)錯(cuò)誤評(píng)估后果的嚴(yán)重性確定。
1.5. 報(bào)價(jià)統(tǒng)計(jì)特征
1.5.1. 描述性統(tǒng)計(jì)
描述性統(tǒng)計(jì)包括:
一個(gè)必須在某報(bào)價(jià)的燭形量增加時(shí)接近分布律的直方圖;
主趨勢測量值:均值,中值;
離差測量:標(biāo)準(zhǔn)方差;
形態(tài)測量:偏斜度與峰度;
雅克-貝拉正態(tài)定則。
雅克-貝拉定則。零假設(shè) But:分布為正態(tài)。比如說,伴隨標(biāo)準(zhǔn)值的概率則等于 0.04。似乎可得出下述結(jié)論:零假設(shè)接受的概率為 4%。但是不完全對(duì),因?yàn)橛?jì)算得出值是一個(gè)標(biāo)準(zhǔn) p 值,而零假設(shè)接受的概率等于 96%。
1.5.2. 自相關(guān)與 Q 統(tǒng)計(jì)
自相關(guān)是對(duì)兩個(gè)變量之間關(guān)系的一種測量。相關(guān)比率的變化范圍為 -1.00 到 +1.00。值 -1.00 是指完全負(fù)相關(guān),而值 +1.00 則指完全正相關(guān)。值 0.00 是指無相關(guān)。
一個(gè)報(bào)價(jià)中各元素之間的相關(guān),被稱為自相關(guān)。它在尋找趨勢時(shí)非常有用。自相關(guān)的存在,向作為隨機(jī)變量的報(bào)價(jià)的所有相關(guān)結(jié)論提出了挑戰(zhàn)。因?yàn)榇_定隨機(jī)值過程中最重要的因素,就是不同時(shí)段時(shí)各個(gè)價(jià)格的獨(dú)立性。
在統(tǒng)計(jì)分析軟件中,自相關(guān)伴隨有帶 p-值的 Ljung-Box Q 統(tǒng)計(jì)數(shù)據(jù)。零假設(shè)為:自相關(guān)不存在,即,如果 p-值等于零,赫茲量化可能得出報(bào)價(jià)中某限定燭形之前不存在相關(guān)的結(jié)論。
獲取使用數(shù)理統(tǒng)計(jì)方法功能的過程中,第一步就是從報(bào)價(jià)中排除自相關(guān)(趨勢)。
1.5.3. 報(bào)價(jià)平穩(wěn)性
如果報(bào)價(jià)的數(shù)學(xué)期望值和離差不取決于時(shí)間,我們則認(rèn)定其為平穩(wěn)。即便這個(gè)平穩(wěn)性定義過于嚴(yán)謹(jǐn),并且不太適合實(shí)際應(yīng)用。如果某個(gè)時(shí)間范圍內(nèi),數(shù)學(xué)期望值的方差與(或)離差由幾個(gè)百分點(diǎn)(通常不超過 5%)構(gòu)成,那么,將報(bào)價(jià)視為平穩(wěn)的情況非常常見。
金融市場中的實(shí)際報(bào)價(jià)并不平穩(wěn)。它們擁有下述方差:
存在一個(gè)由期內(nèi)各個(gè)觀察點(diǎn)之間的依賴性生成的趨勢。依賴性是貨幣報(bào)價(jià)與經(jīng)濟(jì)觀察點(diǎn)共有的一個(gè)明顯特色;
循環(huán)性;
變離差(異方差性);
偏離平穩(wěn)的報(bào)價(jià)被稱為非定常性。它們均通過連續(xù)分解為分量進(jìn)行分析。一旦得到某平穩(wěn)序列的平衡,且期望值與(或)離差幾乎恒定,該分解過程即終止。
有數(shù)項(xiàng)針對(duì)報(bào)價(jià)平穩(wěn)性的檢驗(yàn)。最基本的一類為單位根檢驗(yàn)。而其中最著名的,就是迪基-福勒檢驗(yàn)。零假設(shè) But:報(bào)價(jià)非穩(wěn)定(它們有一個(gè)單位根),即平均值與離差取決于時(shí)間。因?yàn)閹缀鹾愣ǖ厝Q于時(shí)間(某趨勢),執(zhí)行該檢驗(yàn)時(shí),必須指出報(bào)價(jià)中存在的趨勢。此階段要靠眼睛確定。
1.6. 指標(biāo)規(guī)范(回歸)
粗略看一下利用 MQL5 等語言編寫的指標(biāo)文本,即可識(shí)別其設(shè)置的兩種形式:分析式(最普遍)和表格式(應(yīng)用于那些被稱作過濾器的指標(biāo),比如克拉夫朱克指標(biāo))。
但我們會(huì)使用“回歸”這個(gè)術(shù)語 - 數(shù)理統(tǒng)計(jì)學(xué)與計(jì)量經(jīng)濟(jì)學(xué)中的一個(gè)常用術(shù)語。
清楚自己想要從報(bào)價(jià)中獲取什么之后,我們需要設(shè)置下述參數(shù),以表示(指標(biāo))回歸:
用于指標(biāo)計(jì)算的獨(dú)立變量列表;
獨(dú)立變量比率;
將用于獨(dú)立變量計(jì)算的指標(biāo)計(jì)算方程。
盡管在創(chuàng)建多貨幣指標(biāo)的過程中存在一些困難,但在回歸中,這些困難都不復(fù)存在。
有了這三個(gè)頭寸,則有必要調(diào)整回歸以適應(yīng)報(bào)價(jià)。與交易者論壇不同的是, ?擬合?一詞在計(jì)量經(jīng)濟(jì)學(xué)中并非什么令人不快的詞語,而是標(biāo)準(zhǔn)流程,而在這個(gè)流程中(指標(biāo))回歸到報(bào)價(jià)的一致性,也是利用多種評(píng)估方法中的一個(gè)計(jì)算得出的。普通最小平方法 (OLS) 是已知最佳的評(píng)估方法。
評(píng)估結(jié)果揭示出兩個(gè)興趣點(diǎn):
帶報(bào)價(jià)指標(biāo)的合規(guī)性 – 剩余誤差的值;
計(jì)算得出的未來回歸參數(shù)的穩(wěn)定性。
這些問題的答案,均已在指標(biāo)診斷期間給出。
1.7. 指標(biāo)診斷
指標(biāo)(回歸)診斷分為三組:
比率診斷;
余數(shù)診斷;
穩(wěn)定性診斷。
下述每個(gè)驗(yàn)證流程中,都包括用作驗(yàn)證假設(shè)的零假設(shè)規(guī)范。驗(yàn)證結(jié)果由一個(gè)或多個(gè)統(tǒng)計(jì)數(shù)據(jù)及其隨附 p 值的選擇構(gòu)成。后者會(huì)指明零假設(shè)條件執(zhí)行的概率,作為驗(yàn)證統(tǒng)計(jì)的基礎(chǔ)。
由此,小 p-值會(huì)導(dǎo)致零假設(shè)拒絕。比如說,如果 p-值位于 0.05 到 0.01 之間,則零假設(shè)偏離 5%,而不是 1%。
要注意的是,與每個(gè)驗(yàn)證相關(guān)的建議和分布結(jié)果多種多樣。比如說,有些統(tǒng)計(jì)具備準(zhǔn)確、有限的檢驗(yàn)分布(通常為 t 或 F 分布)。其它的則是帶有非對(duì)稱 χ2 分布的檢驗(yàn)統(tǒng)計(jì)的大樣本。
1.7.1. 比率診斷
比率診斷會(huì)提供相關(guān)信息,并定義已評(píng)估比率的限制,其中包括缺失與冗余變量的驗(yàn)證特例。下述回歸方程比率的驗(yàn)證會(huì)被用到:
置信橢圓允許揭示方程比率之間的相關(guān)性;
缺失變量的檢驗(yàn),則允許確定回歸方程中額外變量的必要性;
冗余變量檢驗(yàn)允許揭示過多變量;
中斷檢驗(yàn)允許確定回歸方程對(duì)于趨勢變化的反應(yīng)。需要?jiǎng)?chuàng)建這樣一種回歸方程,它要能同樣擅長體現(xiàn)上升、下降及扁平報(bào)價(jià)段的報(bào)價(jià)。