(觸手譯)3/N_exAHL頂級(jí)對(duì)沖基金經(jīng)理:系統(tǒng)化交易

已翻譯章節(jié)回顧:
人的主觀認(rèn)知缺陷;金融行為學(xué);引出系統(tǒng)化交易的必要性;
市場歷史數(shù)據(jù)表現(xiàn)的分布狀態(tài);
好的系統(tǒng)必備特征;
系統(tǒng)失效的特征(盈利的來源);
交易風(fēng)格在歷史統(tǒng)計(jì)上的表現(xiàn)區(qū)別;
可實(shí)現(xiàn)的夏普率表現(xiàn);
提高夏普率的方式;
經(jīng)常白嫖的人會(huì) 1產(chǎn)生幻覺 2記憶力差 4不識(shí)數(shù) 6神志不清 這九點(diǎn)大家記牢
--------------------------------------------------------------------------------------
這個(gè)系列是全球頂級(jí)CTA對(duì)沖基金AHL的基金經(jīng)理Robert Carver的Systematic Trading書籍(中文譯)。
筆者在AHL的十幾年里管理了超過百億的全球宏觀對(duì)沖基金。離開AHL后,運(yùn)用這一套系統(tǒng)規(guī)則超過7年。其本人有Pyton寫的開源回測框架及交易系統(tǒng).https://qoppac.blogspot.com/
我抽空余時(shí)間把書籍按照自己的理解翻譯出來。因?yàn)閮?nèi)容真的很多,所以見諒,更新的會(huì)比較慢。
本書作為入門書籍,仍舊有難度,因?yàn)橛邢喈?dāng)多的東西和實(shí)盤實(shí)戰(zhàn)掛鉤??蚣芙⒂诶碚摚渌ɑ販y等等的很多細(xì)節(jié)問題都仍舊需要單獨(dú)解決。
無論是主觀交易、半自動(dòng)交易、程序化交易,都推薦閱讀的,從入門到放棄的書籍。
細(xì)節(jié)的備注和超級(jí)鏈接會(huì)在后續(xù)添加。
--------------------------------------------------------------------------------------
第二大塊——工具
????第三章:擬合
整個(gè)章節(jié)的內(nèi)容圍繞利用數(shù)據(jù)來為系統(tǒng)化交易者建立交易規(guī)則。如果你是半自動(dòng)交易、或者是大類資產(chǎn)配置,那沒有必要使用這個(gè)框架。
使用一個(gè)系統(tǒng)化的交易系統(tǒng)意味著你需要選擇 一個(gè)/多個(gè) 交易規(guī)則,并且同時(shí)扔掉哪些不值得的規(guī)則。這個(gè)過程稱為擬合。因?yàn)樽鳛槿?,我們本身有非常大的認(rèn)知缺陷,所以擬合的過程是很危險(xiǎn)的很容易陷入誤區(qū)。你需要非常謹(jǐn)慎的對(duì)待過擬合。如果你的規(guī)則非常非常適配歷史數(shù)據(jù),那這個(gè)規(guī)則很有可能在未來不具備盈利的能力。
????章節(jié)概述
過度擬合的危險(xiǎn)(利用歷史數(shù)據(jù)有選擇性的篩選和適配規(guī)則所帶來的風(fēng)險(xiǎn))
有效的擬合(如果你執(zhí)意要擬合交易規(guī)則,你最好要遵守的步驟)
我是怎么選擇交易規(guī)則(我用來很好避免過擬合的流程)
????過度擬合的危險(xiǎn)
????離開對(duì)沖基金行業(yè)后不久,我想為當(dāng)?shù)匾患易誀I交易公司Aqueduct capital提供咨詢服務(wù),并管理一些資金。辦公室里經(jīng)常有頭發(fā)花白的前倫敦國際金融期貨交易所交易員和天真的年輕人,他們整天交易期貨合約。但老板特別為他的定量團(tuán)隊(duì)感到驕傲,這個(gè)團(tuán)隊(duì)由兩名20多歲的年輕人組成,他們拿著電腦,運(yùn)行著現(xiàn)成的備用測試軟件包。
????“這是喬。他到這里才一個(gè)月,就已經(jīng)提出了50條新的交易規(guī)則,這些規(guī)則在背測中是有利可圖的!”
????“是的,這個(gè)軟件太棒了。它每天可以自動(dòng)測試數(shù)百條規(guī)則,”
????喬補(bǔ)充道。我強(qiáng)作一臉的嚴(yán)肅,盡我所能的圓滑地回答道:“嗯,我相信有些辦法是管用的?!?/p>
????結(jié)果是打算不參與這家公司了,但幸運(yùn)的是,公司在幾個(gè)月后清算。
????從成千上萬種可能性中篩選出明顯有利可圖的規(guī)則,這是一種極其危險(xiǎn)的方法,原因?qū)⒃诒菊碌钠溆嗖糠肿兊蔑@而易見。想法優(yōu)先首先要測試規(guī)則和變量,在理解喬為什么走錯(cuò)路之前,我們需要清楚什么是擬合。在這一章中,我將把注意力集中在第二章中介紹的第一種方法上。你已經(jīng)知道,我更喜歡理念優(yōu)先的方法,但我在這里使用它的原因是,與數(shù)據(jù)優(yōu)先的替代方法相比,它更容易解釋和理解如何避免過度擬合。擬合的過程將涉及從候選列表中選擇一個(gè)或多個(gè)交易規(guī)則,每個(gè)規(guī)則都基于一個(gè)好的想法。讓我們看一個(gè)人為的例子,但是要注意,這不是我推薦使用的規(guī)則。基本假設(shè)是英鎊/美元的匯率在圖6所示的范圍內(nèi)移動(dòng)。你可能會(huì)認(rèn)為,如果英鎊比去年的平均水平低5%就買進(jìn),在高于平均水平5%的時(shí)候賣出,是一個(gè)不錯(cuò)的策略。這是均值回歸規(guī)則的一個(gè)例子。然后我們?cè)跉v史數(shù)據(jù)上測試這個(gè)初始規(guī)則,看看它的執(zhí)行結(jié)果和表現(xiàn)行為。在這個(gè)階段,如果規(guī)則不管用,就放棄它,繼續(xù)下一個(gè)想法。如果你足夠喜歡這個(gè)規(guī)則,你可以進(jìn)入下一個(gè)階段,我稱之為調(diào)試,盡管很可能也很希望不通過調(diào)試直接使用初始規(guī)則。

????在調(diào)試過程中,檢查基本交易規(guī)則的一些變量。在這個(gè)簡單的例子中,你可以用3%、6%或10%來測試正負(fù)5%的原始范圍,或者你可以將當(dāng)前的價(jià)格與過去一年、一周或兩年的平均價(jià)格進(jìn)行比較。通常你會(huì)選擇使用業(yè)績衡量標(biāo)準(zhǔn),類似夏普率,來選出最能盈利的規(guī)則。調(diào)試還可以用來——我將在本書后面展示——找到以給定方式運(yùn)行的交易規(guī)則,比如以給定的頻率來交易。然后你可以決定保留哪些變量。一旦你選擇了一個(gè)交易規(guī)則和變量的組合,你需要決定如何在其中分配你的資金。像這樣的投資組合配置決策是下一章的主題。目前值得注意的是,一個(gè)表現(xiàn)不好的變量很可能棄用,或者在整個(gè)交易系統(tǒng)中給它相對(duì)較小的分配。如果你想使用數(shù)據(jù)優(yōu)先的方法?你需要有足夠的專業(yè)知識(shí),用你自己喜歡的工具來應(yīng)用本章的原則,你不應(yīng)該使用你沒有任何深度理解的數(shù)據(jù)優(yōu)先的方法。我強(qiáng)烈建議你不要盲目地使用某個(gè)方法,僅僅因?yàn)樗梢宰詣?dòng)進(jìn)行歷史回測。在我們繼續(xù)之前,這里有一個(gè)關(guān)于想法優(yōu)先回測的最后注意事項(xiàng)。任何有價(jià)值的交易系統(tǒng)設(shè)計(jì)者都應(yīng)該了解歷史,讀過書,知道其他人交易什么。然后你可能只測試你已經(jīng)知道可行的想法,這就屬于隱式過度擬合的一種形式。因此,無論你在隨后的擬合過程中多么小心,你的回測的夏普比率仍然會(huì)被高估——當(dāng)心過度自信。
????用時(shí)間機(jī)器作弊
????讓我們來看看第一個(gè)常見的錯(cuò)誤,那就是假裝你有一臺(tái)時(shí)間機(jī)器。擬合時(shí)需要兩段歷史數(shù)據(jù),首先是用于擬合模型的時(shí)間段,其次是用于檢驗(yàn)?zāi)P偷臅r(shí)間段。為了說明這一點(diǎn),請(qǐng)?jiān)俅慰紤]嘗試符合英鎊兌美元交易規(guī)則的例子,并假設(shè)你在回撤,想找到最佳的單一變量。假設(shè)你有過去10年的歷史數(shù)據(jù)可以回測,那最簡單也是最常見的方法是用整個(gè)10年歷史數(shù)據(jù)作為你的擬合期,然后找出在這10年里最賺錢的變量。然后你回到過去,測試這個(gè)單一的變量在同樣的十年里的表現(xiàn)。對(duì)于你進(jìn)行測試的每一年,你都使用基于整個(gè)十年數(shù)據(jù)的同一個(gè)模型。圖7顯示了運(yùn)行于1990年到2000年之間的示例模型。擬合的每個(gè)階段占一行。第一行表明你會(huì)使用所有1990到2000年的數(shù)據(jù),在第二行,你使用相同的擬合模型來測試1991年的性能,等等。回測結(jié)果非常好,因?yàn)榛氐綒v史的當(dāng)下,你并沒未來的行情數(shù)據(jù),所以這種叫做樣本內(nèi)回測,因?yàn)槟闶褂孟嗤臄?shù)據(jù)來擬合和測試性能。需要避免樣本內(nèi)回測,樣本內(nèi)回測會(huì)給出非常好的回測結(jié)果,而且傾向于非常復(fù)雜的規(guī)則,但不會(huì)在實(shí)際交易中做得很好。相比樣本內(nèi)回測,還有更好的選擇。常見的一種方法是將樣本分為兩塊,如圖8所示。你取1990年到1994年上半年的所有數(shù)據(jù),并擬合出這段時(shí)期的最佳變量。然后使用這個(gè)單一的變量來測試第二個(gè)樣本外周期的表現(xiàn),在本例中是1995年到2000年的每年。但這樣做的問題是,你浪費(fèi)了一半的數(shù)據(jù),結(jié)果只能看到后半部分6年數(shù)據(jù)里的表現(xiàn),同時(shí)你也沒有考慮到市場結(jié)構(gòu)的任何潛在變化。


????我的首選解決方案是使用一個(gè)擴(kuò)展窗口期,如圖9所示。假設(shè)你認(rèn)為你需要至少一年的時(shí)間來適應(yīng)你的系統(tǒng)。在下一行,你擬合1990年的第一年數(shù)據(jù),然后測試第二年,即1991年的結(jié)果變量。然后在圖9的第三行,你在1992年使用與1990年和1991年數(shù)據(jù)擬合的變量進(jìn)行測試。為了測試1993年,你使用1990年、1991年和1992年最佳的變量。這種情況一直持續(xù)到2000年,當(dāng)你使用過去十年的數(shù)據(jù)來選擇最佳的變量時(shí)。因?yàn)槟闶冀K使用的都是過去的數(shù)據(jù),所以你沒有作弊。你還可以“合法”地使用盡可能多的過去發(fā)生的事情,這樣就不會(huì)浪費(fèi)歷史行情包含的信息。這種方法的唯一問題是,如果世界發(fā)生了變化,你仍然會(huì)使用到可能不相關(guān)的過去數(shù)據(jù)。為了避免這種情況,一旦你有足夠的歷史數(shù)據(jù),你可以使用最近5年或10年的數(shù)據(jù),拋棄更早期的數(shù)據(jù),這個(gè)叫做滾動(dòng)窗口期。如圖10所示,五年滾動(dòng)窗口與1996年以前的擴(kuò)展窗口相同。然后這個(gè)時(shí)候你可以拋棄1990年的數(shù)據(jù),只使用1991年至1995年來擬合最佳變量。窗口的長度必須足夠短,以捕捉市場結(jié)構(gòu)短期的變化,但也必須足夠長,以得出統(tǒng)計(jì)上顯著的結(jié)果。稍后你將看到,滾動(dòng)窗口通常需要幾十年的數(shù)據(jù)來適應(yīng)模型,這使得滾動(dòng)窗口的使用存在問題。
????


????當(dāng)擬合開始走壞
????現(xiàn)在讓我們檢查一個(gè)不恰當(dāng)擬合的具體例子。我從章節(jié)一里講到那個(gè)贏沖虧縮的例子里90個(gè)變量里選出表現(xiàn)最好的那個(gè)變量,來交易一下芝加哥商品交易所的黃金期貨合約。這似乎有點(diǎn)過分,但它已經(jīng)比Jor在我之前說的事里測試的變量要少。記住,如果我的交易規(guī)則包含5個(gè)變量,并且我允許每個(gè)變量是從10個(gè)離散值中選一個(gè),那么我實(shí)際上得測試一萬種變化。
????一旦我有了至少一年的數(shù)據(jù),我就會(huì)根據(jù)之前12個(gè)月的夏普率找到表現(xiàn)最好的變量。然后我再次使用過去12個(gè)月的數(shù)據(jù)來測試接下來一年的表現(xiàn)。這個(gè)過程每年重復(fù)一次,所以這就是一個(gè)為期一年的滾動(dòng)窗口回測。你認(rèn)為下面哪個(gè)選項(xiàng)能給我最好的表現(xiàn)?
1,挑選最好的變量:每年我都使用前一年表現(xiàn)最好的變量。
2,隨機(jī)選擇一個(gè)變量:忽略我的擬合,每年我隨機(jī)選擇一個(gè)變量。因?yàn)槊總€(gè)選擇的隨機(jī)性都會(huì)影響結(jié)果,所以我多次運(yùn)行這個(gè)回測,并取最后的平均表現(xiàn)。
3,保留所有變量,再次忽略我的擬合,我保留所有90個(gè)變量,并對(duì)所有變量給的結(jié)果進(jìn)行等權(quán)加權(quán)。
????如果你是擬合的忠實(shí)粉絲,結(jié)果是令人失望的。每年從前一年選擇最好的規(guī)則會(huì)給我一個(gè)相當(dāng)糟糕的SR:0.07。如果我選擇第二種,每年1月1日隨機(jī)選擇一條規(guī)則,那么我平均得到的SR是0.2。最好的選擇是完全忘記選擇交易規(guī)則變量,并將所有規(guī)則進(jìn)行等權(quán)加權(quán)。這使得SR升到了0.33,對(duì)于在單一標(biāo)的品種上使用的一種交易規(guī)則來說,這是相當(dāng)不錯(cuò)的。這些結(jié)果可能是偶然的,但我在許多不同的品種和交易規(guī)則上都得到了類似的結(jié)果。為什么擬合如此糟糕?首先,每次只選擇一種變量運(yùn)行有點(diǎn)過于自信。正如你很快就會(huì)看到的,我們很少有足夠的證據(jù)證明一個(gè)規(guī)則絕對(duì)比另一個(gè)好。其次,一年的數(shù)據(jù)完全不足以決定哪種交易規(guī)則是最好的。我用黃金期貨這一單一工具的歷史來分析,使這個(gè)問題變得更糟。最后,像Joe一樣,我測試了太多的變量。
多重測試問題——雖然一些隨機(jī)規(guī)則看起來也不錯(cuò)
????為什么測試大量的交易規(guī)則和變化會(huì)如此危險(xiǎn)?除了需要付出的努力之外,你很可能最終只是偶然地選擇了一個(gè)糟糕的規(guī)則。
????想知道為什么,就看下面這個(gè)研究。讓我們假設(shè),我試圖實(shí)現(xiàn)煉金術(shù),并找到有利可圖的規(guī)則,但卻沒有。我有一個(gè)包含一定數(shù)量坑看著還行的交易規(guī)則的池子,所有這些規(guī)則的真實(shí)預(yù)期平均收益都為零,盡管在真實(shí)的場景中,我事先并不知道這一點(diǎn)。這些規(guī)則都是完全任意的,它們的返回值都是由隨機(jī)歷史數(shù)據(jù)生成的。
????對(duì)于每個(gè)測試,我記錄每個(gè)規(guī)則一年的回報(bào)數(shù)據(jù),就像在上面的黃金期貨示例中一樣,并篩選出該年夏普比率(SR)高于我設(shè)定最小水平的所有規(guī)則。如果沒有規(guī)則的SR高于閾值,那我就一個(gè)也不選。保留所有通過測試的規(guī)則(即使有50條)。因?yàn)榈讓訑?shù)據(jù)是隨機(jī)的,所以我需要多次生成新數(shù)據(jù),然后重復(fù)測試,讓結(jié)果更具備說服性。然后,在給定一個(gè)特定的最小級(jí)別和可用池的大小的情況下,我計(jì)算通過測試的規(guī)則的平均數(shù)量。如表3所示,即使我很嚴(yán)格,設(shè)置了極高的最小SR: 2.0,如果我測試了的規(guī)則數(shù)量足夠多,我仍然會(huì)篩選出一些不太行的規(guī)則。

????那么實(shí)際上我應(yīng)該使用多大SR來過濾?因?yàn)闆]有一個(gè)虛構(gòu)的規(guī)則是真正有利可圖的,所以理想情況下,跟SR無關(guān),這些交易規(guī)則一個(gè)都不能用。但在真實(shí)市場情況下,我們不能把閾值弄得太高,否則即使是好的規(guī)則也會(huì)被過濾;畢竟,在一個(gè)標(biāo)的品種上測試的真實(shí)交易規(guī)則的實(shí)際SR值,好一點(diǎn)的也就只有0.30左右。假設(shè)我有5%的幾率選出至少一條無利可圖的規(guī)則,在真實(shí)市場中,我通常會(huì)有超過一年的數(shù)據(jù),所以讓我們看看假設(shè)歷史數(shù)據(jù)更多更長,對(duì)我的發(fā)現(xiàn)有什么影響。表4列出了所有結(jié)果。正如你可能懷疑的那樣,返回序列的長度在這里非常重要。更多的歷史數(shù)據(jù),意味著零SR規(guī)則僥幸通過閾值的可能性就小了,所以我可以設(shè)置更低的閾值。然而,即使有30年的數(shù)據(jù),我也不能冒險(xiǎn)測試太多的規(guī)則。

????你需要多少歷史數(shù)據(jù)來決定一個(gè)規(guī)則是真的好?現(xiàn)在,你已經(jīng)看到了一個(gè)常見的錯(cuò)誤,即是用不充分的歷史數(shù)據(jù)來選擇或校準(zhǔn)規(guī)則。需要多少數(shù)據(jù)?你需要多長時(shí)間來決定一個(gè)規(guī)則是否有一個(gè)正的夏普比率(SR)?規(guī)則值得保留嗎?為了回答這些問題,我生成了更多隨機(jī)交易規(guī)則的每日收益率,這次假設(shè)的是正的夏普比率,這也是我事先不知道的。隨著生成了更多的歷史交易,我可以估計(jì)每年的SR水平和迄今為止的平均水平。與此同時(shí),我研究了這些年度夏普比率的分布。這使得我了解了我測量的平均SR在統(tǒng)計(jì)上的重要性:是我運(yùn)氣好還是這真的是個(gè)好系統(tǒng)。
????一個(gè)經(jīng)典的統(tǒng)計(jì)顯著性檢驗(yàn)方法是T檢驗(yàn)。在這個(gè)例子中,通過它的平均值和標(biāo)準(zhǔn)差的估計(jì)值,決定一個(gè)估計(jì)的夏普比率是否可能是正的,均值離零越遠(yuǎn)(以sigma為單位),未知的SR實(shí)際上越有可能是正的。這種檢驗(yàn)通常用兩個(gè)標(biāo)準(zhǔn)差作為臨界值。如果估計(jì)的平均SR比零高出兩個(gè)標(biāo)準(zhǔn)差,那么如果真實(shí)的SR是負(fù)的,發(fā)生這種情況的概率只有2.5%。圖11顯示了任意交易規(guī)則的平均測量SR的演化,以及圍繞它的上下“置信區(qū)間”。每個(gè)置信區(qū)間離均值都有2個(gè)標(biāo)準(zhǔn)差,所以當(dāng)?shù)椭眯艆^(qū)間大于0時(shí),我知道只有2.5%的幾率,交易系統(tǒng)是一個(gè)偽裝成虧損的規(guī)則。

在圖中,你可以看到平均SR迅速收斂到0.5 SR的真實(shí)值,但它需要超過10年的時(shí)間,低置信區(qū)間超過了零,T檢驗(yàn)最終通過。只有這樣,我們才能合理地確定這不是一個(gè)虧損的系統(tǒng)。如果我對(duì)真實(shí)SR為1.0的規(guī)則重復(fù)此操作,就會(huì)得到圖12。這個(gè)情況下,通過T測試的時(shí)間只需要幾年。平均而言,越高的SR,用來證明其盈利能力所花的時(shí)間越短。圖12,真實(shí)SR為1.0,我們?cè)趲啄陜?nèi)通過了T檢驗(yàn)

????讓我們找出在給定的真實(shí)夏普比率下通過測試的平均時(shí)間。在進(jìn)行了必要的實(shí)驗(yàn)之后,我得到了表5,除了非常好的規(guī)則,你至少需要10年甚至更長的時(shí)間來確保一個(gè)策略能夠賺錢,對(duì)于單個(gè)標(biāo)的,平均交易規(guī)則的實(shí)際SR約為0.3,所以你需要將近40年的歷史數(shù)據(jù)。

你需要多少歷史來確定一個(gè)規(guī)則是否比另一個(gè)更好?
現(xiàn)在,如果你有一些替代規(guī)則,想要找到最好的呢?讓我們?cè)俅渭僭O(shè)我有兩條隨機(jī)規(guī)則,一條的真實(shí)夏普比率(SR)為0.30,另一條的SR為0.80。一開始,我假設(shè)這是完全不同的規(guī)則它們的收益之間沒有相關(guān)性。這次要進(jìn)行T檢驗(yàn),我需要估計(jì)兩個(gè)夏普比率的差異,并測量差異的平均值和標(biāo)準(zhǔn)差。

????在圖13中是SR的平均差值和這個(gè)差值的相關(guān)置信區(qū)間。一旦較低的置信區(qū)間大于零,我們就可以合理地確定有一個(gè)規(guī)則更好,因?yàn)檫@種情況下,真實(shí)SR為負(fù)的偶然發(fā)生的概率也只有2.5%。您可以從圖13中看到,確定的時(shí)間大約是三十年。

????2010年,我工作過的大型系統(tǒng)性對(duì)沖基金被重組成不同的資產(chǎn)類別。我的團(tuán)隊(duì)管理固定收益投資組合,另一個(gè)團(tuán)隊(duì)管理股票等。最初,我們運(yùn)行的交易策略非常相似。然而,隨著時(shí)間的推移,我們做了更多的市場特定研究,我們都確信我們需要以不同的方式定制我們的系統(tǒng)。在許多情況下,我們走得更遠(yuǎn),也開始分別適合我們投資組合的不同部分。例如,我們可以在新興市場和發(fā)達(dá)市場的債券期貨中加入不同的交易規(guī)則變化分開裝配很常見,而且有很多系統(tǒng)交易者將這一點(diǎn)發(fā)揮到了極致,并將每種工具分開使用。幾乎所有的回測方案,比如喬使用的那個(gè),都默認(rèn)一次只將交易規(guī)則適用于單一品種。因此,對(duì)于英鎊/美元,規(guī)則會(huì)有一種變量,對(duì)于歐元/美元,規(guī)則會(huì)有另一種變量,以此類推。這是敘述謬誤的典型例子,我們之前見過的認(rèn)知偏差。對(duì)于我們?nèi)祟悂碚f,不同的標(biāo)的資產(chǎn)有不同的故事和不同的交易規(guī)則是有道理的。但這樣做正確嗎?這取決于每種變量在不同工具上的行為是否有顯著不同。如果不是,那么你很可能是過度擬合,為每個(gè)標(biāo)的資產(chǎn)單獨(dú)搞規(guī)則。在實(shí)際操作中,不同的標(biāo)的之間通常沒有統(tǒng)計(jì)上的差異,特別是如果它們是密切相關(guān)的,如一組股票指數(shù)期貨實(shí)際上,將數(shù)據(jù)集中起來并將多個(gè)標(biāo)的組合在一起是獲得更多數(shù)據(jù)歷史的一個(gè)極好方法,這讓你能夠更好地區(qū)分盈利和虧損交易規(guī)則。作為一個(gè)例子,我在自己的投資組合中有兩條交易規(guī)則,對(duì)于一個(gè)典型的單一標(biāo)的,夏普比率(SR)分別為0.05和0.30。盡管完全不相關(guān),表6顯示我需要45年的時(shí)間來區(qū)分它們;幾乎不可能,因?yàn)樽钤绲慕鹑谄谪浽?972年才開始交易。然而,同樣的規(guī)則運(yùn)行在投資組合工具上,SR為0.13和1.13。表格顯示,我只需要11年的數(shù)據(jù)就可以區(qū)分這兩個(gè)夏普比率。為了讓標(biāo)的池化更容易,你應(yīng)該設(shè)計(jì)通用的交易規(guī)則,并且適用于任何標(biāo)的資產(chǎn)。我將在第七章“預(yù)測”中給出一些通用交易規(guī)則的例子。
????一些有效擬合的規(guī)則
如果你沒有被警告不要試水,而是堅(jiān)持使用數(shù)據(jù)來選擇和校準(zhǔn)交易規(guī)則,那么遵循這個(gè)建議應(yīng)該會(huì)讓你遠(yuǎn)離嚴(yán)重的擬合危險(xiǎn)。那些現(xiàn)在對(duì)擬合感到恐懼的人可以跳到下一節(jié),在那里我將向你展示如何避免幾乎完全擬合。
保持簡單
我不喜歡復(fù)雜的擬合方法,我不喜歡使用它們。但如果你確實(shí)認(rèn)為自己是黑暗統(tǒng)計(jì)藝術(shù)的專家,那么你自然會(huì)想要實(shí)踐它。只是要注意,當(dāng)你過度擬合時(shí),方法越復(fù)雜,就越難意識(shí)到。
(越隱式擬合)
更少的選擇
如表4所示,除非你有多年的數(shù)據(jù),否則減少交易規(guī)則和變量的標(biāo)的池是至關(guān)重要的.
禁止時(shí)光機(jī)
你應(yīng)該總是使用滾動(dòng)窗口擬合或展開樣本外擬合。如果使用滾動(dòng)窗口,不要讓時(shí)間太短;請(qǐng)注意區(qū)分規(guī)則和隨機(jī)噪聲所需的年數(shù),以及相互之間的年數(shù)(表4、5和6)。
不要隨意丟掉規(guī)則
在選擇一個(gè)規(guī)則或變量并根據(jù)過去的表現(xiàn)拋棄其他規(guī)則或變化之前,請(qǐng)仔細(xì)查看表6。在現(xiàn)實(shí)中,很難找到表現(xiàn)截然不同,但相關(guān)性非常高的規(guī)則。更有可能的情況是,你發(fā)現(xiàn)了非常不同的規(guī)則,可能夏普比率(SR)差值是為0.5,但他們幾乎沒有相關(guān)性,或者相關(guān)性非常高的規(guī)則變量,SR表現(xiàn)非常相似。在這兩種情況下,你都需要30年的數(shù)據(jù)來區(qū)分識(shí)別它們。有30年甚至更長的價(jià)格歷史的公司是很少見的,因此,僅就表現(xiàn)情況而言,很難選出一條規(guī)則而不是另一條規(guī)則。
跨標(biāo)的資產(chǎn)收集數(shù)據(jù)
你需要所有的數(shù)據(jù)來做出合適的決定。最簡單的解決方案是從多個(gè)標(biāo)的中收集數(shù)據(jù)。只有當(dāng)不同標(biāo)的之間的各種規(guī)則在性能上存在統(tǒng)計(jì)學(xué)上的顯著差異時(shí),才應(yīng)該單獨(dú)適用它們。實(shí)際上,這幾乎沒有必要。
比較蘋果和蘋果
在本章中,我假設(shè)你使用夏普比率(SR)來比較規(guī)則。但將正傾斜規(guī)則和負(fù)傾斜規(guī)則純粹基于SR進(jìn)行比較,是非常容易誤導(dǎo)人的,因?yàn)樨?fù)傾斜規(guī)則往往具有非常高的SR。
當(dāng)未來不再像過去時(shí)
要注意關(guān)注整體表現(xiàn),而不是相對(duì)于基準(zhǔn)的回報(bào)。這是非常危險(xiǎn)的,因?yàn)樵S多資產(chǎn)類別,如股票和債券,在過去40年左右的時(shí)間里表現(xiàn)非常好。最簡單的在歷史回測種獲得超額收益的方法就是使用與標(biāo)的資產(chǎn)類別相關(guān)度更高的交易規(guī)則,但這在未來不太可能奏效,因?yàn)檫@些高回報(bào)的主要原因是通脹顯著下降;一些不會(huì)被重復(fù)的事情。(觸手OS:仔細(xì)自考這句話。通脹顯著下降在這被定義為不會(huì)被重復(fù)的事情,至少在寫這本書的時(shí)候。了解這個(gè)概念的目的在于理解我們所設(shè)定的規(guī)則具體的利潤來源,而在這里,通脹被理解成利潤的主要驅(qū)動(dòng)力,當(dāng)主要驅(qū)動(dòng)消失,規(guī)則可能面臨失效,因?yàn)檫@件事不會(huì)被重復(fù)。所以,比如當(dāng)我們使用多品種配置的趨勢(shì)跟蹤策略,也需要了解系統(tǒng)規(guī)則驅(qū)動(dòng)下,利潤來源是什么)
我如何選擇我的規(guī)則
有許多方法可以在擬合的雷區(qū)中避免踩雷。我個(gè)人傾向于在不考慮實(shí)際表現(xiàn)的情況下選擇交易規(guī)則和變量,從而幾乎完全避免這種情況。我使用以下過程:
1,想出一些交易規(guī)則來證實(shí)我對(duì)市場行為的一些想法。
2,為每個(gè)規(guī)則選擇一些變量。在這個(gè)階段,我不關(guān)注變量表現(xiàn),而是關(guān)注交易頻率、與其他變量的相關(guān)性等等的東西。
3,考慮到夏普比率的不確定性,為每個(gè)變量分配預(yù)測的權(quán)重。糟糕的規(guī)則給更低的權(quán)重,但很少會(huì)被完全排除在外。這個(gè)過程意味著我不使用系統(tǒng)表現(xiàn)來擬合交易規(guī)則和變量。相反,收益率數(shù)據(jù)保留用于找預(yù)測權(quán)重。這些權(quán)重決定了每種變量在預(yù)測每種標(biāo)的資產(chǎn)的收益時(shí)所占的比例。下一章將解釋這種投資組合配置如何在不冒過度擬合風(fēng)險(xiǎn)的情況下,減少對(duì)明顯較差變量的權(quán)重。
任何在最終投資組合中權(quán)重微不足道的表現(xiàn)差的變量,最終就可以從實(shí)盤交易系統(tǒng)中刪除,從而降低實(shí)現(xiàn)交易系統(tǒng)的復(fù)雜性,而且可以得到與排除規(guī)則前相同的最終結(jié)果,但這意味著合并被排除的規(guī)則的任何回測數(shù)據(jù)更加真實(shí)了。
從少量的想法開始
我更喜歡提出相對(duì)較少的交易規(guī)則的想法。在我自己的投資組合中,我從5個(gè)不同的主題中總結(jié)了8條規(guī)則,但如果我從頭開始,我只會(huì)從其中的一些規(guī)則開始:我會(huì)在第七章“預(yù)測”中向你們展示的趨勢(shì)的遵循和包含的規(guī)則。
1,你應(yīng)該有少量的規(guī)則,因?yàn)楦俚囊?guī)則意味著:
更少的過度擬合風(fēng)險(xiǎn):更少的想法意味著更少的過度擬合機(jī)會(huì),在接受規(guī)則之前需要更低的臨界夏普比率(表4)。
2,給貓剝皮的方法有很多,一種市場行為可以通過多種方式被發(fā)現(xiàn)。例如,我們可以用動(dòng)量振蕩器、離散度分析和突破系統(tǒng)來捕捉趨勢(shì)。為一種市場行為制定幾十條類似的規(guī)則沒有什么價(jià)值。
3,保持簡單:在我的過程中,所有的規(guī)則都會(huì)在選擇過程中幸存下來,所以一開始過多的規(guī)則會(huì)讓交易系統(tǒng)變得復(fù)雜。復(fù)雜的系統(tǒng)更難以被信任和理解。
????業(yè)余和專業(yè)的交易系統(tǒng)設(shè)計(jì)師都花費(fèi)了太多的時(shí)間和精力去尋找更多更好的交易規(guī)則。但是增加額外規(guī)則的邊際價(jià)值很低,特別是當(dāng)它們具有相同的交易風(fēng)格時(shí)。交易某一特定標(biāo)的資產(chǎn)的不同規(guī)則之間的平均相關(guān)性高于交易同一規(guī)則的標(biāo)的資產(chǎn)之間的平均相關(guān)性。所以多樣化投資比規(guī)則多樣化要好。添加新標(biāo)的是一項(xiàng)上傳數(shù)據(jù)和核對(duì)數(shù)據(jù)的煩人任務(wù),這不如提出更多的交易規(guī)則有趣,但根據(jù)我的經(jīng)驗(yàn),它的益處要大得多。
保持適當(dāng)數(shù)量的變化
????盡管我更喜歡使用相對(duì)較少的交易規(guī)則,我通常不會(huì)使用只有一種變量的任何規(guī)則。但是沒有必要使用90個(gè)或更多的組合。例如,如果你試圖捕捉價(jià)格勢(shì)頭,那么你可能需要一種能夠捕捉相對(duì)較快趨勢(shì)的變化,一種能夠捕捉非常緩慢的走勢(shì)的變化,或許還需要兩到三種變化。如果你的兩個(gè)變量有超過95%的相關(guān)性,你可以安全地放棄其中一個(gè),因?yàn)樗鼛缀鯖]有邊際效益。你也可以刪除那些交易成本太高的變量,或者那些交易非常緩慢,所以不太可能給你帶來顯著回報(bào)的變量。但也不要純粹因?yàn)樾阅芏艞壸兞俊?/p>
先不要看收益率
????我傾向于保留實(shí)際的歷史表現(xiàn)數(shù)據(jù),以決定給交易規(guī)則和它們的變量賦予哪些預(yù)測權(quán)重。做的好可以讓你獲得真實(shí)的回測表現(xiàn),但仍然可以是糟糕的交易規(guī)則。但是,如果你已經(jīng)使用真實(shí)的數(shù)據(jù)來預(yù)篩選好的規(guī)則,那么你的歷史回測表現(xiàn)將會(huì)過于樂觀,你會(huì)過度擬合。因此,在這個(gè)階段,你應(yīng)該關(guān)注的只是相關(guān)性和可能的交易成本等等的東西,而不是業(yè)績。你必須避免干預(yù)回測。
????這里沒有太多關(guān)于這個(gè)過程的細(xì)節(jié),但是在書的后面會(huì)有例子說明它是如何工作的。不管你是擬合自己的交易規(guī)則,還是用我的“手工(handcrafting)”方法,下一個(gè)問題就是決定在你的交易系統(tǒng)中使用多少規(guī)則X,多少規(guī)則Y,多少工具A或工具B。這個(gè)投資組合分配的問題將在下一章中討論。(觸手OS:handcrafting在本書里沒有做太多具體算法解釋,主要是估計(jì)的相關(guān)性)