最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

高頻交易策略的思考(一)

2023-08-07 17:16 作者:發(fā)明者量化  | 我要投稿

轉(zhuǎn)自FMZ.COM,作者:小草

文章探討了數(shù)字貨幣高頻交易策略,包括利潤來源(主要來自市場劇烈波動和交易所手續(xù)費返傭),掛單位置和倉位控制的問題,以及用帕累托分布對成交量進(jìn)行建模的方法。此外,還引用了幣安提供的逐筆成交和最優(yōu)掛單數(shù)據(jù)進(jìn)行回測,并計劃在后續(xù)文章中深入討論高頻交易策略的其他問題。


以前我曾經(jīng)寫過兩篇關(guān)于數(shù)字貨幣高頻交易的兩篇文章?數(shù)字貨幣高頻策略詳細(xì)入門,?5天賺80倍,高頻策略的威力。但只能算是經(jīng)驗分享,泛泛而談。本次我計劃寫個系列文章, 從頭開始介紹高頻交易的思路, 希望盡量簡潔明了,但由于本人水平有限,對高頻交易的理解不算深入,本文只算拋磚引玉,希望大神指正。

高頻利潤來源

以前的文章提到過,高頻策略特別適合行情上下波動非常劇烈的行情??疾煲粋€交易品種在短時間內(nèi)的價格變化,由總的趨勢和震蕩組成。如果我們能準(zhǔn)確的預(yù)測趨勢的變化,當(dāng)然能夠賺錢,但這也是最難的,本文主要介紹高頻的maker策略,將不涉及這個問題。在震蕩行情中,策略上下掛單,如果成交的足夠頻繁,利潤空間足夠大,是能夠覆蓋因趨勢造成的可能損失,這樣不預(yù)測行情也能盈利。目前交易所maker成交都有手續(xù)費返傭,這也是利潤的組成部分,競爭越充分,rebate所占的比例也應(yīng)該也高。


要解決的問題

1.策略同時掛買單和賣單,第一個問題就是在哪里掛單。掛的離盤口越近,成交的概率越高,但在劇烈波動的行情中,瞬間成交的價格可能離盤口較遠(yuǎn),掛的那太近沒有能吃到足夠的利潤。掛的太遠(yuǎn)的單子成交概率又低。這是一個需要優(yōu)化的問題。

2.控制倉位。為了控制風(fēng)險,策略就不能長時間累計過多的倉位??梢酝ㄟ^控制掛單距離、掛單量、總倉位限制等辦法解決。

為了能達(dá)到上面的目的,需要對成交概率概率、成交的利潤、行情估計等多方面進(jìn)行建模估計,這方面的文章和論文很多,以High-Frequency Trading, Orderbook等關(guān)鍵詞可以找到。網(wǎng)上也有很多推薦,這里就不展開。另外最好還要建立一個可靠快速的回測系統(tǒng),雖然高頻策略很容易通過實盤來驗證策略的有效性,但回測還是能提供更多的思路,降低試錯的成本。

需要的數(shù)據(jù)

幣安提供了逐筆成交和最優(yōu)掛單數(shù)據(jù)供下載,深度數(shù)據(jù)需要在白名單中用API下載,也可以自己收集?;販y用途使用歸集的成交數(shù)據(jù)就可以。本文以HOOKUSDT-aggTrades-2023-01-27的數(shù)據(jù)為例。

逐筆成交有以下列:

  1. agg_trade_id:歸集成交單的id,

  2. price:成交價

  3. quantity:成交的數(shù)量

  4. first_trade_id:歸集交易可能有幾筆同時成交,只統(tǒng)計一條數(shù)據(jù),這是第一筆成交的id

  5. last_trade_id:最后成交的id

  6. transact_time:成交時間

  7. is_buyer_maker:成交方向,True代表買單maker成交,賣單是taker

可以看到當(dāng)天有66萬條成交數(shù)據(jù),成交很活躍。csv將附在評論區(qū)。


單筆成交量建模

先對數(shù)據(jù)進(jìn)行處理,把原始的trades分為了買單主動成交組和賣單主動成交組。另外原始聚合交易的數(shù)據(jù)是同一時間同一個價格同一方向為一條數(shù)據(jù),可能會發(fā)生一筆主動的買單量為100,如果分為多筆成交且價格不一樣,如分為了60和40兩筆,會產(chǎn)生兩條數(shù)據(jù),影響買單成交量的估計。因此在需要根據(jù)transact_time再聚合一次。聚合后數(shù)據(jù)量減少了14萬條。

In:

Out:

以買單為例,先畫出直方圖,可以看到長尾效應(yīng)非常明顯,大部分?jǐn)?shù)據(jù)集中在最左側(cè)一點,但也有少量的大成交分布在尾巴上。

為了觀察方便,截掉尾部觀察.可以看到成交量越大,出現(xiàn)頻率越低,且減少的趨勢更快。


關(guān)于成交量滿足的分布相關(guān)研究很多。其滿足冪律分布(Power-law distribution)又叫帕累托分布,是統(tǒng)計物理學(xué)和社會科學(xué)中常見的一種概率分布形式。在冪律分布中,事件的大?。ɑ蝾l率)的概率正比于該事件大小的某個負(fù)指數(shù)。這種分布形式的主要特點是大事件(即那些遠(yuǎn)離平均值的事件)的發(fā)生頻率比在許多其他分布中預(yù)期的要高。這正是成交量分布的特點。帕累托分布的形式為:P(x) = Cx^(-α)。下面將實證下。

下面這張圖表示成交量大于某個值的概率,藍(lán)線為實際概率,橙線為模擬的概率,這里先不要糾結(jié)具體的參數(shù),可以看到樣子確實很滿足帕累托分布。由于訂單量大于0的概率為1,且為了滿足標(biāo)準(zhǔn)化,其分布方程形式應(yīng)該如下:


其中N為標(biāo)準(zhǔn)化的參數(shù)。這里選擇平均成交量M,alpha選擇-2.06 。具體alpha的估計可以通過當(dāng)D=N是的P值反算出。具體的:alpha = log(P(d>M))/log(2) 。選擇不同的點alpha取值會稍有差異。

但這個估計只是看起來像,上圖我們畫出模擬值和實際值的差。當(dāng)成交量較小時偏差很大,甚至接近10%??梢酝ㄟ^參數(shù)估計時選擇不同的點來使這個點的概率更精準(zhǔn),但也解決不了偏離的問題。這是冪律分布和實際分布的差異決定的,為了得到更準(zhǔn)確的結(jié)果,需要對冪律分布的方程進(jìn)行修正。具體的過程不贅述,總之靈光閃過,發(fā)現(xiàn)實際應(yīng)該如下:


為了簡介這里用r = q/M 代表標(biāo)準(zhǔn)化的成交量。可以用上面同樣的方式估計參數(shù)。下面的圖可以看到修正后最大偏差不超過2%, 理論上可以繼續(xù)修正,但這個精度也夠用了。

有了對成交量分布的估計方程,注意方程的概率不是真實的概率,而是一個條件概率。此時可以回答這個問題,如果下一筆訂單發(fā)生,這個訂單大于某個值的概率是多少?也可以說,不同深度的訂單成交的概率是多少(理想情況,不那么嚴(yán)謹(jǐn),理論上訂單簿有新增訂單和撤單,以及同深度有排隊)。

寫到這里篇幅已經(jīng)差不多了,還有很多疑問需要解答,下面的系列文章將嘗試給出答案。




高頻交易策略的思考(一)的評論 (共 條)

分享到微博請遵守國家法律
赤壁市| 定日县| 岳阳市| 新津县| 辉县市| 北碚区| 武山县| 九江县| 阜南县| 炉霍县| 九江县| 广德县| 吉隆县| 资中县| 萝北县| 彭州市| 泌阳县| 永年县| 新郑市| 宜城市| 黄大仙区| 黔西县| 朝阳市| 德保县| 上高县| 连城县| 山东| 栾城县| 靖远县| 绵阳市| 沈阳市| 贵港市| 盐城市| 霍山县| 和顺县| 桃园县| 台北市| 葵青区| 曲靖市| 贵阳市| 灌云县|