最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊

第八課 使用機(jī)器學(xué)習(xí)模型LSTM預(yù)測股票價(jià)格 -- 零基礎(chǔ)量化投資小課堂

2023-05-05 19:34 作者:量化的韭菜  | 我要投稿

目標(biāo): 使用深度學(xué)習(xí)模型LSTM對股票價(jià)格進(jìn)行簡單的預(yù)測

經(jīng)過前兩節(jié)課的學(xué)習(xí),我們已經(jīng)知道了因子的定義并且已經(jīng)能夠?qū)?jīng)典的因子進(jìn)行測試。但是因?yàn)檫@些基礎(chǔ)的因子已經(jīng)被深入的研究了很多年了,有些基礎(chǔ)的因子甚至幾十年前就有人在論文里提出,所以這些因子基本上很難有超額收益。

現(xiàn)在私募或者一些自營團(tuán)隊(duì)都會(huì)使用深度神經(jīng)網(wǎng)絡(luò)對價(jià)量或者其他數(shù)據(jù)進(jìn)行訓(xùn)練,以挖掘更多因子,甚至有些頭部私募采用大規(guī)模深度學(xué)習(xí)自動(dòng)挖掘并測試因子,行業(yè)卷度逐年上升。

本章將介紹業(yè)界比較常用的LSTM模型,并基于此實(shí)現(xiàn)一個(gè)股票價(jià)格預(yù)測的基礎(chǔ)模型,當(dāng)然你不必對這個(gè)模型抱有太高的期望,我基本可以保證這個(gè)簡單的模型不可能賺錢,但有了方法之后你可以加入更多的數(shù)據(jù)或者想法,那時(shí)候就很有可能賺錢了,而且是你自己的策略。

首先,關(guān)于LSTM的學(xué)術(shù)定義和相關(guān)的論文我就不多介紹了,需要的篇幅太長,脫離了本課程的主線。感興趣的可以去閱讀相關(guān)的書籍或資料,但我強(qiáng)烈不建議新手硬啃整套機(jī)器學(xué)習(xí)課程,沒有強(qiáng)大的數(shù)學(xué)和計(jì)算機(jī)基礎(chǔ)的人我認(rèn)為不可能堅(jiān)持下來,阻礙了你對于投資的探索。

簡單來說,你可以認(rèn)為LSTM就是一個(gè)機(jī)器學(xué)習(xí)模型的黑盒,他需要的輸入是時(shí)間序列的數(shù)據(jù),輸出是基于輸入的預(yù)測值。舉個(gè)例子就是輸入是股票每天的收盤價(jià),輸出是預(yù)測明天的收盤價(jià),或者五天后的收益率。聽起來不太靠譜,但是這個(gè)模型天生就是用于預(yù)測資產(chǎn)價(jià)格等時(shí)間序列的,比如耳熟能詳?shù)牟ㄊ款D房價(jià),或者某市的氣溫。

首先我們需要安裝所需的python包,分別是keras,sklearn和tensorflow.

接下來我們需要的還是一樣,價(jià)格數(shù)據(jù)。


導(dǎo)入相關(guān)包并且輸入開始和結(jié)束時(shí)間后,我們獲得了蘋果AAPL.US的價(jià)量數(shù)據(jù)。為什么這里變成美股了呢?因?yàn)楸竟?jié)代碼由chatGPT生成,我稍微改了一下讓他能跑。

有了數(shù)據(jù)之后,我們就可以把這些數(shù)據(jù)喂到我們的深度學(xué)習(xí)模型中去了,這列我們?nèi)∏叭曜鲇?xùn)練集,后一年做測試集。意思就是讓模型去學(xué)前三年股票價(jià)格走勢的規(guī)律,并用最后一年的這個(gè)規(guī)律做測試。

這里我們使用前六十天的價(jià)格預(yù)測后一天的價(jià)格。標(biāo)簽處理如下

導(dǎo)入相關(guān)包并且構(gòu)造基礎(chǔ)模型,這里給出的就是模型的細(xì)節(jié)了,可以看到我們的模型有三個(gè)LSTM層,里面是節(jié)點(diǎn)數(shù),這里的參數(shù)是可以調(diào)的,很多算法工程師的工作就是尋找最優(yōu)的參數(shù),使得模型的表現(xiàn)更好。

這里需要等一段時(shí)間,但不會(huì)很長,因?yàn)槲覀兊哪P秃芎唵危绻愕碾娔X比較好的話訓(xùn)練時(shí)間會(huì)快一點(diǎn),如果用顯卡的話會(huì)更快,但簡單起見我們不討論更多機(jī)器學(xué)習(xí)的優(yōu)化細(xì)節(jié)。

模型訓(xùn)練完畢之后,我們用剛剛訓(xùn)練好的模型進(jìn)行價(jià)格的預(yù)測,并且畫圖。

圖片

雖然看起來還不錯(cuò),但很快就會(huì)發(fā)現(xiàn)我們的預(yù)測值會(huì)有明顯的滯后,這是LSTM的通病。

到這里,我們生成的價(jià)格預(yù)測數(shù)據(jù)就形成了一個(gè)深度學(xué)習(xí)因子。

還記得我們上兩節(jié)課的內(nèi)容嗎?你可以把這個(gè)因子放到框架中對他進(jìn)行測試,看看他的表現(xiàn),是否真的能賺錢。

答案不出意外的話應(yīng)該是不能。但沒準(zhǔn)你多調(diào)調(diào)參,他就能了呢?


歡迎關(guān)注同名微信公眾號(hào)【量化的韭菜】或知識(shí)星球獲取更多內(nèi)容?

第八課 使用機(jī)器學(xué)習(xí)模型LSTM預(yù)測股票價(jià)格 -- 零基礎(chǔ)量化投資小課堂的評(píng)論 (共 條)

分享到微博請遵守國家法律
云南省| 开鲁县| 喀喇| 灌阳县| 鄂伦春自治旗| 密云县| 临西县| 嵩明县| 喜德县| 崇阳县| 上杭县| 平罗县| 团风县| 英吉沙县| 临朐县| 嘉定区| 正宁县| 慈利县| 盐山县| 莱阳市| 那曲县| 陇川县| 信阳市| 平潭县| 江口县| 通州区| 抚远县| 乌恰县| 潮安县| 花垣县| 金昌市| 秀山| 崇义县| 平凉市| 新干县| 孙吴县| 布尔津县| 夏河县| 瓦房店市| 都江堰市| 稻城县|