python用線性回歸預(yù)測(cè)股票價(jià)格
原文鏈接:http://tecdat.cn/?p=2979
?
線性回歸在整個(gè)財(cái)務(wù)中廣泛應(yīng)用于眾多應(yīng)用程序中。在之前的教程中,我們使用普通最小二乘法(OLS)計(jì)算了公司的beta與相對(duì)索引的比較。現(xiàn)在,我們將使用線性回歸來估計(jì)股票價(jià)格。
線性回歸是一種用于模擬因變量(y)和自變量(x)之間關(guān)系的方法。通過簡(jiǎn)單的線性回歸,只有一個(gè)自變量x??赡苡性S多獨(dú)立變量屬于多元線性回歸的范疇。在這種情況下,我們只有一個(gè)自變量即日期。對(duì)于第一個(gè)日期上升到日期向量長(zhǎng)度的整數(shù),該日期將由1開始的整數(shù)表示,該日期可以根據(jù)時(shí)間序列數(shù)據(jù)而變化。當(dāng)然,我們的因變量將是股票的價(jià)格。為了理解線性回歸,您必須了解您可能在學(xué)校早期學(xué)到的相當(dāng)基本的等式。
y = a + bx
Y =預(yù)測(cè)值或因變量
b =斜率
x =系數(shù)或自變量
a = 截距
從本質(zhì)上講,這將構(gòu)成我們對(duì)數(shù)據(jù)的最佳擬合。在OLS過程中通過數(shù)據(jù)集繪制了大量線條。該過程的目標(biāo)是找到最佳擬合線,最小化平方誤差和(SSE)與股票價(jià)格(y)的實(shí)際值以及我們?cè)跀?shù)據(jù)集中所有點(diǎn)的預(yù)測(cè)股票價(jià)格。這由下圖表示。對(duì)于繪制的每條線,數(shù)據(jù)集中的每個(gè)點(diǎn)與模型輸出的相應(yīng)預(yù)測(cè)值之間存在差異。將這些差異中的每一個(gè)加起來并平方以產(chǎn)生平方和。從列表中,我們采用最小值導(dǎo)致我們的最佳匹配線。考慮下圖:

第一部分:獲取數(shù)據(jù):
from matplotlib import style
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
import quandl
import datetime
style.use('ggplot')
start_date = datetime.date(2017,1,3)
t_date=start_date, end_date=end_date, collapse="daily")
df = df.reset_index()
prices = np.reshape(prices, (len(prices), 1))
第二部分:創(chuàng)建一個(gè)回歸對(duì)象:
', linewidth=3, label = 'Predicted Price') #plotting the line made by linear regression
plt.title('Linear Regression | Time vs. Price')
plt.legend()
predicted_price =regressor.predict(date)
輸出:

預(yù)測(cè)日期輸入價(jià)格:
創(chuàng)建訓(xùn)練/測(cè)試集
et
xtrain, x , ytrain)
#Train
plt.title('Linear Regression | Time vs. Price')
#Test Set Graph
plt.scatter(xtest, ytest, color='yellow', label= 'Actual Price') #plotting the initial datapoints
plt.plot(xtest, regressor.predict(xtest), color='blue', linewidth=3, label = 'Predicted Price') #plotting
plt.show()
輸出:

測(cè)試集:

?
參考文獻(xiàn)

1.用機(jī)器學(xué)習(xí)識(shí)別不斷變化的股市狀況—隱馬爾科夫模型(HMM)的應(yīng)用
2.R語言GARCH-DCC模型和DCC(MVT)建模估計(jì)
3.R語言實(shí)現(xiàn) Copula 算法建模依賴性案例分析報(bào)告
4.R語言COPULAS和金融時(shí)間序列數(shù)據(jù)VaR分析
5.R語言多元COPULA GARCH 模型時(shí)間序列預(yù)測(cè)
6.用R語言實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)股票實(shí)例
7.r語言預(yù)測(cè)波動(dòng)率的實(shí)現(xiàn):ARCH模型與HAR-RV模型
8.R語言如何做馬爾科夫轉(zhuǎn)換模型markov switching model
9.matlab使用Copula仿真優(yōu)化市場(chǎng)風(fēng)險(xiǎn)