R語(yǔ)言兩階段最小二乘法2SLS回歸、工具變量法分析股息收益、股權(quán)溢價(jià)和surfaces曲面圖
全文鏈接:http://tecdat.cn/?p=31757
原文出處:拓端數(shù)據(jù)部落公眾號(hào)
投資者最關(guān)心的兩個(gè)問(wèn)題就是收益率和股息,兩者作為公司經(jīng)營(yíng)狀況的兩個(gè)重要方面,往往同時(shí)出現(xiàn)在投資報(bào)告中,二者之間具有較強(qiáng)的關(guān)聯(lián)性。目前,國(guó)內(nèi)外對(duì)于股票股息收益、股息收益率和股權(quán)溢價(jià)等方面的研究已有很多,但大多數(shù)是關(guān)于市場(chǎng)環(huán)境或宏觀因素對(duì)上述指標(biāo)產(chǎn)生影響的研究。
本文選擇滬深兩市股票作為研究對(duì)象,幫助客戶構(gòu)建兩階段最小二乘法2 SLS回歸、工具變量法分析股息收益、股息收益率和股權(quán)溢價(jià),旨在探究指標(biāo)間是否具有顯著相關(guān)關(guān)系。研究結(jié)論不僅為投資者提供了分析投資機(jī)會(huì)的理論依據(jù),還有助于上市公司進(jìn)行決策分析。此外,文章還對(duì)相關(guān)行業(yè)的發(fā)展具有一定指導(dǎo)意義。
1.數(shù)據(jù)
表格中包括從1965年到2014年的月度數(shù)據(jù),需要用到的是: yyyymm(年?),
index(s&p 500 price index) , Dividend, D12(dividend yield), Rfree(risk-free rate)

讀取數(shù)據(jù),查看數(shù)據(jù)
head(data)##?? yyyymm Index Dividend???? D12???? E12?????? b/m??? tbl??? AAA??? BAA ?## 1 196501 87.56? 2.51667 2.51667 4.59333 0.4717232 0.0381 0.0443 0.0480 ?## 2 196502 87.43? 2.53333 2.53333 4.63667 0.4713995 0.0393 0.0441 0.0478 ?## 3 196503 86.16? 2.55000 2.55000 4.68000 0.4694899 0.0393 0.0442 0.0478 ?## 4 196504 89.11? 2.57000 2.57000 4.73333 0.4525593 0.0393 0.0443 0.0480 ?## 5 196505 88.42? 2.59000 2.59000 4.78667 0.4546643 0.0389 0.0444 0.0481 ?## 6 196506 84.12? 2.61000 2.61000 4.84000 0.4808590 0.0380 0.0446 0.0485 ?##????? lty?????? ntis?????? Rfree???????? infl??? ltr?? corpr???????? svar ?## 1 0.0422 0.01790289 0.003175000 0.0009600000 0.0040? 0.0081 0.0001534973 ?## 2 0.0424 0.01482236 0.003275000 0.0000000000 0.0014? 0.0009 0.0003681211 ?## 3 0.0422 0.01913336 0.003275000 0.0009590793 0.0054? 0.0012 0.0001431412 ?## 4 0.0422 0.01472169 0.003275000 0.0022357074 0.0036? 0.0021 0.0001654871 ?## 5 0.0423 0.01624416 0.003241667 0.0031867431 0.0018 -0.0008 0.0003363517 ?## 6 0.0423 0.01755028 0.003166667 0.0041296061 0.0047? 0.0003 0.0018498325 ?##???????????? csp CRSP_SPvw CRSP_SPvwx ?## 1 -0.0022007442? 0.034791?? 0.033837 ?## 2 -0.0022017761? 0.003746? -0.000853 ?## 3 -0.0021373681 -0.012213? -0.013685 ?## 4 -0.0021429735? 0.035612?? 0.034769 ?## 5 -0.0025656153 -0.003122? -0.008354 ?## 6 -0.0023808197 -0.046880? -0.048367#需要用到的是有紅色標(biāo)記的:yyyy(年份),price index(s&p 500 price index),D12(dividend yield),Rfree(risk-free)CampaignData <- na.omit(subset(AllData, select=c("yyyymm","Index","D12","Rfree","Dividend")))
2.自變量x
?變量x是D12(dividend-yield), DY(t)=log[D(t)/P(t-1)],這?的D(t)就是表格中的Dividend。 P(t-1) 就是表格中的index.
DY=log(Dt/Pt)
3.因變量y
因變量y是股權(quán)溢價(jià)(equity premium),公式是equity premium=rm(t)-rf(t) 關(guān)于rm(t): rm(t)=log[Rm,t]=log[ (P(t)+D(t)) / P(t-1) ],D(t)就是表格中的Dividend.
P(t),P(t-1)就是表格中的index. 關(guān)于 rf(t): rf(t)=log[1+Rf(t)],這?的Rf(t)就是表格中的Rfree(risk-free rate)
equity_premium=Rm-Rf ?y=equity_premium
4.模型
y(t)=β* x(t-1)+ε(t) (1)
oequity_premium[-1] ~ CampaignData$D12[-n] +I(1:(n-1)), data=CampaignData)

x(t)= ρ* x(t-1)+u(t) (2)

5.工具變量:
z(t)=ρz* z(t-1)+Δx(t) ,其中ρz是z(t-1)的系數(shù),和式?(2)中的ρ不是同?個(gè)值.
這?的 z0=0,ρz=1+c/nκ , c=-1,k=0.95
c=-1 ?z=0 ?ρz=1+c/(n^k) ?
for(i in 1:n)z[i+1]=ρz*z[i]+x[i] ?z=z[-1]

6.用兩階段最?二乘法做回歸, 2SLS
具體做法: (1)通過(guò)工具變量計(jì)算出z(t-1)的數(shù)值
(2)建?x(t-1)與z(t-1)的函數(shù)關(guān)系: x(t-1)=αz(t-1)+ e(t),通過(guò)OLS得出α的估計(jì)值,
然后得出x(t-1)的估計(jì)值。x(t-1)的估計(jì)值= α的估計(jì)值* z(t-1) (3)把x(t-1)的估計(jì)值帶?到第?個(gè)式?中,即y(t)=β* x(t-1)的估計(jì)值+ε(t) ,再
進(jìn)?OLS回歸,最后得到β的估計(jì)值,以及test-statistic的值,和p-value.
? # 建?x(t-1)與z(t-1)的函數(shù)關(guān)系 ?
? n=length(x) ?
? olsmodel <- lm(x[-1] ~ z[-n] +I(1:(n-1)), data=CampaignData) ?
#?? summary(olsmodel) ?
? ?
? # 得出x(t-1)的估計(jì)值 ?
#?? fitted(olsmodel) ?
? # 把x(t-1)的估計(jì)值帶?到第1?個(gè)式?中,即y(t)=β*x(t-1)的估計(jì)值+ε(t) ?
? p=summary(olsmodel)[4]$coefficients[,4][2] ?? return(p) ?p=numeric(0) ?
fo){ ?
??? p=c(p,f(x[xx[i]:xx[i+1]],y[yy[j]:yy[j+1]]))

7.p-value surfaces圖:
需要的是得到下?的這樣一張圖,?p-value 構(gòu)建的。
具體描述是: 所選取的樣本區(qū)間是從1965年1?到2014年12?,以5年為?個(gè)最短的?樣本。 圖的y軸為樣本的起始點(diǎn)?共540個(gè)(從1965年1?到2009年12?), x軸為樣本的終點(diǎn)?共也是540個(gè)(從1970年1?到2014年12?)。圖中的每?個(gè)點(diǎn)為?個(gè)?樣本的p-value的值。
for(j in 1:(length(yy)-1)){ ?
??? p=c(p,f(x[xx[i]:xx[i+1]],y[yy[j]:yy[j+1]]))persp(xx, yy, z, theta = 30, phi = 30, expand = 0.5, col = "lightblue")

?最受歡迎的見(jiàn)解
1.R語(yǔ)言多元Logistic邏輯回歸 應(yīng)用案例
2.面板平滑轉(zhuǎn)移回歸(PSTR)分析案例實(shí)現(xiàn)
3.matlab中的偏最小二乘回歸(PLSR)和主成分回歸(PCR)
4.R語(yǔ)言泊松Poisson回歸模型分析案例
5.R語(yǔ)言回歸中的Hosmer-Lemeshow擬合優(yōu)度檢驗(yàn)
6.r語(yǔ)言中對(duì)LASSO回歸,Ridge嶺回歸和Elastic Net模型實(shí)現(xiàn)
7.在R語(yǔ)言中實(shí)現(xiàn)Logistic邏輯回歸
8.python用線性回歸預(yù)測(cè)股票價(jià)格
9.R語(yǔ)言如何在生存分析與Cox回歸中計(jì)算IDI,NRI指標(biāo)