學(xué)習(xí)筆記:多元線性回歸 MLR
今天從論文中看到一個(gè)multivariate regression (MLR) 多元線性回歸的方法,在地下水影響因素中做了MLR
什么是多元線性回歸 (MLR)?
多元線性回歸 (MLR),也稱為多元回歸,是一種使用多個(gè)解釋變量來預(yù)測(cè)響應(yīng)變量結(jié)果的統(tǒng)計(jì)技術(shù)。多元線性回歸的目標(biāo)是對(duì)解釋(自變量)變量和響應(yīng)(因)變量之間的線性關(guān)系進(jìn)行建模。從本質(zhì)上講,多元回歸是普通最小二乘 (OLS)?回歸的擴(kuò)展,因?yàn)樗婕岸鄠€(gè)解釋變量。
多元線性回歸的公式和計(jì)算


多元線性回歸告訴了我們什么?
簡(jiǎn)單線性回歸是一種函數(shù),它允許分析師或統(tǒng)計(jì)學(xué)家根據(jù)有關(guān)另一個(gè)變量的已知信息對(duì)一個(gè)變量進(jìn)行預(yù)測(cè)。線性回歸僅在具有兩個(gè)連續(xù)變量(自變量和因變量)時(shí)使用。自變量是用于計(jì)算因變量或結(jié)果的參數(shù)。多元回歸模型擴(kuò)展到多個(gè)解釋變量。
多元回歸模型基于以下假設(shè):
因變量和自變量之間存在線性關(guān)系
自變量之間的相關(guān)性不太高
yi觀測(cè)值是從總體中獨(dú)立隨機(jī)選擇的
殘差應(yīng)呈正態(tài)分布,均值為 0,方差σ
決定系數(shù)(R 平方)是一個(gè)統(tǒng)計(jì)指標(biāo),用于衡量結(jié)果變異中有多少可以用自變量的變異來解釋。R2總是隨著向 MLR 模型添加的預(yù)測(cè)變量越多而增加,即使預(yù)測(cè)變量可能與結(jié)果變量無關(guān)。
因此,R2本身不能用于識(shí)別哪些預(yù)測(cè)變量應(yīng)包含在模型中,哪些預(yù)測(cè)變量應(yīng)被排除。R2只能介于 0 和 1 之間,其中 0 表示任何自變量都無法預(yù)測(cè)結(jié)果,1 表示可以在沒有自變量誤差的情況下預(yù)測(cè)結(jié)果。
在解釋多元回歸的結(jié)果時(shí),β系數(shù)在保持所有其他變量不變的情況下是有效的(“所有其他條件都相等”)。多元回歸的輸出可以水平顯示為方程,也可以垂直顯示為表格形式。
如何使用多元線性回歸的示例
例如,分析師可能想知道市場(chǎng)走勢(shì)如何影響(XOM)的價(jià)格。在這種情況下,他們的線性方程將以標(biāo)準(zhǔn)普爾500指數(shù)的值作為自變量或預(yù)測(cè)因子,將XOM的價(jià)格作為因變量。
實(shí)際上,多個(gè)因素預(yù)測(cè)事件的結(jié)果。例如,一個(gè)物品的價(jià)格走勢(shì)不僅僅取決于整個(gè)市場(chǎng)的表現(xiàn)。其他預(yù)測(cè)因素,如石油價(jià)格、利率和石油期貨的價(jià)格走勢(shì),可能會(huì)影響 XOM 的價(jià)格和其他石油公司的股價(jià)。為了理解存在兩個(gè)以上變量的關(guān)系,使用了多元線性回歸。
多元線性回歸 (MLR) 用于確定多個(gè)隨機(jī)變量之間的數(shù)學(xué)關(guān)系。換句話說,MLR 檢查多個(gè)自變量如何與一個(gè)因變量相關(guān)。一旦確定每個(gè)自因子來預(yù)測(cè)因變量,就可以使用有關(guān)多個(gè)變量的信息來創(chuàng)建對(duì)它們對(duì)結(jié)果變量的影響水平的準(zhǔn)確預(yù)測(cè)。該模型以直線(線性)的形式創(chuàng)建關(guān)系,該關(guān)系最接近所有單個(gè)數(shù)據(jù)點(diǎn)。
參考上面的 MLR 方程,在我們的示例中:
yi =?因變量 - XOM 的價(jià)格
xi1= 利率
xi2= 油價(jià)
xi3= 標(biāo)準(zhǔn)普爾500指數(shù)的價(jià)值
xi4= 石油期貨價(jià)格
B0= 時(shí)間零處的 y 截距
B1=回歸系數(shù),用于測(cè)量 xi1變化時(shí)因變量的單位變化 - 利率變化時(shí) XOM 價(jià)格的變化
B2= 系數(shù)值,用于測(cè)量 xi2變化時(shí)因變量的單位變化 - 油價(jià)變化時(shí) XOM 價(jià)格的變化
最小二乘估計(jì) - B0、B1、B2...Bp—通常由統(tǒng)計(jì)軟件計(jì)算?;貧w模型中可以包含盡可能多的變量,其中每個(gè)自變量都用一個(gè)數(shù)字 - 1,2,3,4...p進(jìn)行區(qū)分。多元回歸模型允許分析人員根據(jù)提供的多個(gè)解釋變量的信息預(yù)測(cè)結(jié)果。
盡管如此,該模型并不總是完全準(zhǔn)確的,因?yàn)槊總€(gè)數(shù)據(jù)點(diǎn)可能與模型預(yù)測(cè)的結(jié)果略有不同。殘值E是實(shí)際結(jié)果和預(yù)測(cè)結(jié)果之間的差值,包含在模型中以解釋這種細(xì)微變化。
假設(shè)我們通過統(tǒng)計(jì)計(jì)算軟件運(yùn)行 XOM 價(jià)格回歸模型,返回以下輸出:
分析師將這一產(chǎn)出解釋為,如果其他變量保持不變,如果市場(chǎng)上的石油價(jià)格上漲 1%,XOM 的價(jià)格將上漲 7.8%。該模型還顯示,在利率上升1%之后,XOM的價(jià)格將下降1.5%。R2表示,??松梨诠蓛r(jià)變動(dòng)的86.5%可以用利率、油價(jià)、石油期貨和標(biāo)準(zhǔn)普爾500指數(shù)的變化來解釋。
線性回歸和多元回歸的區(qū)別
普通線性平方?(OLS) 回歸比較因變量在某些解釋變量發(fā)生變化的情況下的響應(yīng)。但是,因變量很少只能用一個(gè)變量來解釋。在這種情況下,分析師使用多元回歸,嘗試使用多個(gè)自變量來解釋因變量。多元回歸可以是線性的,也可以是非線性的。
多元回歸基于因變量和自變量之間存在線性關(guān)系的假設(shè)。它還假設(shè)自變量之間沒有主要相關(guān)性。
是什么使多元回歸倍數(shù)?
多元回歸考慮多個(gè)解釋變量對(duì)某些感興趣的結(jié)果的影響。它評(píng)估當(dāng)模型中的所有其他變量保持常量時(shí),這些解釋變量或自變量對(duì)因變量的相對(duì)影響。
為什么使用多元回歸而不是簡(jiǎn)單的 OLS 回歸?
因變量很少只用一個(gè)變量來解釋。在這種情況下,分析師使用多元回歸,嘗試使用多個(gè)自變量來解釋因變量。但是,該模型假設(shè)自變量之間沒有主要相關(guān)性。
我可以手動(dòng)進(jìn)行多元回歸嗎?
這不太可能,因?yàn)槎嘣貧w模型很復(fù)雜,當(dāng)模型中包含更多變量或要分析的數(shù)據(jù)量增加時(shí),多元回歸模型會(huì)變得更加復(fù)雜。要運(yùn)行多元回歸,您可能需要在 Excel 等程序中使用專門的統(tǒng)計(jì)軟件或函數(shù)。
多元回歸是線性的是什么意思?
在多元線性回歸中,模型計(jì)算最佳擬合線,以最小化所包含的每個(gè)變量的方差,因?yàn)樗c因變量相關(guān)。因?yàn)樗m合一條線,所以它是一個(gè)線性模型。還有涉及多個(gè)變量的非線性回歸模型,例如邏輯回歸、二次回歸和概率模型。
多元回歸模型如何在金融中使用?
任何查看多個(gè)變量的計(jì)量經(jīng)濟(jì)學(xué)模型都可能是多個(gè)變量。因子模型比較兩個(gè)或多個(gè)因子,以分析變量與結(jié)果性能之間的關(guān)系。Fama 和 French Three-Factor Mod就是這樣一個(gè)模型,它通過在 CAPM 中的市場(chǎng)風(fēng)險(xiǎn)因素中添加規(guī)模風(fēng)險(xiǎn)和價(jià)值風(fēng)險(xiǎn)因素(它本身就是一個(gè)回歸模型)來擴(kuò)展資本資產(chǎn)定價(jià)模型?(CAPM)。通過包括這兩個(gè)額外的因素,該模型針對(duì)這種表現(xiàn)優(yōu)異的趨勢(shì)進(jìn)行了調(diào)整,這被認(rèn)為使其成為評(píng)估經(jīng)理績(jī)效的更好工具。

總說,個(gè)人理解就是建立一個(gè)多元函數(shù)!