SixSigma——多元回歸有哪些基本概念?
六西格瑪(SixSigma)的世界總是那么晦澀難懂,我們慢慢嚼爛它.

1. 什么是多元回歸?
多個(gè)自變量的回歸問題就是多元回歸
2. 什么是多元線性回歸?
因變量和自變量線性關(guān)系時(shí),為多元線性回歸
3. 最后那個(gè)誤差項(xiàng)是什么意思?
誤差項(xiàng)就是自變量無法解釋的變異部分

4. 多元回歸有假定條件嗎?
有,現(xiàn)有的分析都有假設(shè)條件,沒有就沒法分析。
a. 誤差項(xiàng)的期望為0
b. 誤差項(xiàng)的方差都相等
c. 誤差項(xiàng)服從正態(tài)分布N(0,?2)
6. 什么是估計(jì)回歸方程?
和一元回歸方程一樣,多元回歸方程用樣本去估計(jì)系數(shù)β(1,2….n),就叫估計(jì)回歸方程。
5. 它表示什么意思呢?
他表示在因變量中y的變差 被 估計(jì)回歸方程 能解釋的比例。
6. 什么是多重共線性?
當(dāng)回歸方程中多個(gè)自變量之間,彼此存在相關(guān),就會(huì)提供多余的信息,在預(yù)測中提供的信息也就是重復(fù)的,就稱為多重共線性。

7. 為什么存在多重共線性不好?
因?yàn)樽兞恐g存在關(guān)系,會(huì)使回歸的結(jié)果混亂??赡苁够貧w系數(shù)βi的正負(fù)號(hào)相反。
當(dāng)存在多重共線性,對(duì)回歸系數(shù)的解釋是非常危險(xiǎn)的。
8. 如何判定多重共線性?
a. 模型中各對(duì)自變量之間顯著相關(guān)
b. 當(dāng)模型的線性關(guān)系F檢驗(yàn)顯著時(shí),幾乎所有回歸系數(shù)βi的t檢驗(yàn)卻不顯著
c. 回歸系數(shù)的正負(fù)號(hào)與預(yù)期相反
d. 容忍度與方差擴(kuò)大因子VIF (variance inflation factor) VIF 越大,多重共線性越嚴(yán)重,一般大于10時(shí),存在嚴(yán)重的多重共線性。