關(guān)于回歸分析你知道多少?
回歸分析應(yīng)用廣泛,既可以建立輸出模型、預(yù)測(cè)趨勢(shì),又可以用來探索影響因素,同時(shí)又是最基礎(chǔ)、最常見的數(shù)據(jù)分析方法。要說一定要學(xué)會(huì)一種分析方法,那回歸分析無疑在首推名單之列,因此本文就來講一講回歸分析。
分類
回歸分析是用于研究變量間的影響關(guān)系情況,實(shí)質(zhì)上就是研究X對(duì)Y的影響關(guān)系情況。在線性回歸分析中,根據(jù)回歸模型中X的個(gè)數(shù),可將其分為一元線性回歸和多元線性回歸。
按照Y的多少,又可分為簡(jiǎn)單回歸分析和多重回歸分析。
按照X和Y之間的關(guān)系類型,可分為線性回歸分析和非線性回歸分析。
當(dāng)然這些分類不能完全概括回歸分析的類型,在《19種回歸分析你知道幾種呢?》一文中SPSSAU已經(jīng)為大家詳細(xì)的介紹過回歸分析的各種分類,以及每種回歸分析的用途,這里就不再贅述了。
分析步驟
了解了回歸分析的分類之后,我們?cè)僖跃€性回歸為例,說一說一般做回歸分析的步驟,具體步驟如下:
第一步:首先確定X、Y。
由于回歸分析是要分析一個(gè)變量如何隨其他變量的變化而變化,因此第一步應(yīng)該確定哪些變量是X(解釋變量),哪些是Y(被解釋變量),通常X為定量數(shù)據(jù),Y定量數(shù)據(jù)。將對(duì)于的題目拖拽到右側(cè),點(diǎn)擊開始分析,即可生成結(jié)果。

注意:回歸分析之前,可使用SPSSAU提供的箱盒圖查看是否有異常數(shù)據(jù),或使用散點(diǎn)圖直觀展示X和Y之間的關(guān)聯(lián)關(guān)系。

第二步:對(duì)模型情況進(jìn)行分析

包括模型擬合情況(比如R平方為0.3,則說明所有X可以解釋Y 30%的變化原因),模型共線性問題(VIF值小于5則說明無多重共線性),是否通過F檢驗(yàn)(F檢驗(yàn)用于判定是否X中至少有一個(gè)對(duì)Y產(chǎn)生影響,如果呈現(xiàn)出顯著性,則說明所有X中至少一個(gè)會(huì)對(duì)Y產(chǎn)生影響關(guān)系)。
第三步:分析X的顯著性
如果顯著(p值判斷),則說明具有影響關(guān)系,反之無影響關(guān)系。
第四步:判斷X對(duì)Y的影響關(guān)系方向
回歸系數(shù)B值大于0說明正向影響,反之負(fù)向影響。
第五步:其它
比如對(duì)比影響程度大小(回歸系數(shù)B值大小對(duì)比X對(duì)Y的影響程度大小)。
回歸分析之后,可使用正態(tài)圖觀察和展示保存的殘差值正態(tài)性情況;或使用散點(diǎn)圖觀察和展示回歸模型異方差情況【殘差與X間的散點(diǎn)完全沒有關(guān)系則無異方差】。

上圖是回歸分析保存的殘差值與自變量作散點(diǎn)圖,用于檢測(cè)異方差性,可以看出,數(shù)據(jù)基本上沒有規(guī)律可循,X變化時(shí),Y并不會(huì)變大或者變小,因而說明無關(guān)聯(lián)性,也即說明沒有異方差性。
具體案例
背景:研究“淘寶客服服務(wù)態(tài)度”,“淘寶商家服務(wù)質(zhì)量”分別與“淘寶忠誠度”之間的關(guān)系情況,此句話中明顯的可以看出“淘寶客服服務(wù)態(tài)度”,“淘寶商家服務(wù)質(zhì)量”這兩項(xiàng)為?X;而“淘寶忠誠度”為?Y。
1、確定X,Y。

如果有特別要求,希望保存殘差值和預(yù)測(cè)值,則可將“保存殘差和預(yù)測(cè)值”這項(xiàng)打勾即可,通常情況并不需要。
2、SPSSAU輸出結(jié)果


其他說明
在實(shí)際分析中很可能會(huì)出現(xiàn)一些奇怪的現(xiàn)象,比如:有回歸影響關(guān)系,但是卻沒有相關(guān)關(guān)系;或者負(fù)向影響關(guān)系,但卻是正向相關(guān)關(guān)系。這種情況要怎么辦呢?
從分析的角度看,相關(guān)分析是研究有沒有關(guān)系,回歸分析是研究影響關(guān)系。明顯地,相關(guān)分析是基礎(chǔ),然后再進(jìn)行回歸分析。首先需要知道有沒有相關(guān)關(guān)系;有了相關(guān)關(guān)系,才可能有回歸影響關(guān)系;因而應(yīng)該先進(jìn)行相關(guān)分析,完成相關(guān)分析后,確認(rèn)有了相關(guān)分析,再進(jìn)行回歸分析。
在相關(guān)性分析時(shí),結(jié)果是兩個(gè)變量之間的關(guān)系,其他變量的影響是不被考慮的;但是,進(jìn)行回歸分析時(shí),如果入選的變量不止一個(gè),那么入選變量之間可以產(chǎn)生影響。因此,普通相關(guān)與回歸之中的回歸系數(shù)會(huì)有比較大的差別。
如果有回歸影響關(guān)系,沒有相關(guān)關(guān)系【此時(shí)建議以‘沒有相關(guān)關(guān)系作為結(jié)論’】
有負(fù)向影響關(guān)系,正向相關(guān)關(guān)系【此時(shí)建議以‘有相關(guān)關(guān)系但沒有回歸影響關(guān)系作為結(jié)論’】