線性回歸分析與SPSS實(shí)例分析其二:基于SPSS的應(yīng)用實(shí)例與分析
多元回歸的應(yīng)用實(shí)例:
我們所要研究的問題:
試研究C、Si、Mn、P、S、Al、Ni、Cr、Cu、Mo、As11中元素對(duì)鋼鐵抗拉性能的影響。
一下為實(shí)例部分的數(shù)據(jù)圖片以及數(shù)據(jù)的結(jié)構(gòu):


簡易的傻瓜式操作步驟:
1.首先我們點(diǎn)擊分析->回歸->線性:

2.確定回歸模型中的因變量,與其對(duì)應(yīng)的自變量,并選用逐步法。同時(shí)我們前往繪制、選項(xiàng)處觀察并修改或開啟相關(guān)參數(shù)和功能。

3.在“繪制”處的功能及參數(shù),我們填入圖示參數(shù),選擇標(biāo)準(zhǔn)化殘差圖的直方圖和正態(tài)概率圖。

觀察選項(xiàng)中的F概率。

簡單分析:
首先我看看因變量與各個(gè)自變量的相關(guān)性大小。
由圖顯示,我們可以去掉除C,Si,Cr以外的其他變量,可以看做其他自變量與因變量不存在相關(guān)性。

由模型匯總和ANOVA圖(方差分析),可以觀察到R方值(調(diào)整R方:擬合優(yōu)度0.474)最接近1,且對(duì)其標(biāo)準(zhǔn)估計(jì)得誤差最小(29.819)的是模型三故選擇第三種模型作為回歸模型。
其因變量:抗拉 自變量:C,Si,Cr

對(duì)方差分析圖我門可以看到回歸、殘差與總計(jì)的平方和。
F統(tǒng)計(jì)量 = 47.518 Sig.(顯著性)為0.00,所以可以拒絕原假設(shè):?,可以認(rèn)為自變量與因變量之間有顯著的線性關(guān)系。
方差分析圖(ANOVA):df(自由度) ,sig.表示顯著性水平(significance),?F(F統(tǒng)計(jì)量),均方即均方誤差

到這一步,確定了模型,我們看看每個(gè)相關(guān)自變量的回歸系數(shù):
由此圖我們可以確定回歸方程:?Y代表抗拉性能水平,而X1,X2,X3分別代表C、Si和Cr元素
? (這是非標(biāo)準(zhǔn)化系數(shù)的回歸方程)
在非標(biāo)準(zhǔn)化系數(shù)回歸方程反映的一般是絕對(duì)作用量,但不能直接得出誰對(duì)因變量的影響最大,因?yàn)椴煌淖宰兞恐g可能存在單位、量綱不同等差異,是不夠直接比較的,而系數(shù)標(biāo)準(zhǔn)化后則可以直接進(jìn)行比較。
如果對(duì)系數(shù)進(jìn)行標(biāo)準(zhǔn)化操作,對(duì)于標(biāo)準(zhǔn)化回歸系數(shù),是對(duì)自變量和因變量同時(shí)進(jìn)行標(biāo)準(zhǔn)化處理后所得到的回歸系數(shù),這樣操作之后可以消除不同量綱,不同數(shù)量級(jí)等影響,使得兩個(gè)不同變量之間的相互比較變得更有可比性
觀察系數(shù)圖的標(biāo)準(zhǔn)系數(shù)那列數(shù)據(jù)可以得到回歸系數(shù)標(biāo)準(zhǔn)化后的回歸方程:
?(系數(shù)標(biāo)準(zhǔn)化后的回歸方程更能看出意義)
由上述方程我們可以直觀地看出,C元素對(duì)鋼鐵抗拉性能水平的影響最大。各元素對(duì)抗拉性能影響水平可以排列為 C > Si > Cr 。

以下是殘差相關(guān)圖表:
關(guān)于預(yù)測值/估計(jì)值,與殘差的相關(guān)統(tǒng)計(jì)量。

殘差標(biāo)準(zhǔn)化后,由直方圖可以發(fā)現(xiàn)其分布與標(biāo)準(zhǔn)正態(tài)分布十分接近

該圖為P-P圖,可以直觀發(fā)現(xiàn)其圖像與直線相近,可以說明標(biāo)準(zhǔn)化殘差與標(biāo)準(zhǔn)正態(tài)分布契合度較高。
(P-P圖是根據(jù)變量的累積比例與指定分布的累積比例之間的關(guān)系所繪制的圖形。通過P-P圖可以檢驗(yàn)數(shù)據(jù)是否符合指定的分布。當(dāng)數(shù)據(jù)符合指定分布時(shí),P-P圖中各點(diǎn)近似呈一條直線。
如果在繪制中P-P圖中各點(diǎn)不呈直線,但有一定規(guī)律,可以對(duì)變量數(shù)據(jù)進(jìn)行轉(zhuǎn)換,使轉(zhuǎn)換后的數(shù)據(jù)更接近指定分布。)

該散點(diǎn)圖表明,不同抗拉水平所對(duì)應(yīng)的標(biāo)準(zhǔn)化殘差大部分落入[-2,2]區(qū)間內(nèi),只有各別異常值(大約4~5個(gè))不落入該區(qū)間,可以說明,標(biāo)準(zhǔn)化殘差在[-2,2]區(qū)間內(nèi)隨機(jī)波動(dòng)

以上是基于SPSS的多元線性回歸以及簡單分析。