zeronbreg
SPSSAU-在線SPSS分析軟件
零膨脹負(fù)二項(xiàng)回歸分析
計(jì)數(shù)研究模型中,常用泊松回歸模型,但泊松回歸模型理論上是要求平均值與標(biāo)準(zhǔn)差相等,如果不滿足,則可使用負(fù)二項(xiàng)回歸模型,負(fù)二項(xiàng)回歸放寬了平均值=標(biāo)準(zhǔn)差這一理論假定。
在實(shí)際研究中,會(huì)出現(xiàn)一種情況即因變量為計(jì)數(shù)變量,并且該變量包括非常多的數(shù)字0,當(dāng)出現(xiàn)此種情況下,此時(shí)可考慮使用零膨脹負(fù)二項(xiàng)回歸模型。零膨脹模型的特點(diǎn)是將模型分為兩階段進(jìn)行(即設(shè)置為混合分布模型),第1階段(零膨脹階段)為計(jì)數(shù)變量是否為0的擬合,SPSSAU默認(rèn)使用二元logit模型進(jìn)行擬合,第2階段為負(fù)二項(xiàng)分布模型擬合。
零膨脹負(fù)二項(xiàng)回歸模型分為兩個(gè)階段,第1階段即零膨脹階段可擬合因變量是否為0,此階段中可放入一些自變量X用于擬合因變量是否取數(shù)字0的模型,當(dāng)然也可不放入;第2階段放入的自變量X為真實(shí)研究的變量項(xiàng)。
零膨脹泊松回歸案例
1 背景
當(dāng)前有一份關(guān)于美國犯罪率的研究,數(shù)據(jù)包括被捕次數(shù),該變量為計(jì)數(shù)變量,并且包括大量的數(shù)字0(即被捕次數(shù)為0),除此之外,包括另外5個(gè)自變量,分別是‘有前科比例’、‘平均判邢月數(shù)’、‘18歲以來入獄月數(shù)’、‘1986年合法收’和‘是否黑人’,其中是否黑人這項(xiàng),使用數(shù)字1表示黑人,數(shù)字0表示不是黑人。部分?jǐn)?shù)據(jù)截圖如下:
2 理論
零膨脹負(fù)二項(xiàng)回歸模型研究X對(duì)于Y的影響,且Y為計(jì)數(shù)變量且Y包括較多的數(shù)字0。除此之外,零膨脹負(fù)二項(xiàng)回歸模型分為兩個(gè)階段,第1階段為判斷Y是否為0的二元logit模型,第1階段中可包括影響Y是否為數(shù)字0的影響因素X,當(dāng)然也可沒有(如果沒有此為常數(shù));第2階段為真實(shí)的研究模型。
3 操作
本例子中研究被捕次數(shù)的影響因素,其中影響因素包括‘有前科比例’、‘平均判邢月數(shù)’、‘18歲以來入獄月數(shù)’、‘1986年合法收’和‘是否黑人’,操作截圖如下。
本案例時(shí)第1階段零膨脹模型并不包括任何影響因素,因而‘零膨脹項(xiàng)X【可選】’框留空,不放入分析項(xiàng)。與此同時(shí),本案例數(shù)據(jù)為原始數(shù)據(jù)并非帶‘基數(shù)Exposure’格式數(shù)據(jù),因而基數(shù)項(xiàng)框留空。
4 SPSSAU輸出結(jié)果
零膨脹泊松回歸模型一共輸出4個(gè)表格,說明如下:
5文字分析
上表格展示‘被捕次數(shù)’的數(shù)字0分布情況,從上表格可以看到,共計(jì)2725個(gè)樣本中有72.29%為數(shù)字0,因而意味著應(yīng)該使用零膨脹模型較為適合。
從上表格可以看到:模型通過似然比檢驗(yàn)(χ =216.015, p =0.000<0.05),即意味著模型構(gòu)建有意義。除此之外,上表格展示出AIC值和BIC值,如果需要進(jìn)行模型對(duì)比選優(yōu),可使用該兩個(gè)指標(biāo),該兩個(gè)指標(biāo)值越小越好。
特別提示:
如果需要對(duì)比選擇零膨脹泊松回歸和零膨脹負(fù)二項(xiàng)回歸模型,直接對(duì)比AIC或BIC值選擇較小時(shí)對(duì)應(yīng)的模型即可。
與此同時(shí),當(dāng)前案例直接進(jìn)行零膨脹泊松回歸時(shí),會(huì)發(fā)現(xiàn)AIC值/BIC值非常接近,而且下述的回歸分析表格數(shù)字和結(jié)論基本一致。
上表格展示出零膨脹泊松回歸結(jié)果,首先零膨脹模型中僅列出常數(shù)值,因?yàn)楸景咐辛闩蛎浤P筒]有設(shè)置影響‘被捕次數(shù)’是否為0的影響因素項(xiàng)。
從上表格可以看到:有前科比例呈現(xiàn)出0.01水平的顯著性,回歸系數(shù)值為-0.479,即意味著有前科比例越高時(shí),被捕次數(shù)反倒越少。與此同時(shí),合法收入也呈現(xiàn)出0.01水平的顯著性,該項(xiàng)回歸系數(shù)為-0.009<0,即意味著合法收越高的群體,其被捕次數(shù)越低。是否黑人這項(xiàng)的回歸系數(shù)為0.498并且呈現(xiàn)出0.01水平的顯著性,即說明相對(duì)來講,黑人群體被捕次數(shù)明顯會(huì)更高。與此同時(shí),平均判刑月數(shù)、18歲以來入獄月數(shù)這兩項(xiàng)對(duì)于被捕次數(shù)并沒有影響關(guān)系,p值均大于0.05。
SPSSAU針對(duì)模型回歸系數(shù)進(jìn)行簡(jiǎn)化格式展示,如上表格所示。
6 剖析
零膨脹負(fù)二項(xiàng)回歸分析涉及以下幾個(gè)關(guān)鍵點(diǎn),分別如下:
首先需確保因變量包括較多的數(shù)字0,如果不是這樣,此時(shí)應(yīng)使用普通的負(fù)二項(xiàng)回歸模型即可;
如果需要在零膨脹泊松回歸模型或者零膨脹負(fù)二項(xiàng)回歸模型之間進(jìn)行取值,建議結(jié)合AIC或BIC信息準(zhǔn)則越小越好原理進(jìn)行決擇即可。
零膨脹模型時(shí)共有兩個(gè)階段,第1階段為零膨脹模型即研究因變量是否為0的模型,該模型中也可放入影響因素X,不放入時(shí)則該模型中僅有常數(shù);第2階段模型為真實(shí)研究和關(guān)注的模型。