poisson回歸分析案例研究
一、案例介紹
某研究者為檢驗(yàn)?zāi)骋睙拸S的砷暴露與因呼吸道疾病死亡之間的關(guān)系,對(duì)該廠1978-2009年的職工進(jìn)行了回顧性隊(duì)列研究,請(qǐng)對(duì)資料進(jìn)行分析。
二、問(wèn)題分析
本案例的分析目的為是否砷暴露與呼吸道疾病死亡之間的關(guān)系,了解單位時(shí)間、單位面積或者空空間內(nèi)某時(shí)間發(fā)生數(shù)的影響因素,可以考慮使用Poisson回歸,并且‘是否砷暴露’這個(gè)數(shù)據(jù)滿足平穩(wěn)性、獨(dú)立性和普通性這三個(gè)特征,因而可以使用Poisson回歸進(jìn)行研究。
三、軟件操作及結(jié)果解讀
(一) 數(shù)據(jù)導(dǎo)入
1.數(shù)據(jù)格式
首先將數(shù)據(jù)整理成正確的格式,一般一個(gè)X為一列,Y為一例,并且分析的數(shù)據(jù)帶有數(shù)據(jù)標(biāo)簽的,需要另添加一個(gè)表格進(jìn)行說(shuō)明,數(shù)據(jù)格式如下
2.導(dǎo)入數(shù)據(jù)
將整理好的數(shù)據(jù)上傳至SPSSAU系統(tǒng)內(nèi),如下:
上傳的數(shù)據(jù)如下:
(二) 適用條件判斷
1.軟件操作
Poisson回歸分析路徑為點(diǎn)擊【實(shí)驗(yàn)/醫(yī)學(xué)研究】→【poisson回歸】然后進(jìn)行分析:
2. 結(jié)果解讀
分析Poisson回歸模型似然比檢驗(yàn)結(jié)果的目的主要是檢驗(yàn)整體模型的有效性,首先對(duì)p值進(jìn)行分析,如果該值小于0.05,則說(shuō)明模型有效;反之則說(shuō)明模型無(wú)效,AIC和BIC值用于多次分析時(shí)的對(duì)比;此兩值越低越好;如果多次進(jìn)行分析,可對(duì)比此兩個(gè)值的變化情況,綜合說(shuō)明模型構(gòu)建的優(yōu)化過(guò)程,如果不進(jìn)行多次分析對(duì)比,則無(wú)需關(guān)注此指標(biāo)。從分析結(jié)果來(lái)看,p值小于0.05,因而說(shuō)明拒絕原定假設(shè),即說(shuō)明本次構(gòu)建模型時(shí),放入的自變量具有有效性,本次模型構(gòu)建有意義。其中AIC、BIC的計(jì)算如下:
AIC=-2ln(L)+2k;BIC=-2ln(L)+ln(n)*k;
其中 : L是該模型下的最大似然,n是數(shù)據(jù)數(shù)量,k是模型的變量個(gè)數(shù)。
然后查看poisson回歸分析結(jié)果:
然后進(jìn)行查看數(shù)據(jù)是否滿足等離散檢驗(yàn):
o檢驗(yàn)用于檢測(cè)數(shù)據(jù)是否等離散。如果O值絕對(duì)值大于1.96(此時(shí)p?值小于0.05),則說(shuō)明數(shù)據(jù)過(guò)離散,此時(shí)可考慮使用負(fù)二項(xiàng)回歸進(jìn)行研究。如果o值絕對(duì)值小于1.96 (此時(shí)p?值大于0.05),則說(shuō)明數(shù)據(jù)等離散,此時(shí)數(shù)據(jù)適合使用Poisson回歸,發(fā)現(xiàn)o檢驗(yàn)的o值為19.402>1.96,p值小于0.05,說(shuō)明數(shù)據(jù)過(guò)離散,此時(shí)可考慮使用負(fù)二項(xiàng)回歸進(jìn)行研究。負(fù)二項(xiàng)回歸的結(jié)果如下:
從上表可知,以死亡數(shù)作為因變量,有砷暴露為自變量,進(jìn)行負(fù)二項(xiàng)回歸分析,從上表可以看出,模型公式為:Log(Y)=-5.919 + 0.597*砷暴露_有砷暴露 + ln(觀察人年數(shù))。但是砷暴露_有砷暴露的回歸系數(shù)值為0.597,p值大于0.05,但是并沒(méi)有呈現(xiàn)出顯著性,說(shuō)明有無(wú)砷暴露不會(huì)影響死亡數(shù)。
四、結(jié)論
想要某冶煉廠的砷暴露與因呼吸道疾病死亡之間的關(guān)系,使用SPSSAU進(jìn)行poisson回歸分析,通過(guò)模型似然比檢驗(yàn),但是數(shù)據(jù)過(guò)離散,沒(méi)有通過(guò)O檢驗(yàn),所以進(jìn)行負(fù)二項(xiàng)回歸,進(jìn)行負(fù)二項(xiàng)回歸后,發(fā)現(xiàn)模型不顯著,有無(wú)砷暴露不會(huì)影響死亡數(shù)。
五、知識(shí)小貼士
1、SPSSAU的Poisson回歸時(shí)基數(shù)是什么意思?
泊松回歸中基數(shù)是基于某個(gè)數(shù)字的意思,比如有30個(gè)省每年癌癥患者人數(shù),但是癌癥患者人數(shù)是基于某省所有人數(shù)時(shí)才有對(duì)比意義。
2、泊松檢驗(yàn)沒(méi)有輸出結(jié)果?
SPSSAU中,如果‘發(fā)生次數(shù)’>100則不輸出該項(xiàng)的分析結(jié)果。默認(rèn)情況下泊松分布數(shù)據(jù)具有發(fā)生次數(shù)很低但會(huì)穩(wěn)定發(fā)生等特點(diǎn),如果平均的發(fā)生次數(shù)即lambda值大于20,此時(shí)數(shù)據(jù)不應(yīng)該是泊檢分布數(shù)據(jù),而應(yīng)該考慮其正態(tài)性特質(zhì)。
參考文獻(xiàn):
[1]孫振球.醫(yī)學(xué)統(tǒng)計(jì)學(xué).第3版[M].人民衛(wèi)生出版社,2010.