poisson分布檢驗(yàn)案例分析
一、Poisson分布
你是否關(guān)注過(guò)在一個(gè)小時(shí)內(nèi)達(dá)到某餐廳的顧客數(shù)量,某商品在一天內(nèi)的銷售量?在這兩個(gè)例子中,事件發(fā)生的次數(shù)是離散的整數(shù),并且可以用平均發(fā)生的次數(shù)描述給定時(shí)間段內(nèi)的頻率,該問題就是Poisson分布,Poisson分布是一種常用的離散型概率分布,是由二項(xiàng)分布的漸進(jìn)公式提出,而后人們對(duì)此進(jìn)行深入研究,發(fā)現(xiàn)實(shí)際生活中很多現(xiàn)象都服從Poisson分布,比如某醫(yī)院每周接收到的急診患者數(shù)量、顯微鏡下某單位方格內(nèi)細(xì)胞數(shù)等等。
一般而言,變量X的取值為非負(fù)整數(shù),即0,1,2,…,其相應(yīng)取值的概率為:
稱X服從于lambda為參數(shù)的Poisson分布,記為X{sim}Pleft(lambda
ight),其中l(wèi)ambda是大于0的常數(shù),稱為Poisson分布的參數(shù),e為自然對(duì)數(shù)的底,e約為2.7183。
二、Poisson分布特征
Poisson分布的特征一般有離散性、獨(dú)立性、普通性、平穩(wěn)性以及均值和方差相等。
Poisson分布的圖形特征:若X服從參數(shù)為lambda的Poisson分布,以X的取值為橫軸,相應(yīng)的概率P(X)為縱軸,一般隨著lambda的增大,Poisson分布的對(duì)稱性越來(lái)越好。
三、Poisson分布檢驗(yàn)
(一) 檢驗(yàn)步驟
Poisson分布檢驗(yàn)步驟如下:
1建立假設(shè)
一般先進(jìn)行建立一個(gè)原假設(shè)和一個(gè)備擇假設(shè),原假設(shè)一般數(shù)據(jù)符合泊松分布,備擇假設(shè)是數(shù)據(jù)不符合泊松分布。
2計(jì)算期望值
根據(jù)數(shù)據(jù)樣本計(jì)算出時(shí)間時(shí)間發(fā)生的平均次數(shù),即期望值。
3分組計(jì)數(shù)
將數(shù)據(jù)按照時(shí)間發(fā)生的次數(shù)進(jìn)行分組,并統(tǒng)計(jì)每個(gè)分組中的觀察頻數(shù)。
4計(jì)算理論頻數(shù)
使用泊松分布的概率質(zhì)量函數(shù),根據(jù)期望值lambda和分組中的事件次數(shù),計(jì)算出每個(gè)分組的理論頻數(shù)。
5進(jìn)行假設(shè)檢驗(yàn)
使用適當(dāng)?shù)慕y(tǒng)計(jì)檢驗(yàn)方法,比如卡方檢驗(yàn)等,計(jì)算觀察頻數(shù)與理論頻數(shù)之間的差異程度。
6判斷結(jié)果
根據(jù)計(jì)算得到的統(tǒng)計(jì)檢驗(yàn)值和顯著性水平,判斷是否拒絕原假設(shè),從而判斷是否符合泊松分布。
(二) 案例計(jì)算
1.Poisson分布計(jì)算概率
根據(jù)某醫(yī)院外科接診的情況長(zhǎng)期觀察,發(fā)現(xiàn)頸椎問題的患者站接診患者總數(shù)的2.0%,已知該科室某日接診100人,試計(jì)算其中有5位患者出現(xiàn)頸椎問題的概率。
設(shè)X表示“100個(gè)人中出現(xiàn)頸椎問題的人數(shù)”,X服從Poisson分布,由題可知,n=100,pi=0.01,lambda=npi=100*0.02=2;
2.
Poisson分布檢驗(yàn)
某研究人員觀察某醫(yī)院每天急診患者數(shù)量,總共觀察50天,所以共有50個(gè)樣本數(shù)據(jù),最終針對(duì)50個(gè)數(shù)據(jù)進(jìn)行匯總?cè)缦卤?,一列表示該天醫(yī)院患者數(shù)量,一列表示有幾天出現(xiàn)這樣的情況,數(shù)據(jù)格式如下:
分析路徑:
SPSSAU【實(shí)驗(yàn)醫(yī)學(xué)/研究】→Poisson檢驗(yàn),
分析結(jié)果如下:
從模型可以看出卡方值為55.729,根據(jù)p值小于0.01(**表示顯著性水平為0.01)的顯著性水平,拒絕原假設(shè)說(shuō)明數(shù)據(jù)不符合泊松分布的假設(shè)。其中卡方統(tǒng)計(jì)量的計(jì)算如下:
chi^{2}=sumrac{(A-E)^{2}}{E}=sum_{i=1}^{k}rac{(A_{i}-E_{i})^{2}}{E_{i}}=sum_{i=1}^{k}rac{(A_{i}-np_{i})^{2}}{np_{i}}(mathrm{i}=1,2,3,ldots,mathrm{k})
并且從柱狀圖也可以直觀查看到:
四、知識(shí)小貼士
1、Poisson分布數(shù)據(jù)
Poisson分布數(shù)據(jù)一定是指每單位內(nèi)的發(fā)生頻數(shù),比如某個(gè)路口每天闖紅燈的汽車數(shù)量;一年內(nèi)每萬(wàn)人中丟手機(jī)的頻數(shù)等;
2、檢驗(yàn)方式
Poisson檢驗(yàn)共有兩種檢驗(yàn)方式,一種是通過(guò)特征判斷;另外一種是通過(guò)Poisson檢驗(yàn)。在現(xiàn)實(shí)研究中,可能更多會(huì)通過(guò)特征進(jìn)行判斷是否基本符合Poisson分布。
參考文獻(xiàn):
[1]孫振球.醫(yī)學(xué)統(tǒng)計(jì)學(xué).第3版[M].人民衛(wèi)生出版社,2010.