有意思的概率與統(tǒng)計(jì)(九)
好了!進(jìn)入到又一個(gè)重點(diǎn)了!
在介紹完基本的隨機(jī)變量特征和性質(zhì)之后,我們就要開始了解一些重要的分布了。這些分布基本涵蓋了我們?nèi)粘7治龈鞣N問題時(shí)所能面臨的各種情況。因此,仔細(xì)學(xué)習(xí)和了解這些重要的分布十分必要的。
希望大家好好理解喲~
Chapter? Two? 隨機(jī)變量及其分布
2.4? 常用離散分布
我們先從離散分布入手,介紹一些基本的隨機(jī)變量分布~
首先是——二項(xiàng)分布。
我們?cè)谥袑W(xué)階段已經(jīng)了解過二項(xiàng)分布的基本概念和特征,其與獨(dú)立隨機(jī)試驗(yàn)有所關(guān)聯(lián)。
我們來考慮這樣一個(gè)例子:
例1:某特效藥的臨床有效率為p,今有n人服用,求治愈人數(shù)X的分布列。
對(duì)于這10個(gè)服用特效藥的人而言,彼此之間是否治愈是相互獨(dú)立的,并不會(huì)因?yàn)槠渲心骋粋€(gè)人治愈與否就會(huì)影響其他人的治愈結(jié)果。因此,這是一個(gè)獨(dú)立重復(fù)試驗(yàn)。
基于此,我們很容易就給出X的分布列為:
其中,組合數(shù)的含義是在n個(gè)人中選擇出k個(gè)人被治愈,剩余的n-k個(gè)人未被治愈。
如果X是n重Bernoulli試驗(yàn)中某事件A成功的次數(shù),那么我們稱X的概率分布滿為二項(xiàng)分布,記作。其概率分布列滿足上式。
利用二項(xiàng)式定理,我們不難證明:
想要充分了解一個(gè)分布,我們接下來就要研究它的數(shù)字特征。首先是數(shù)學(xué)期望。按照定義,由于隨機(jī)變量X的取值非負(fù),因此我們只需直接計(jì)算下式即可:
方差的計(jì)算有兩種方式,一種是直接利用定義,另一種是利用公式:
我們采用這種方法。通過直接計(jì)算得到:
這就是二項(xiàng)分布的方差的公式。

我們接下來介紹另一種非常重要的離散型隨機(jī)變量的分布——Poisson分布。它在很多放射性物質(zhì)衰變過程中有所應(yīng)用。
Poisson分布的分布列為:
其中,參數(shù)λ>0。如果隨機(jī)變量X服從Poisson分布,那么我們記做。
利用函數(shù)項(xiàng)級(jí)數(shù)的知識(shí),我們很容易驗(yàn)證得到:
對(duì)于Poisson分布,我們也是要研究它的數(shù)學(xué)期望和方差。對(duì)于數(shù)學(xué)期望,我們直接計(jì)算,能夠得到:
而方差則為:
這說明,對(duì)于Poisson分布而言,數(shù)學(xué)期望和方差的表達(dá)式是一致的。

對(duì)于二項(xiàng)分布,我們通過一個(gè)例子已經(jīng)直觀地感受到了它的應(yīng)用情形,但是對(duì)于Poisson分布而言,我們并沒有介紹其相關(guān)的應(yīng)用。所以,為了讓大家見識(shí)一下Poisson分布的重要作用,接下來,我們來看一看有關(guān)Poisson分布的一個(gè)非常重要的結(jié)果——Poisson定理。
我們先說明,Poisson定理是聯(lián)系二項(xiàng)分布與Poisson分布的非常重要的結(jié)果。有了Poisson定理之后,很多二項(xiàng)分布的計(jì)算都可以用Poisson分布來計(jì)算。這樣就會(huì)大大簡化計(jì)算的復(fù)雜度與難度。
我們先來看組合數(shù)的極限,即:
利用Stirling公式,我們很容易就得到:
對(duì)于二項(xiàng)分布而言,設(shè)一次試驗(yàn)中某事件發(fā)生的概率為(與試驗(yàn)次數(shù)n相關(guān))。當(dāng)n一定時(shí)該事件發(fā)生的概率也一定。如果
滿足:
(λ是Poisson分布的特征參數(shù)。)
那么,我們就有:
于是,我們將這兩個(gè)結(jié)果組合到一起,就得到了:
這說明,在n重Bernoulli試驗(yàn)當(dāng)中,若:
(1)n足夠大;
(2);
(更進(jìn)一步,可以是)
則可以用Poisson分布來近似代替二項(xiàng)分布去計(jì)算各種概率統(tǒng)計(jì)量。(包括概率,數(shù)學(xué)期望和方差。)
一種最為常見的應(yīng)用環(huán)境是,當(dāng)n足夠大,而p足夠小,且np大小適中。(不會(huì)是一個(gè)特別大的數(shù),否則會(huì)被視為無窮大;也不會(huì)特別小,否則Poisson分布無意義。)這時(shí),基于Poisson定理,我們就可以使用Poisson分布的結(jié)論近似計(jì)算二項(xiàng)分布的結(jié)果。
當(dāng)然,事實(shí)上,使用最多的還是用于計(jì)算概率。畢竟,就算不使用Poisson定理,我們也很容易能夠在定理的條件下得到:
因此,數(shù)學(xué)期望和方差的近似計(jì)算是很顯然的,不必一定要以Poisson定理為依據(jù)。

接下來,我們要介紹一下一個(gè)也已經(jīng)在中學(xué)階段就接觸過的分布——超幾何分布。
我們以一個(gè)基本的例子來引入。
例2:我們?cè)诟怕实拇_定方法那一節(jié)介紹過很多的基本模型。其中十分經(jīng)典的一個(gè)古典概型,就是抽樣模型。我們?cè)诋?dāng)時(shí)的不放回抽樣模型的例子當(dāng)中已經(jīng)給出了事件A=“取出的球中有m個(gè)紅球”的概率:
我們現(xiàn)在定義隨機(jī)變量X取出的紅球的數(shù)目,那么就有分布列:
利用專欄(二)的思考1.(3)的結(jié)論,我們直接得到:
于是我們就得到:
我們稱該分布為超幾何分布,記為。
對(duì)于超幾何分布,直接計(jì)算數(shù)學(xué)期望得到:
這個(gè)結(jié)果可以理解為,在N個(gè)球中抽出紅球的均值等于一次取出的球數(shù)n與紅球在球堆中分布的比例(也可以是在盒子里抽出一個(gè)紅球的概率)的乘積。
考慮到這樣的意義,我們很容易將其與二項(xiàng)分布再度聯(lián)系起來。事實(shí)上,如果N足夠大,大到抽出n個(gè)球?qū)Ρ戎礛/N幾乎無影響(或者是n相較于N足夠?。?,這時(shí)我們就可以將比值視為常數(shù)p,則超幾何分布就近似為二項(xiàng)分布。
超幾何分布的方差公式留給大家自行推導(dǎo)~

最后,我們來介紹一下幾何分布。
幾何分布在實(shí)際應(yīng)用當(dāng)中出現(xiàn)的也比較多。設(shè)若在某Bernoulli試驗(yàn)中,某一事件A在每次試驗(yàn)中發(fā)生的概率恒定為p。現(xiàn)在不斷重復(fù)該實(shí)驗(yàn),直到事件A發(fā)生。我們定義隨機(jī)變量X為實(shí)驗(yàn)進(jìn)行的次數(shù)n,那么對(duì)于X而言,其分布列就應(yīng)該是:
此時(shí),我們稱X服從幾何分布,記作。
最簡單地,我們可以讓試驗(yàn)為“射擊手射擊靶子”,讓事件A為“射擊手射擊第X次首次射中靶子”。這樣,我們就很好理解幾何分布的意義了。
直接計(jì)算,我們能得到:
這說明幾何分布滿足最基本的必要條件,確實(shí)可能作為一個(gè)分布出現(xiàn)。
對(duì)于幾何分布,我們有一些初等的方法去求它的數(shù)學(xué)期望和方差,在這里將給大家介紹這些方法,至于非初等的方法(利用級(jí)數(shù)理論等),大家可以自由探索~
幾何分布的數(shù)學(xué)期望如下:
我們記:
于是,利用等差比數(shù)列的規(guī)律(這是中學(xué)階段的一種題型來著?),我們能夠計(jì)算出:
于是,我們得到了:
至于方差,類似地,我們也可以算出:
記:
類似于剛才的做法,我們得到:
同理,有:
幾何分布另一個(gè)令人驚奇的性質(zhì)是它的無記憶性,即:
這一點(diǎn)的證明是十分簡單的,直接利用條件概率的定義即可。但是,這一特點(diǎn)的意義卻是是扥鮮明的,它表明,無論前面發(fā)生了多少次試驗(yàn),只要事件A未發(fā)生,那么之后事件A再經(jīng)過n次試驗(yàn)才首次發(fā)生的概率與前面的試驗(yàn)無關(guān)。這就是幾何分布的無記憶性。

作為拓展,我們來介紹負(fù)二項(xiàng)分布,它是基于二項(xiàng)分布的一種分布形式。
我們說,幾何分布是描述某一事件首次發(fā)生的試驗(yàn)次數(shù)的隨機(jī)變量的分布。那么,如果我們想要研究某一事件發(fā)生了第k次時(shí)的試驗(yàn)次數(shù)X,又當(dāng)如何考慮呢?
在Bernoulli試驗(yàn)中,我們?nèi)匀挥洿芯康氖录嗀的概率為p不變。那么,考慮到我們要研究的情形,如果試驗(yàn)進(jìn)行了到第m次時(shí),事件A第k次發(fā)生(m≥k),那么這個(gè)模型此時(shí)等價(jià)于:
(1)前m-1次試驗(yàn)一共發(fā)生了k-1次事件A;
(2)第m次發(fā)生了事件A;
這樣,我們就能夠很容易地得到隨機(jī)變量X的分布列為:
中括號(hào)中的項(xiàng)是一個(gè)二項(xiàng)分布的概率表達(dá),代表我們考慮了(1);中括號(hào)外的p代表我們考慮到(2)。
直接計(jì)算,我們可以發(fā)現(xiàn):
最后的結(jié)果我們暫時(shí)擱置,在后續(xù)的討論當(dāng)中我們很快就能給出答案。
由于這一分布涉及到了二項(xiàng)分布的應(yīng)用,因此稱其為負(fù)二項(xiàng)分布也不難理解。有些時(shí)候,我們也稱隨機(jī)變量X服從Pascal分布。為了方便,我們記其為。
還是一樣,我們研究負(fù)二項(xiàng)分布的數(shù)學(xué)期望的表達(dá)式,但是方差的表達(dá)式就留給大家~
直接計(jì)算:
記:
由級(jí)數(shù)的相關(guān)理論知識(shí),以及我們上面對(duì)組合數(shù)極限的討論,我們不難知道對(duì)于每一個(gè)k而言,都是存在且有意義的,因?yàn)榧?jí)數(shù)是收斂的。同時(shí),我們就也得到了該數(shù)列是有界的。
又因?yàn)椋?/p>
不難看出,這是一個(gè)等比數(shù)列,又:
(參考幾何分布的數(shù)學(xué)期望的計(jì)算。)
于是,這個(gè)數(shù)列的通項(xiàng)就為:
代入數(shù)學(xué)期望的表達(dá)式中,就得到:
并且,我們還能得到:
這也說明了,負(fù)二項(xiàng)分布滿足了作為分布的基本條件。
值得注意的是,當(dāng)我們令k=1時(shí),就得到了幾何分布。可以說,負(fù)二項(xiàng)分布是幾何分布的推廣。當(dāng)然,這點(diǎn)從這兩個(gè)分布各自所描述的實(shí)際意義來看也不難理解。

思考:
證明或回答下列問題:
(1)試證明
時(shí)的Poisson定理;
(2)計(jì)算一般的超幾何分布的方差公式;
(3)試用數(shù)學(xué)語言說明,在n遠(yuǎn)遠(yuǎn)小于N時(shí),超幾何分布可以近似為二項(xiàng)分布;
(4)證明幾何分布的無記憶性;
(5)試推導(dǎo)負(fù)二項(xiàng)分布的方差公式;
設(shè)隨機(jī)變量X服從Poisson分布(參數(shù)為λ):
(1)試求事件A=“X取奇數(shù)”的概率;
(2)試證明:
一批產(chǎn)品的不合格率為0.02,現(xiàn)從中任取40件進(jìn)行檢查,若發(fā)現(xiàn)兩件或兩件以上不合格拒收這批產(chǎn)品。分別用以下方法求拒收的概率:
(1)用二項(xiàng)分布作精確計(jì)算;
(2)用Poisson分布作近似計(jì)算;
設(shè)隨機(jī)變量X(n,p)服從二項(xiàng)分布b(n,p)試證明:
(1)
(2)
設(shè)X服從參數(shù)為p的幾何分布,試證明:
最後の最後に、ありがとうございました!