有意思的概率與統(tǒng)計(jì)（九）

2023-08-29 20:56 作者:不能吃的大魚 0人讀過 | 我要投稿

好了！進(jìn)入到又一個(gè)重點(diǎn)了！

在介紹完基本的隨機(jī)變量特征和性質(zhì)之后，我們就要開始了解一些重要的分布了。這些分布基本涵蓋了我們?nèi)粘７治龈鞣N問題時(shí)所能面臨的各種情況。因此，仔細(xì)學(xué)習(xí)和了解這些重要的分布十分必要的。

希望大家好好理解喲~

Chapter? Two? 隨機(jī)變量及其分布

2.4? 常用離散分布

我們先從離散分布入手，介紹一些基本的隨機(jī)變量分布~

首先是——二項(xiàng)分布。

我們?cè)谥袑W(xué)階段已經(jīng)了解過二項(xiàng)分布的基本概念和特征，其與獨(dú)立隨機(jī)試驗(yàn)有所關(guān)聯(lián)。

我們來考慮這樣一個(gè)例子：

例1：某特效藥的臨床有效率為p，今有n人服用，求治愈人數(shù)X的分布列。

對(duì)于這10個(gè)服用特效藥的人而言，彼此之間是否治愈是相互獨(dú)立的，并不會(huì)因?yàn)槠渲心骋粋€(gè)人治愈與否就會(huì)影響其他人的治愈結(jié)果。因此，這是一個(gè)獨(dú)立重復(fù)試驗(yàn)。

基于此，我們很容易就給出X的分布列為：

$P(X%3Dk)%3D%5Cbinom%7Bn%7D%7Bk%7Dp%5Ek%20(1-p)%5E%7Bn-k%7D$

其中，組合數(shù)的含義是在n個(gè)人中選擇出k個(gè)人被治愈，剩余的n-k個(gè)人未被治愈。

如果X是n重Bernoulli試驗(yàn)中某事件A成功的次數(shù)，那么我們稱X的概率分布滿為二項(xiàng)分布，記作 $X%5Csim%20b(n%2Cp)$ 。其概率分布列滿足上式。

利用二項(xiàng)式定理，我們不難證明：

$%5Csum_%7Bk%3D0%7D%5En%20P(X%3Dk)%3D%5Csum_%7Bk%3D0%7D%5En%20%5Cbinom%7Bn%7D%7Bk%7Dp%5Ek%20(1-p)%5E%7Bn-k%7D%3D%5Bp%2B(1-p)%5D%5En%3D1$

想要充分了解一個(gè)分布，我們接下來就要研究它的數(shù)字特征。首先是數(shù)學(xué)期望。按照定義，由于隨機(jī)變量X的取值非負(fù)，因此我們只需直接計(jì)算下式即可：

$%5Cbegin%20%7Bequation%7D%0A%5Cbegin%20%7Baligned%7D%0AE(X)%26%3D%5Csum_%7Bk%3D0%7D%5En%20kP(X%3Dk)%5C%5C%0A%26%3D%5Csum_%7Bk%3D0%7D%5En%20k%5Cbinom%7Bn%7D%7Bk%7Dp%5Ek%20(1-p)%5E%7Bn-k%7D%5C%5C%0A%26%3D%5Csum_%7Bk%3D1%7D%5En%20n%5Cbinom%7Bn-1%7D%7Bk-1%7Dp%5Ek%20(1-p)%5E%7Bn-k%7D%5C%5C%0A%26%3Dnp%5Csum_%7Bk%3D0%7D%5E%7Bn-1%7D%20%5Cbinom%7Bn%7D%7Bk%7Dp%5E%7Bk%7D%20(1-p)%5E%7Bn-1-k%7D%5C%5C%0A%26%3Dnp%0A%5Cend%20%7Baligned%7D%0A%5Cend%20%7Bequation%7D$

方差的計(jì)算有兩種方式，一種是直接利用定義，另一種是利用公式：

$%5Ctext%20%7BVar%7D(X)%3DE(X%5E2)-E%5E2(X)$

我們采用這種方法。通過直接計(jì)算得到：

$%5Cbegin%20%7Bequation%7D%0A%5Cbegin%20%7Baligned%7D%0A%5Ctext%20%7BVar%7D(X)%26%3DE(X%5E2)-E%5E2(X)%5C%5C%0A%26%3D%5Csum_%7Bk%3D0%7D%5En%20k%5E2P(X%3Dk)-(np)%5E2%5C%5C%0A%26%3D%5Csum_%7Bk%3D0%7D%5En%20k%5E2%5Cbinom%7Bn%7D%7Bk%7Dp%5Ek%20(1-p)%5E%7Bn-k%7D-n%5E2p%5E2%5C%5C%0A%26%3Dnp%5Csum_%7Bk%3D0%7D%5E%7Bn-1%7D%20(k%2B1)%5Cbinom%7Bn%7D%7Bk%7Dp%5E%7Bk%7D%20(1-p)%5E%7Bn-1-k%7D-n%5E2p%5E2%5C%5C%0A%26%3Dnp%5Csum_%7Bk%3D0%7D%5E%7Bn-1%7D%20k%5Cbinom%7Bn%7D%7Bk%7Dp%5E%7Bk%7D%20(1-p)%5E%7Bn-1-k%7D%2Bnp%5Csum_%7Bk%3D0%7D%5E%7Bn-1%7D%20%5Cbinom%7Bn%7D%7Bk%7Dp%5E%7Bk%7D%20(1-p)%5E%7Bn-1-k%7D-n%5E2p%5E2%5C%5C%0A%26%3Dnp(n-1)p%2Bnp-n%5E2p%5E2%5C%5C%0A%26%3Dnp(1-p)%0A%0A%5Cend%20%7Baligned%7D%0A%5Cend%20%7Bequation%7D$

這就是二項(xiàng)分布的方差的公式。

我們接下來介紹另一種非常重要的離散型隨機(jī)變量的分布——Poisson分布。它在很多放射性物質(zhì)衰變過程中有所應(yīng)用。

Poisson分布的分布列為：

$P(X%3Dk)%3D%5Cfrac%7B%5Clambda%20%5Ek%7D%7Bk!%7De%5E%7B-%5Clambda%20%7D%20%5Cquad(k%3D0%2C1%2C2%2C%5Ccdots)$

其中，參數(shù)λ＞0。如果隨機(jī)變量X服從Poisson分布，那么我們記做 $X%5Csim%20P(%5Clambda%20)$ 。

利用函數(shù)項(xiàng)級(jí)數(shù)的知識(shí)，我們很容易驗(yàn)證得到：

$%5Csum_%7Bn%3D0%7D%5E%E2%88%9E%20%5Cfrac%7B%5Clambda%20%5Ek%7D%7Bk!%7De%5E%7B-%5Clambda%20%7D%3De%5E%7B-%5Clambda%20%7D%5Csum_%7Bn%3D0%7D%5E%E2%88%9E%20%5Cfrac%7B%5Clambda%20%5Ek%7D%7Bk!%7D%3De%5E%7B-%5Clambda%20%7De%5E%7B%5Clambda%20%7D%3D1$

對(duì)于Poisson分布，我們也是要研究它的數(shù)學(xué)期望和方差。對(duì)于數(shù)學(xué)期望，我們直接計(jì)算，能夠得到：

$%5Cbegin%20%7Bequation%7D%0A%5Cbegin%20%7Baligned%7D%0AE(X)%26%3D%5Csum_%7Bk%3D0%7D%5E%E2%88%9E%20kP(X%3Dk)%5C%5C%0A%26%3D%5Csum_%7Bk%3D0%7D%5E%E2%88%9E%20k%5Cfrac%7B%5Clambda%20%5Ek%7D%7Bk!%7De%5E%7B-%5Clambda%20%7D%5C%5C%0A%26%3De%5E%7B-%5Clambda%20%7D%5Csum_%7Bk%3D0%7D%5E%E2%88%9E%20k%5Cfrac%7B%5Clambda%20%5Ek%7D%7Bk!%7D%5C%5C%0A%26%3De%5E%7B-%5Clambda%20%7D%5Csum_%7Bk%3D1%7D%5E%E2%88%9E%20%5Cfrac%7B%5Clambda%20%5Ek%7D%7B(k-1)!%7D%5C%5C%0A%26%3D%5Clambda%20e%5E%7B-%5Clambda%20%7D%5Csum_%7Bk%3D0%7D%5E%E2%88%9E%20%5Cfrac%7B%5Clambda%20%5Ek%7D%7Bk!%7D%5C%5C%0A%26%3D%5Clambda%20%0A%5Cend%20%7Baligned%7D%0A%5Cend%20%7Bequation%7D$

而方差則為：

$%5Cbegin%20%7Bequation%7D%0A%5Cbegin%20%7Baligned%7D%0A%5Ctext%20%7BVar%7D(X)%26%3DE(X%5E2)-E%5E2(X)%5C%5C%0A%26%3D%5Csum_%7Bk%3D0%7D%5E%E2%88%9E%20k%5E2%5Cfrac%7B%5Clambda%20%5Ek%7D%7Bk!%7De%5E%7B-%5Clambda%20%7D-%5Clambda%20%5E2%5C%5C%0A%26%3De%5E%7B-%5Clambda%20%7D%5Csum_%7Bk%3D1%7D%5E%E2%88%9Ek%20%5Cfrac%7B%5Clambda%20%5Ek%7D%7B(k-1)!%7D-%5Clambda%20%5E2%5C%5C%0A%26%3D%5Clambda%20e%5E%7B-%5Clambda%20%7D%5Csum_%7Bk%3D0%7D%5E%E2%88%9E%20(k%2B1)%5Cfrac%7B%5Clambda%20%5Ek%7D%7Bk!%7D-%5Clambda%20%5E2%5C%5C%0A%26%3D%5Clambda%20e%5E%7B-%5Clambda%20%7D%5Cbigg(%5Csum_%7Bk%3D0%7D%5E%E2%88%9E%20k%5Cfrac%7B%5Clambda%20%5Ek%7D%7Bk!%7D%2B%5Cfrac%7B%5Clambda%20%5Ek%7D%7Bk!%7D%5Cbigg)-%5Clambda%20%5E2%5C%5C%0A%26%3D%5Clambda%5E2%2B%5Clambda%20-%5Clambda%20%5E2%5C%5C%0A%26%3D%5Clambda%0A%5Cend%20%7Baligned%7D%0A%5Cend%20%7Bequation%7D$

這說明，對(duì)于Poisson分布而言，數(shù)學(xué)期望和方差的表達(dá)式是一致的。

對(duì)于二項(xiàng)分布，我們通過一個(gè)例子已經(jīng)直觀地感受到了它的應(yīng)用情形，但是對(duì)于Poisson分布而言，我們并沒有介紹其相關(guān)的應(yīng)用。所以，為了讓大家見識(shí)一下Poisson分布的重要作用，接下來，我們來看一看有關(guān)Poisson分布的一個(gè)非常重要的結(jié)果——Poisson定理。

我們先說明，Poisson定理是聯(lián)系二項(xiàng)分布與Poisson分布的非常重要的結(jié)果。有了Poisson定理之后，很多二項(xiàng)分布的計(jì)算都可以用Poisson分布來計(jì)算。這樣就會(huì)大大簡化計(jì)算的復(fù)雜度與難度。

我們先來看組合數(shù)的極限，即：

$%5Clim_%7Bn%5Cto%E2%88%9E%7D%20%5Cbinom%20%7Bn%7D%7Bk%7D%20%3D%5Clim_%7Bn%5Cto%E2%88%9E%7D%20%5Cfrac%7Bn!%7D%7Bk!(n-k)!%7D%20$

利用Stirling公式，我們很容易就得到：
$%5Clim_%7Bn%5Cto%E2%88%9E%7D%20%5Cfrac%7Bn!%7D%7Bk!(n-k)!%7D%20%3D%5Cfrac%7B1%7D%7Bk!%7D%20%5Clim_%7Bn%5Cto%E2%88%9E%7D%20%5Cfrac%7B%5Csqrt%7B2%5Cpi%20n%7D%5Cbigg(%5Cdisplaystyle%20%5Cfrac%7Bn%7D%7Be%7D%20%5Cbigg)%5En%20%7D%7B%5Csqrt%7B2%5Cpi%20(n-k)%7D%5Cbigg(%5Cdisplaystyle%20%5Cfrac%7Bn-k%7D%7Be%7D%20%5Cbigg)%5E%7Bn-k%7D%20%7D%20%5Csim%20%5Cfrac%7Be%5Ek%7D%7Bk!%7D%5Cbigg(%5Cfrac%7Bn-k%7D%7Be%7D%20%5Cbigg)%5E%7Bk%7D$

對(duì)于二項(xiàng)分布而言，設(shè)一次試驗(yàn)中某事件發(fā)生的概率為 $p_n$ （與試驗(yàn)次數(shù)n相關(guān)）。當(dāng)n一定時(shí)該事件發(fā)生的概率也一定。如果 $p_n$ 滿足：

$np_n%3D%5Clambda%20$

(λ是Poisson分布的特征參數(shù)。）

那么，我們就有：

$%5Clim_%7Bn%5Cto%E2%88%9E%7D%20p_n%5Ek(1-p_n)%5E%7Bn-k%7D%20%3D%5Clim_%7Bn%5Cto%E2%88%9E%7D%20%5Cbigg(%5Cfrac%7B%5Clambda%20%7D%7Bn%7D%5Cbigg)%5Ek%20%5Cbigg(1-%5Cfrac%7B%5Clambda%20%7D%7Bn%7D%5Cbigg)%5E%7Bn-k%7D%20%5Csim%20%5Clambda%20%5Ek%5Cbigg(%5Cfrac%7B1%7D%7Bn%7D%5Cbigg)%5Ek%20e%5E%7B-%5Clambda%20%7D$

于是，我們將這兩個(gè)結(jié)果組合到一起，就得到了：

$%5Clim_%7Bn%5Cto%E2%88%9E%7D%20P(X%3Dk)%3D%5Cfrac%7B%5Clambda%20%5Ek%7D%7Bk!%7De%5E%7B-%5Clambda%20%7D%5Clim_%7Bn%5Cto%E2%88%9E%7D%20%20%20e%5Ek%5Cbigg(%5Cfrac%7Bn-k%7D%7Be%7D%20%5Cbigg)%5E%7Bk%7D%5Cbigg(%5Cfrac%7B1%7D%7Bn%7D%5Cbigg)%5Ek%3D%5Cfrac%7B%5Clambda%20%5Ek%7D%7Bk!%7De%5E%7B-%5Clambda%20%7D$

這說明，在n重Bernoulli試驗(yàn)當(dāng)中，若：

（1）n足夠大；

（2） $np_n%3D%5Clambda%20$ ；

（更進(jìn)一步，可以是 $np_n%5Crightarrow%20%5Clambda%20%5Cquad(n%5Crightarrow%20%E2%88%9E)$ ）

則可以用Poisson分布來近似代替二項(xiàng)分布去計(jì)算各種概率統(tǒng)計(jì)量。（包括概率，數(shù)學(xué)期望和方差。）

一種最為常見的應(yīng)用環(huán)境是，當(dāng)n足夠大，而p足夠小，且np大小適中。（不會(huì)是一個(gè)特別大的數(shù)，否則會(huì)被視為無窮大；也不會(huì)特別小，否則Poisson分布無意義。）這時(shí)，基于Poisson定理，我們就可以使用Poisson分布的結(jié)論近似計(jì)算二項(xiàng)分布的結(jié)果。

當(dāng)然，事實(shí)上，使用最多的還是用于計(jì)算概率。畢竟，就算不使用Poisson定理，我們也很容易能夠在定理的條件下得到：

$E(X)%3Dnp_n%3D%5Clambda$

$%5Ctext%20%7BVar%7D(X)%3Dnp_n(1-p_n)%3D%5Clambda%5Cbigg(1-%5Cfrac%7B%5Clambda%20%7D%7Bn%7D%20%5Cbigg)%5Crightarrow%20%5Clambda%5Cquad%20(n%5Crightarrow%20%E2%88%9E)$

因此，數(shù)學(xué)期望和方差的近似計(jì)算是很顯然的，不必一定要以Poisson定理為依據(jù)。

接下來，我們要介紹一下一個(gè)也已經(jīng)在中學(xué)階段就接觸過的分布——超幾何分布。

我們以一個(gè)基本的例子來引入。

例2：我們?cè)诟怕实拇_定方法那一節(jié)介紹過很多的基本模型。其中十分經(jīng)典的一個(gè)古典概型，就是抽樣模型。我們?cè)诋?dāng)時(shí)的不放回抽樣模型的例子當(dāng)中已經(jīng)給出了事件A=“取出的球中有m個(gè)紅球”的概率：

$P(A)%3D%5Cfrac%7B%5Cbinom%7BM%7D%7Bm%7D%5Cbinom%7BN-M%7D%7Bn-m%7D%7D%7B%5Cbinom%7BN%7D%7Bn%7D%7D%20$

我們現(xiàn)在定義隨機(jī)變量X取出的紅球的數(shù)目，那么就有分布列：

$P(X%3Dm)%3D%5Cfrac%7B%5Cbinom%7BM%7D%7Bm%7D%5Cbinom%7BN-M%7D%7Bn-m%7D%7D%7B%5Cbinom%7BN%7D%7Bn%7D%7D%20$

利用專欄（二）的思考1.（3）的結(jié)論，我們直接得到：

$%5Csum_%7Bm%3D0%7D%5Er%20%5Cbinom%7BM%7D%7Bm%7D%5Cbinom%7BN-M%7D%7Bn-m%7D%3D%5Cbinom%7BN%7D%7Bn%7D%5Cquad%20(r%3D%5Cmin%5C%7BM%2Cn%5C%7D)$

于是我們就得到：

$%5Csum_%7Bm%3D0%7D%5Er%20P(X%3Dm)%3D1$

我們稱該分布為超幾何分布，記為 $X%5Csim%20h(n%2CN%2CM)$ 。

對(duì)于超幾何分布，直接計(jì)算數(shù)學(xué)期望得到：

$%5Cbegin%20%7Bequation%7D%0A%5Cbegin%20%7Baligned%7D%0AE(X)%26%3D%5Csum_%7Bm%3D0%7D%5Er%20m%5Cfrac%7B%5Cbinom%7BM%7D%7Bm%7D%5Cbinom%7BN-M%7D%7Bn-m%7D%7D%7B%5Cbinom%7BN%7D%7Bn%7D%7D%5C%5C%0A%26%3D%20%20M%5Csum_%7Bm%3D1%7D%5Er%20%5Cfrac%7B%5Cbinom%7BM-1%7D%7Bm-1%7D%5Cbinom%7BN-M%7D%7Bn-m%7D%7D%7B%5Cbinom%7BN%7D%7Bn%7D%7D%5C%5C%0A%26%3Dn%5Cfrac%7BM%7D%7BN%7D%20%5Csum_%7Bm%3D0%7D%5E%7Br-1%7D%20%5Cfrac%7B%5Cbinom%7BM%7D%7Bm%7D%5Cbinom%7BN-M%7D%7Bn-m%7D%7D%7B%5Cbinom%7BN-1%7D%7Bn-1%7D%7D%5C%5C%0A%26%3Dn%5Cfrac%7BM%7D%7BN%7D%20%0A%5Cend%20%7Baligned%7D%0A%5Cend%20%7Bequation%7D$

這個(gè)結(jié)果可以理解為，在N個(gè)球中抽出紅球的均值等于一次取出的球數(shù)n與紅球在球堆中分布的比例（也可以是在盒子里抽出一個(gè)紅球的概率）的乘積。

考慮到這樣的意義，我們很容易將其與二項(xiàng)分布再度聯(lián)系起來。事實(shí)上，如果N足夠大，大到抽出n個(gè)球?qū)Ρ戎礛/N幾乎無影響（或者是n相較于N足夠?。?，這時(shí)我們就可以將比值視為常數(shù)p，則超幾何分布就近似為二項(xiàng)分布。

超幾何分布的方差公式留給大家自行推導(dǎo)~

最后，我們來介紹一下幾何分布。

幾何分布在實(shí)際應(yīng)用當(dāng)中出現(xiàn)的也比較多。設(shè)若在某Bernoulli試驗(yàn)中，某一事件A在每次試驗(yàn)中發(fā)生的概率恒定為p。現(xiàn)在不斷重復(fù)該實(shí)驗(yàn)，直到事件A發(fā)生。我們定義隨機(jī)變量X為實(shí)驗(yàn)進(jìn)行的次數(shù)n，那么對(duì)于X而言，其分布列就應(yīng)該是：

$P(X%3Dn)%3D(1-p)%5E%7Bn-1%7Dp$

此時(shí)，我們稱X服從幾何分布，記作 $X%5Csim%20Ge(p)$ 。

最簡單地，我們可以讓試驗(yàn)為“射擊手射擊靶子”，讓事件A為“射擊手射擊第X次首次射中靶子”。這樣，我們就很好理解幾何分布的意義了。

直接計(jì)算，我們能得到：

$%5Csum_%7Bk%3D1%7D%5E%E2%88%9E%20P(X%3Dk)%3D%5Csum_%7Bk%3D1%7D%5E%E2%88%9E%20(1-p)%5E%7Bk-1%7Dp%3D%5Cfrac%7Bp%7D%7B1-p%7D%20%5Clim_%7Bk%5Cto%E2%88%9E%7D%20%5Cfrac%7B1-p-(1-p)%5E%7Bk%2B1%7D%7D%7B1-(1-p)%7D%20%20%3D1$

這說明幾何分布滿足最基本的必要條件，確實(shí)可能作為一個(gè)分布出現(xiàn)。

對(duì)于幾何分布，我們有一些初等的方法去求它的數(shù)學(xué)期望和方差，在這里將給大家介紹這些方法，至于非初等的方法（利用級(jí)數(shù)理論等），大家可以自由探索~

幾何分布的數(shù)學(xué)期望如下：

$%5Cbegin%20%7Bequation%7D%0A%5Cbegin%20%7Baligned%7D%0AE(X)%26%3D%5Csum_%7Bk%3D1%7D%5E%E2%88%9E%20kP(X%3Dk)%5C%5C%0A%26%3D%5Csum_%7Bk%3D1%7D%5E%E2%88%9E%20k(1-p)%5E%7Bk-1%7Dp%5C%5C%0A%26%3Dp%5Csum_%7Bk%3D1%7D%5E%E2%88%9E%20k(1-p)%5E%7Bk-1%7D%5C%5C%0A%5Cend%20%7Baligned%7D%0A%5Cend%20%7Bequation%7D$

我們記：

$S_n%3D%5Csum_%7Bk%3D1%7D%5En%20k(1-p)%5E%7Bk-1%7D$

于是，利用等差比數(shù)列的規(guī)律（這是中學(xué)階段的一種題型來著？），我們能夠計(jì)算出：

$%5Cbegin%20%7Bequation%7D%0A%5Cbegin%20%7Baligned%7D%0ApS_n%26%3DS_n-(1-p)S_n%5C%5C%0A%26%3D%5Csum_%7Bk%3D1%7D%5En%20k(1-p)%5E%7Bk-1%7D-%5Csum_%7Bk%3D1%7D%5En%20k(1-p)%5E%7Bk%7D%5C%5C%0A%26%3D1-n(1-p)%5En%2B%5Csum_%7Bk%3D1%7D%5E%7Bn-1%7D%20(k%2B1-k)(1-p)%5E%7Bk%7D%5C%5C%0A%26%3D1-n(1-p)%5En%2B%5Csum_%7Bk%3D1%7D%5E%7Bn-1%7D%20(1-p)%5E%7Bk%7D%5C%5C%0A%0A%5Cend%20%7Baligned%7D%0A%5Cend%20%7Bequation%7D$

于是，我們得到了：

$E(X)%3D%5Clim_%7Bn%5Cto%20%E2%88%9E%7D%20(pS_n)%20%3D%5Clim_%7Bn%5Cto%20%E2%88%9E%7D%20%5Cbigg%5B1-n(1-p)%5En%2B%5Csum_%7Bk%3D1%7D%5E%7Bn-1%7D%20(1-p)%5E%7Bk%7D%5Cbigg%5D%3D1-0%2B%5Cfrac%7B1-p%7D%7Bp%7D%20%3D%5Cfrac%7B1%7D%7Bp%7D%20$

至于方差，類似地，我們也可以算出：

$%5Cbegin%20%7Bequation%7D%0A%5Cbegin%20%7Baligned%7D%0A%5Ctext%20%7BVar%7D(X)%26%3DE(X%5E2)-E%5E2(X)%5C%5C%0A%26%3D%5Csum_%7Bk%3D1%7D%5E%E2%88%9E%20k%5E2P(X%3Dk)-%5Cfrac%7B1%7D%7Bp%5E2%7D%20%5C%5C%0A%26%3D%5Csum_%7Bk%3D1%7D%5E%E2%88%9E%20k%5E2(1-p)%5E%7Bk-1%7Dp-%5Cfrac%7B1%7D%7Bp%5E2%7D%5C%5C%0A%26%3D%20p%5Csum_%7Bk%3D1%7D%5E%E2%88%9E%20k%5E2(1-p)%5E%7Bk-1%7D-%5Cfrac%7B1%7D%7Bp%5E2%7D%0A%5Cend%20%7Baligned%7D%0A%5Cend%20%7Bequation%7D$

記：

$T_n%3D%5Csum_%7Bk%3D1%7D%5En%20k%5E2(1-p)%5E%7Bk-1%7D$

類似于剛才的做法，我們得到：

$%5Cbegin%20%7Bequation%7D%0A%5Cbegin%20%7Baligned%7D%0ApT_n%26%3DT_n-(1-p)T_n%5C%5C%0A%26%3D%5Csum_%7Bk%3D1%7D%5En%20k%5E2(1-p)%5E%7Bk-1%7D-%5Csum_%7Bk%3D1%7D%5En%20k%5E2(1-p)%5E%7Bk%7D%5C%5C%0A%26%3D1-n%5E2(1-p)%5En%2B%5Csum_%7Bk%3D1%7D%5E%7Bn-1%7D%20%5B(k%2B1)%5E2-k%5E2%5D(1-p)%5E%7Bk%7D%5C%5C%0A%26%3D1-n%5E2(1-p)%5En%2B%5Csum_%7Bk%3D1%7D%5E%7Bn-1%7D%20(2k%2B1)(1-p)%5E%7Bk%7D%5C%5C%0A%5Cend%20%7Baligned%7D%0A%5Cend%20%7Bequation%7D$

同理，有：

$%5Cbegin%20%7Bequation%7D%0A%5Cbegin%20%7Baligned%7D%0A%5Ctext%20%7BVar%7D(X)%26%3D%5Clim_%7Bn%5Cto%E2%88%9E%7D%20%20(pT_n)-%5Cfrac%7B1%7D%7Bp%5E2%7D%20%5C%5C%0A%26%3D%5Clim_%7Bn%5Cto%E2%88%9E%7D%20%5Cbigg%5B1-n%5E2(1-p)%5En%2B%5Csum_%7Bk%3D1%7D%5E%7Bn-1%7D%20(2k%2B1)(1-p)%5E%7Bk%7D%5Cbigg%5D-%5Cfrac%7B1%7D%7Bp%5E2%7D%20%5C%5C%0A%26%3D1-0%2B2(1-p)%5Cfrac%7B1%7D%7Bp%5E2%7D%2B%5Cfrac%7B1-p%7D%7Bp%7D%20%20-%5Cfrac%7B1%7D%7Bp%5E2%7D%20%20%5C%5C%0A%26%3D%5Cfrac%7B1-p%7D%7Bp%5E2%7D%20%0A%5Cend%20%7Baligned%7D%0A%5Cend%20%7Bequation%7D$

幾何分布另一個(gè)令人驚奇的性質(zhì)是它的無記憶性，即：

$P(X%EF%BC%9Em%2Bn%7CX%EF%BC%9Em)%3DP(X%EF%BC%9En)%5Cquad%20(%5Cforall%20m%2Cn%5Cin%20%5Cmathbf%20N%5E*)$

這一點(diǎn)的證明是十分簡單的，直接利用條件概率的定義即可。但是，這一特點(diǎn)的意義卻是是扥鮮明的，它表明，無論前面發(fā)生了多少次試驗(yàn)，只要事件A未發(fā)生，那么之后事件A再經(jīng)過n次試驗(yàn)才首次發(fā)生的概率與前面的試驗(yàn)無關(guān)。這就是幾何分布的無記憶性。

作為拓展，我們來介紹負(fù)二項(xiàng)分布，它是基于二項(xiàng)分布的一種分布形式。

我們說，幾何分布是描述某一事件首次發(fā)生的試驗(yàn)次數(shù)的隨機(jī)變量的分布。那么，如果我們想要研究某一事件發(fā)生了第k次時(shí)的試驗(yàn)次數(shù)X，又當(dāng)如何考慮呢？

在Bernoulli試驗(yàn)中，我們?nèi)匀挥洿芯康氖录嗀的概率為p不變。那么，考慮到我們要研究的情形，如果試驗(yàn)進(jìn)行了到第m次時(shí)，事件A第k次發(fā)生（m≥k），那么這個(gè)模型此時(shí)等價(jià)于：

（1）前m-1次試驗(yàn)一共發(fā)生了k-1次事件A；

（2）第m次發(fā)生了事件A；

這樣，我們就能夠很容易地得到隨機(jī)變量X的分布列為：

$P(X%3Dm)%3D%5Cbigg%5B%5Cbinom%7Bm-1%7D%7Bk-1%7Dp%5E%7Bk-1%7D(1-p)%5E%7Bm-k%7D%5Cbigg%5Dp%3D%5Cbinom%7Bm-1%7D%7Bk-1%7Dp%5Ek(1-p)%5E%7Bm-k%7D$

中括號(hào)中的項(xiàng)是一個(gè)二項(xiàng)分布的概率表達(dá)，代表我們考慮了（1）；中括號(hào)外的p代表我們考慮到（2）。

直接計(jì)算，我們可以發(fā)現(xiàn)：

$%5Csum_%7Bm%3Dk%7D%5E%E2%88%9E%20P(X%3Dm)%3D%5Csum_%7Bm%3Dk%7D%5E%E2%88%9E%20%5Cbinom%7Bm-1%7D%7Bk-1%7Dp%5Ek(1-p)%5E%7Bm-k%7D%3Dp%5Ek(1-p)%5E%7B-k%7D%5Csum_%7Bm%3Dk%7D%5E%E2%88%9E%20%5Cbinom%7Bm-1%7D%7Bk-1%7D(1-p)%5E%7Bm%7D$

最后的結(jié)果我們暫時(shí)擱置，在后續(xù)的討論當(dāng)中我們很快就能給出答案。

由于這一分布涉及到了二項(xiàng)分布的應(yīng)用，因此稱其為負(fù)二項(xiàng)分布也不難理解。有些時(shí)候，我們也稱隨機(jī)變量X服從Pascal分布。為了方便，我們記其為 $X%5Csim%20Nb(m%2Cp)$ 。

還是一樣，我們研究負(fù)二項(xiàng)分布的數(shù)學(xué)期望的表達(dá)式，但是方差的表達(dá)式就留給大家~

直接計(jì)算：

$%5Cbegin%20%7Bequation%7D%0A%5Cbegin%20%7Baligned%7D%0AE(X)%26%3D%5Csum_%7Bm%3Dk%7D%5E%E2%88%9E%20mP(X%3Dm)%5C%5C%0A%20%26%3D%5Csum_%7Bm%3Dk%7D%5E%E2%88%9E%20m%5Cbinom%7Bm-1%7D%7Bk-1%7Dp%5Ek(1-p)%5E%7Bm-k%7D%5C%5C%0A%26%3D%5Csum_%7Bm%3Dk%7D%5E%E2%88%9E%20k%5Cbinom%7Bm%7D%7Bk%7Dp%5Ek(1-p)%5E%7Bm-k%7D%5C%5C%0A%26%3Dkp%5Ek(1-p)%5E%7B-k%7D%5Csum_%7Bm%3Dk%7D%5E%E2%88%9E%20%5Cbinom%7Bm%7D%7Bk%7D(1-p)%5Em%5C%5C%0A%0A%5Cend%20%7Baligned%7D%0A%5Cend%20%7Bequation%7D$

記：

$Q_k%3D%5Csum_%7Bm%3Dk%7D%5E%E2%88%9E%20%5Cbinom%7Bm%7D%7Bk%7D(1-p)%5Em$

由級(jí)數(shù)的相關(guān)理論知識(shí)，以及我們上面對(duì)組合數(shù)極限的討論，我們不難知道對(duì)于每一個(gè)k而言， $Q_k$ 都是存在且有意義的，因?yàn)榧?jí)數(shù)是收斂的。同時(shí)，我們就也得到了該數(shù)列是有界的。

又因?yàn)椋?/p>

$%5Cbegin%20%7Bequation%7D%0A%5Cbegin%20%7Baligned%7D%0ApQ_k%26%3DQ_k-(1-p)Q_k%5C%5C%0A%26%3D%5Csum_%7Bm%3Dk%7D%5E%E2%88%9E%20%5Cbinom%7Bm%7D%7Bk%7D(1-p)%5Em-%5Csum_%7Bm%3Dk%7D%5E%E2%88%9E%20%5Cbinom%7Bm%7D%7Bk%7D(1-p)%5E%7Bm%2B1%7D%5C%5C%5C%0A%26%3D(1-p)%5Ek%2B%5Csum_%7Bm%3Dk%2B1%7D%5E%E2%88%9E%20%5Cbigg%5B%5Cbinom%7Bm%7D%7Bk%7D-%5Cbinom%7Bm-1%7D%7Bk%7D%5Cbigg%5D(1-p)%5Em%5C%5C%0A%26%3D(1-p)%5Ek%2B%5Csum_%7Bm%3Dk%2B1%7D%5E%E2%88%9E%20%5Cbinom%7Bm-1%7D%7Bk-1%7D(1-p)%5Em%5C%5C%0A%26%3D(1-p)%5Ek%2B(1-p)%5Csum_%7Bm%3Dk%7D%5E%E2%88%9E%20%5Cbinom%7Bm%7D%7Bk-1%7D(1-p)%5Em%5C%5C%0A%26%3D(1-p)%5Ek%2B(1-p)%5BQ_%7Bk-1%7D-(1-p)%5E%7Bk-1%7D%5D%5C%5C%0A%26%3D(1-p)Q_%7Bk-1%7D%0A%5Cend%20%7Baligned%7D%0A%5Cend%20%7Bequation%7D$

不難看出，這是一個(gè)等比數(shù)列，又：

$Q_1%3D%5Csum_%7Bm%3D1%7D%5E%E2%88%9E%20%5Cbinom%7Bm%7D%7B1%7D(1-p)%5Em%3D%5Csum_%7Bm%3D1%7D%5E%E2%88%9E%20m(1-p)%5Em%3D%5Cfrac%7B1-p%7D%7Bp%5E2%7D%20$

（參考幾何分布的數(shù)學(xué)期望的計(jì)算。）

于是，這個(gè)數(shù)列的通項(xiàng)就為：

$Q_k%3D%5Cbigg(%5Cfrac%7B1-p%7D%7Bp%7D%5Cbigg)%5E%7Bk-1%7D%20%5Cfrac%7B1-p%7D%7Bp%5E2%7D%20%3D%5Cfrac%7B(1-p)%5Ek%7D%7Bp%5E%7Bk%2B1%7D%7D%20$

代入數(shù)學(xué)期望的表達(dá)式中，就得到：

$E(X)%3Dkp%5Ek(1-p)%5E%7B-k%7D%5Cfrac%7B(1-p)%5Ek%7D%7Bp%5E%7Bk%2B1%7D%7D%20%3D%5Cfrac%7Bk%7D%7Bp%7D%20$

并且，我們還能得到：

$%5Cbegin%20%7Bequation%7D%0A%5Cbegin%20%7Baligned%7D%0A%5Csum_%7Bm%3Dk%7D%5E%E2%88%9E%20P(X%3Dm)%26%3Dp%5Ek(1-p)%5E%7B-k%7D%5Csum_%7Bm%3Dk%7D%5E%E2%88%9E%20%5Cbinom%7Bm-1%7D%7Bk-1%7D(1-p)%5E%7Bm%7D%5C%5C%0A%26%3Dp%5Ek(1-p)%5E%7B-k%7D%5Cbigg%5B(1-p)%5Ek%2B%5Csum_%7Bm%3Dk%2B1%7D%5E%E2%88%9E%20%5Cbinom%7Bm-1%7D%7Bk-1%7D(1-p)%5E%7Bm%7D%5Cbigg%5D%5C%5C%0A%26%3Dp%5Ek(1-p)%5E%7B-k%7DpQ_k%5C%5C%0A%26%3Dp%5E%7Bk%2B1%7D(1-p)%5E%7B-k%7D%5Cfrac%7B(1-p)%5Ek%7D%7Bp%5E%7Bk%2B1%7D%7D%20%5C%5C%0A%26%3D1%0A%5Cend%20%7Baligned%7D%0A%5Cend%20%7Bequation%7D$

這也說明了，負(fù)二項(xiàng)分布滿足了作為分布的基本條件。

值得注意的是，當(dāng)我們令k=1時(shí)，就得到了幾何分布。可以說，負(fù)二項(xiàng)分布是幾何分布的推廣。當(dāng)然，這點(diǎn)從這兩個(gè)分布各自所描述的實(shí)際意義來看也不難理解。

思考：

證明或回答下列問題：

（1）試證明 $np_n%5Crightarrow%20%5Clambda$ 時(shí)的Poisson定理；

（2）計(jì)算一般的超幾何分布的方差公式；

（3）試用數(shù)學(xué)語言說明，在n遠(yuǎn)遠(yuǎn)小于N時(shí)，超幾何分布可以近似為二項(xiàng)分布；

（4）證明幾何分布的無記憶性；

（5）試推導(dǎo)負(fù)二項(xiàng)分布的方差公式；
設(shè)隨機(jī)變量X服從Poisson分布（參數(shù)為λ）：

（1）試求事件A=“X取奇數(shù)”的概率；

（2）試證明：

$E(X%5En)%3D%5Clambda%20E%5B(X%2B1)%5E%7Bn-1%7D%5D$
一批產(chǎn)品的不合格率為0.02，現(xiàn)從中任取40件進(jìn)行檢查，若發(fā)現(xiàn)兩件或兩件以上不合格拒收這批產(chǎn)品。分別用以下方法求拒收的概率：

（1）用二項(xiàng)分布作精確計(jì)算；

（2）用Poisson分布作近似計(jì)算；
設(shè)隨機(jī)變量X(n,p)服從二項(xiàng)分布b(n,p)試證明：

（1）

$P(X(n%2Cp)%5Cle%20i)%3D1-P(X(n%2C1-p)%5Cle%20n-i-1)%20$

（2）

$E%5Cbigg(%5Cfrac%7B1%7D%7BX%2B1%7D%5Cbigg)%20%3D%5Cfrac%7B1-(1-p)%5E%7Bn%2B1%7D%7D%7B(n%2B1)p%7D%20$
設(shè)X服從參數(shù)為p的幾何分布，試證明：

$E%5Cbigg(%5Cfrac%7B1%7D%7BX%7D%20%5Cbigg)%3D%5Cfrac%7B-p%5Cln%20p%7D%7B1-p%7D%20$