有意思的概率與統(tǒng)計(jì)(六)
在經(jīng)歷了艱苦的奮斗與掙扎過(guò)后,我終于把概率的基本內(nèi)容向各位小伙伴介紹完了!
可以說(shuō),前幾篇專欄里介紹的東西可以說(shuō)是概率論當(dāng)中的基礎(chǔ)中的基礎(chǔ),但同時(shí)也是學(xué)好概率論的重中之重了。只有充分理解好前面我所向大家介紹的內(nèi)容,之后有關(guān)概率論的學(xué)習(xí)大家才能夠足夠順利地進(jìn)行下去~
那么,今天開(kāi)始,我們學(xué)什么呢?
那當(dāng)然是正如我之前所說(shuō)的……隨機(jī)變量!
Chapter? Two? 隨機(jī)變量及其分布
2.1? 隨機(jī)變量及其分布
我們之前已經(jīng)簡(jiǎn)單地提及過(guò)了隨機(jī)變量的概念。(專欄(一)中就有講到過(guò)~),它是用于描述隨機(jī)現(xiàn)象的結(jié)果的數(shù)字變量,以大寫字母表示。
但是對(duì)于隨機(jī)變量的具體定義,我們還沒(méi)有明確給出。事實(shí)上,所謂隨機(jī)變量,實(shí)際上就是定義在樣本空間上的關(guān)于樣本點(diǎn)
的實(shí)值函數(shù)
,其取值用小寫字母x,y,z等來(lái)表示。
因?yàn)闃颖究臻g會(huì)因樣本點(diǎn)的個(gè)數(shù)和性質(zhì)分為離散樣本空間和連續(xù)樣本空間,自然,隨機(jī)變量也可以因此分成離散型隨機(jī)變量和連續(xù)型隨機(jī)變量。二者的主要區(qū)別就在于樣本空間是否是至多可數(shù)集。
與微積分中的基本變量有所差異,概率論中的隨機(jī)變量X是一種“隨機(jī)取值的變量,并且伴隨有一種分布”。我們不僅要知道X的可能取值,還要知道對(duì)應(yīng)該值的概率,這就構(gòu)成了一個(gè)概率分布。(概率分布的概念我們之前也有所提及,小伙伴們可以去回顧一下,加深理解~)

所以,為了能夠更好地使隨機(jī)變量發(fā)揮它在概率論中的作用,我們就有必要好好地研究——隨機(jī)變量的概率分布。
對(duì)于離散型隨機(jī)變量來(lái)說(shuō),我們一般不難找出對(duì)應(yīng)某些事件的概率。(當(dāng)然,對(duì)于無(wú)限可數(shù)集而言,可能問(wèn)題要稍微復(fù)雜一些~)但是對(duì)于連續(xù)型隨機(jī)變量而言,似乎單純?nèi)ふ夷骋粋€(gè)樣本點(diǎn)的概率不太容易實(shí)現(xiàn)。(很多時(shí)候都會(huì)變成0……這并不便于我們研究問(wèn)題。)
因此,我們就有必要通過(guò)另一種方式來(lái)表示隨機(jī)變量的分布關(guān)系。
由于隨機(jī)變量是實(shí)值函數(shù),因此它的函數(shù)值的取值集合(即樣本空間)也一定是一個(gè)實(shí)數(shù)集。如果說(shuō)我們不去考慮單個(gè)樣本點(diǎn)的概率,而是去考慮某些具有特定規(guī)律(這個(gè)規(guī)律便于我們對(duì)新的分布關(guān)系給出定義)的事件。這樣,如果我們又可以通過(guò)一定的方式將單個(gè)點(diǎn)(或者單個(gè)點(diǎn)附近)的概率表示出來(lái),那么這就是一個(gè)十分完美的分布表示法。
最簡(jiǎn)單地,考慮事件A={X≤x}。(這個(gè)事件確是待研究的樣本空間的子集。)對(duì)于一般的情況,該事件對(duì)應(yīng)的概率為P(A)=P(X≤x)。
又因?yàn)镻(c<X≤a)=P(X≤a)-P(X≤c),P(X>b)=1-P(X≤b),所以,對(duì)于任何以序關(guān)系表示的事件,只要知道對(duì)應(yīng)的概率P(X≤x),就可以完美求解其概率。
同時(shí),對(duì)于離散型隨機(jī)變量而言,我們又可以令P(X=x)=P(X≤x)-P(X≤x-1),這樣,我們也能夠通過(guò)我們所規(guī)定的事件的概率來(lái)給出單個(gè)樣本點(diǎn)的概率。而對(duì)于連續(xù)型隨機(jī)變量而言,這樣的事件又不會(huì)使得概率分布中概率全部是0值或者是不可得到的值。
顯然,這樣的事件用于定義新的分布關(guān)系是十分合理的。
此時(shí),我們不難發(fā)現(xiàn),P(X≤x)從一個(gè)對(duì)應(yīng)于事件的函數(shù),變?yōu)榱藢?duì)應(yīng)于數(shù)值變量x的函數(shù)。這個(gè)時(shí)候,它確實(shí)是一個(gè)真實(shí)的函數(shù)了(函數(shù)原本最狹義的定義就是數(shù)集到數(shù)集的映射。),我們將其記為:
稱之為隨機(jī)變量X的分布函數(shù)。且稱X服從于F(x),記為X~F(x)。
其中,x為任意實(shí)數(shù)。以后,在提到分布函數(shù)時(shí),默認(rèn)樣本空間為全體實(shí)數(shù),哪怕真實(shí)事件的樣本空間并不是這樣。(這樣做可以統(tǒng)一分布函數(shù)的定義域,從而減少分析分布函數(shù)的麻煩;同時(shí),因?yàn)槲覀兛梢詫?duì)不屬于真實(shí)事件的部分概率規(guī)定為0,這樣就也保證了我們這種規(guī)定的合理性。)
值得注意的是,很明顯,任意隨機(jī)變量都有一個(gè)對(duì)應(yīng)的分布函數(shù),而不管它是連續(xù)的還是離散的。

有了分布函數(shù)的定義,我們就要研究它的基本性質(zhì)。(這已經(jīng)成為固定的套路了~)
首先,考慮到:
這直接說(shuō)明,分布函數(shù)一定是單調(diào)不減的。
此外,由于分布函數(shù)本質(zhì)上是事件的概率,因此,由非負(fù)性公理和正則性公理,我們知道,分布函數(shù)一定是有界的,且滿足:
同時(shí),由于樣本空間是實(shí)數(shù)集,因此當(dāng)x→+∞時(shí),事件{X≤x}逐漸覆蓋整個(gè)樣本空間,因此應(yīng)該有:
類似地,我們可以想到:
當(dāng)然,這只是我們的猜想,至于正確與否,還有待證明。只不過(guò),這部分的證明我就不在這里列出了,交給小伙伴們吧~
最后,補(bǔ)充一條對(duì)于分布函數(shù)而言十分重要的性質(zhì)——右連續(xù)性。即:
這個(gè)性質(zhì)也交給大家來(lái)嘗試~
至此,我們也就給出了對(duì)于分布函數(shù)而言最為重要的三條性質(zhì)。
我們最后指出一點(diǎn),那就是,滿足這三條基本性質(zhì)的函數(shù)一定是某隨機(jī)變量的分布函數(shù)。

我們先來(lái)就簡(jiǎn)單的分布類型來(lái)研究其分布函數(shù)。
最容易為大家所了解和接受的,就是離散型隨機(jī)變量。我們之前在介紹確定概率的基本方法時(shí),曾經(jīng)在例子當(dāng)中給出過(guò)離散型隨機(jī)變量的概率分布的例子。事實(shí)上,我們可以從中抽離出對(duì)于離散型隨機(jī)變量而言最為重要的幾個(gè)點(diǎn),從而得到一般的離散型隨機(jī)變量的分布的概念:
設(shè)X為一離散型隨機(jī)變量,其所有可能的取值為:
則稱X取的概率:
為X的概率分布列,簡(jiǎn)稱為分布列,記為。
分布列一般都用列表的方式給出,形式大體如我們前面所舉過(guò)的例子那樣。(這一點(diǎn)大家在中學(xué)階段想必都已經(jīng)接觸過(guò)了,就不再細(xì)說(shuō)~)
對(duì)于分布列而言,很容易想到它應(yīng)該具有的性質(zhì):
(1)非負(fù)性:
(2)正則性:
而離散型隨機(jī)變量的分布函數(shù)顯然也就應(yīng)該是:
不過(guò),對(duì)于離散型隨機(jī)變量而言,使用分布列來(lái)描述函數(shù)顯然要比分布函數(shù)來(lái)的簡(jiǎn)單便捷。所以,一般而言,我們描述離散型隨機(jī)變量的分布,都使用分布列來(lái)進(jìn)行。

對(duì)于離散型隨機(jī)變量,我們可以使用分布列來(lái)描述分布情況。但是,我們也提到過(guò),這樣的方式對(duì)于連續(xù)型隨機(jī)變量并不適合,因?yàn)閱蝹€(gè)樣本點(diǎn)處的概率多數(shù)情況下都要取零值。
如果這個(gè)時(shí)候,我們還是需要對(duì)某個(gè)樣本點(diǎn)的概率取值,就不得不使用其它方式來(lái)進(jìn)行估計(jì)和代替了。這個(gè)時(shí)候我們可以想到,因?yàn)楦怕?img type="latex" class="latex" src="http://api.bilibili.com/x/web-frontend/mathjax/tex?formula=P(X%5Cle%20x)" alt="P(X%5Cle%20x)">實(shí)際上是無(wú)窮多個(gè)事件:
的累積,于是,我們可以用微積分的思想和方式來(lái)解決這個(gè)問(wèn)題:
設(shè)是隨機(jī)變量X的分布函數(shù),如果存在定義在實(shí)數(shù)集上的非負(fù)可積函數(shù)
,使得對(duì)任意實(shí)數(shù)x,有:
則稱函數(shù)為連續(xù)型隨機(jī)變量的X的概率密度函數(shù),簡(jiǎn)稱為密度函數(shù)。
概率密度這一稱呼十分符合它的定義。類比物理學(xué)當(dāng)中的密度以及由密度求質(zhì)量的方法,不難理解這里“密度”的含義。同時(shí),此時(shí)的分布函數(shù)可以稱之為概率累計(jì)函數(shù)。這樣的描述生動(dòng)形象地展示出了二者之間的關(guān)系。
概率密度函數(shù)在連續(xù)型隨機(jī)變量的研究當(dāng)中發(fā)揮的作用相當(dāng)于是離散型隨機(jī)變量的分布列一樣,因此它也顯然具有非負(fù)性和正則性兩個(gè)性質(zhì)。這是十分顯然的道理~
最后,我們也指出,滿足非負(fù)性和正則性的函數(shù),一定可以寫作某個(gè)隨機(jī)變量的分布列或者概率密度函數(shù)。

思考:
回答下列問(wèn)題:
(1)試證明分布函數(shù)的兩個(gè)極限;
(2)試證明分布函數(shù)具有右連續(xù)性;
(3)考慮一下,我們可以怎樣根據(jù)分布函數(shù)的三條基本性質(zhì)構(gòu)造一個(gè)可能的隨機(jī)變量?對(duì)于滿足非負(fù)性和正則性的概率密度函數(shù)又如何構(gòu)造隨機(jī)變量呢?
(4)對(duì)于連續(xù)型隨機(jī)變量,它的分布函數(shù)除了已知的三條基本性質(zhì)之外,還具有哪些基本性質(zhì)?
試求以下離散型隨機(jī)變量的分布列:
(1)口袋中有5個(gè)球,分別編號(hào)1~5。從中任取3個(gè),X為三個(gè)球中的最大號(hào)碼;
(2)一顆骰子拋擲兩次,X為兩次所得的最小點(diǎn)數(shù);
(3)口袋里有7個(gè)白球和3個(gè)黑球。每次從中任取一個(gè),若為黑球,則不放回,并另外放入一個(gè)白球。X為首次取出白球時(shí)的一共的取球次數(shù);
(4)一副撲克牌中有54張牌(包含大小王)。從中任取5張,X為黑桃張數(shù);
設(shè)隨機(jī)變量X的密度函數(shù)為:
求
;
設(shè)隨機(jī)變量X的密度函數(shù)為:
試求:
(1)系數(shù)A的值;
(2)X落在區(qū)間(0,π/4)內(nèi)的概率;
設(shè)連續(xù)型隨機(jī)變量X的分布函數(shù)為:
試求:
(1)系數(shù)A的值;
(2)X落在區(qū)間(0.3,0.7)內(nèi)的概率;
(3)X的概率密度函數(shù);
設(shè)隨機(jī)變量X的密度函數(shù)
為一個(gè)偶函數(shù),
為X的分布函數(shù),試證明對(duì)于任意實(shí)數(shù)a,都有:
(1)
;
(2)
;
(3)
最後の最後に、ありがとうございました!