一個班的學(xué)生成績應(yīng)該服從正態(tài)分布,這句話有毛病嗎
如果連續(xù)型隨機(jī)變量的概率密度函數(shù)為


從上面的定義可以看出,正態(tài)分布首先是對于連續(xù)型隨機(jī)變量來說的,而學(xué)生的分?jǐn)?shù)則應(yīng)該是離散型隨機(jī)變量,因為不可能有什么60.1,60.01,60.001分等等。

上圖是一個正態(tài)分布曲線,假設(shè)橫坐標(biāo)代表分?jǐn)?shù),每一個藍(lán)色柱狀圖和曲線有一個交點,則這個交點的縱坐標(biāo)就是對應(yīng)于這個分?jǐn)?shù)的概率密度。但是,假設(shè)圖中的分?jǐn)?shù)為70,與縱坐標(biāo)的交點為0.4,那么,“一個班的學(xué)生成績應(yīng)該服從正態(tài)分布”指的是考到70分的學(xué)生人數(shù)占總?cè)藬?shù)的40%,即概率的意思。因此:
“一個班的學(xué)生成績應(yīng)該服從正態(tài)分布”,首先這句話等于認(rèn)為學(xué)生的分?jǐn)?shù)是一個連續(xù)的實數(shù),而且這個分?jǐn)?shù)的范圍是從負(fù)無窮到正無窮,這顯然是不符合現(xiàn)實的。
其次,對于離散型隨機(jī)變量來說,只有概率,不存在概率密度的概念,因此,“一個班的學(xué)生成績應(yīng)該服從正態(tài)分布”不但混肴了離散型和連續(xù)型隨機(jī)變量的概念,而且混肴了概率和概率密度的概念。
對于概率密度服從正態(tài)分布的隨機(jī)變量來說,其分布函數(shù)是對概率密度函數(shù)的積分:


由上圖最后一個積分表達(dá)式

以及分布函數(shù)的定義

可以推導(dǎo)得出正態(tài)分布的概率分布函數(shù)為

其中

等于1,得到正態(tài)分布的分布函數(shù)F(x)如下圖:

綜上所述,學(xué)生成績本來是一個離散型隨機(jī)變量,但我們套用了連續(xù)型隨機(jī)變量的正態(tài)分布概念;同時也混肴了概率和概率密度的含義。但實際工作中,這并不會帶來什么太大的影響,只要我們把學(xué)生的成績假想為是整個實數(shù)區(qū)間就行了。