最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

為什么樣本方差(sample variance)的分母是 n-1?

2021-06-18 10:40 作者:馬同學圖解數(shù)學  | 我要投稿

先把問題完整的描述下。

如果已知隨機變量X的期望為%5Cmu,那么可以如下計算方差%5Csigma%5E2

%5Csigma%5E2%3DE%5B(X-%5Cmu)%5E2%5D

上面的式子需要知道X的具體分布是什么(在現(xiàn)實應用中往往不知道準確分布),計算起來也比較復雜。

所以實踐中常常采樣之后,用下面這個S%5E2來近似%5Csigma%5E2

?S%5E2%3D%5Cfrac%7B1%7D%7Bn%7D%5Csum_%7Bi%3D1%7D%5E%7Bn%7D(X_i-%5Cmu)%5E2

其實現(xiàn)實中,往往連X的期望%5Cmu也不清楚,只知道樣本的均值:

%5Coverline%7BX%7D%3D%5Cfrac%7B1%7D%7Bn%7D%5Csum_%7Bi%3D1%7D%5E%7Bn%7DX_i

那么可以這么來計算S%5E2

S%5E2%3D%5Cfrac%7B1%7D%7Bn-1%7D%5Csum_%7Bi%3D1%7D%5E%7Bn%7D(X_i-%5Coverline%7BX%7D)%5E2

那這里就有兩個問題了:

  • 為什么可以用S%5E2來近似%5Csigma%5E2?

  • 為什么使用%5Coverline%7BX%7D替代%5Cmu之后,分母是%5Cdisplaystyle%5Cfrac%7B1%7D%7Bn-1%7D?

我們來仔細分析下細節(jié),就可以弄清楚這兩個問題。

1 為什么可以用S%5E2來近似%5Csigma%5E2

舉個例子,假設X服從這么一個正態(tài)分布:

X%20%5Csim%20N(145%2C%201.4%5E2)

%5Cmu%3D145%2C%5Csigma%5E2%3D1.4%5E2%3D1.96?圖形如下:

當然,現(xiàn)實中往往并不清楚X服從的分布是什么,具體參數(shù)又是什么?所以我用虛線來表明我們并不是真正知道X的分布:

很幸運的,我們知道%5Cmu%3D145,因此對X采樣,并通過:

S%5E2%3D%5Cfrac%7B1%7D%7Bn%7D%5Csum_%7Bi%3D1%7D%5E%7Bn%7D(X_i-%5Cmu)%5E2

來估計%5Csigma%5E2。某次采樣計算出來的S%5E2

看起來比%5Csigma%5E2%3D1.96要小。采樣具有隨機性,我們多采樣幾次,S%5E2會圍繞%5Csigma%5E2上下波動:

S%5E2作為%5Csigma%5E2的一個估計量,算是可以接受的選擇。?

很容易算出:

E%5B%5Cfrac%7B1%7D%7Bn%7D%5Csum_%7Bi%3D1%7D%5E%7Bn%7D(X_i-%5Cmu)%5E2%5D%3D%5Csigma%5E2

這也就是所謂的無偏估計量。從這個分布來看,選擇S%5E2作為估計量確實可以接受。

2 為什么使用%5Coverline%7BX%7D替代%5Cmu之后,分母是%5Cdisplaystyle%5Cfrac%7B1%7D%7Bn-1%7D?

更多的情況,我們不知道%5Cmu是多少的,只能計算出%5Coverline%7BX%7D。不同的采樣對應不同的%5Coverline%7BX%7D

對于某次采樣而言,當%5Cmu%3D%5Coverline%7BX%7D時,下式取得最小值:

%5Csum_%7Bi%3D1%7D%5E%7Bn%7D(X_i-%5Cmu)%5E2

我們也是比較容易從圖像中觀察出這一點,只要%5Cmu偏離%5Coverline%7BX%7D,該值就會增大:

所以可知:

%5Csum_%7Bi%3D1%7D%5E%7Bn%7D(X_i-%5Coverline%7BX%7D)%5E2%20%5Cleq%20%5Csum_%7Bi%3D1%7D%5E%7Bn%7D(X_i-%5Cmu)%5E2

可推出:

%5Cfrac%7B1%7D%7Bn%7D%5Csum_%7Bi%3D1%7D%5E%7Bn%7D(X_i-%5Coverline%7BX%7D)%5E2%20%5Cleq%20%5Cfrac%7B1%7D%7Bn%7D%5Csum_%7Bi%3D1%7D%5E%7Bn%7D(X_i-%5Cmu)%5E2

進而推出:

E%5B%5Cfrac%7B1%7D%7Bn%7D%5Csum_%7Bi%3D1%7D%5E%7Bn%7D(X_i-%5Coverline%7BX%7D)%5E2%5D%20%5Cleq%20E%5B%5Cfrac%7B1%7D%7Bn%7D%5Csum_%7Bi%3D1%7D%5E%7Bn%7D(X_i-%5Cmu)%5E2%5D%3D%5Csigma%5E2

如果用下面這個式子來估計:

S%5E2%3D%5Cfrac%7B1%7D%7Bn%7D%5Csum_%7Bi%3D1%7D%5E%7Bn%7D(X_i-%5Coverline%7BX%7D)%5E2

那么S%5E2采樣均值會服從一個偏離1.4%5E2的正態(tài)分布:

可見,此分布傾向于低估%5Csigma%5E2

具體小了多少,我們可以來算下:

%7B%5Cdisplaystyle%20%7B%5Cbegin%7Baligned%7D%5Coperatorname%20%7BE%7D%20%5BS%5E%7B2%7D%5D%26%3D%5Coperatorname%20%7BE%7D%20%5Cleft%5B%7B%5Cfrac%20%7B1%7D%7Bn%7D%7D%5Csum%20_%7Bi%3D1%7D%5E%7Bn%7D%7B%5Cbig%20(%7DX_%7Bi%7D-%7B%5Coverline%20%7BX%7D%7D%7B%5Cbig%20)%7D%5E%7B2%7D%5Cright%5D%3D%5Coperatorname%20%7BE%7D%20%7B%5Cbigg%20%5B%7D%7B%5Cfrac%20%7B1%7D%7Bn%7D%7D%5Csum%20_%7Bi%3D1%7D%5E%7Bn%7D%7B%5Cbigg%20(%7D(X_%7Bi%7D-%5Cmu%20)-(%7B%5Coverline%20%7BX%7D%7D-%5Cmu%20)%7B%5Cbigg%20)%7D%5E%7B2%7D%7B%5Cbigg%20%5D%7D%5C%5C%5B8pt%5D%26%3D%5Coperatorname%20%7BE%7D%20%7B%5Cbigg%20%5B%7D%7B%5Cfrac%20%7B1%7D%7Bn%7D%7D%5Csum%20_%7Bi%3D1%7D%5E%7Bn%7D%7B%5Cbigg%20(%7D(X_%7Bi%7D-%5Cmu%20)%5E%7B2%7D-2(%7B%5Coverline%20%7BX%7D%7D-%5Cmu%20)(X_%7Bi%7D-%5Cmu%20)%2B(%7B%5Coverline%20%7BX%7D%7D-%5Cmu%20)%5E%7B2%7D%7B%5Cbigg%20)%7D%7B%5Cbigg%20%5D%7D%5C%5C%5B8pt%5D%26%3D%5Coperatorname%20%7BE%7D%20%7B%5Cbigg%20%5B%7D%7B%5Cfrac%20%7B1%7D%7Bn%7D%7D%5Csum%20_%7Bi%3D1%7D%5E%7Bn%7D(X_%7Bi%7D-%5Cmu%20)%5E%7B2%7D-%7B%5Cfrac%20%7B2%7D%7Bn%7D%7D(%7B%5Coverline%20%7BX%7D%7D-%5Cmu%20)%5Csum%20_%7Bi%3D1%7D%5E%7Bn%7D(X_%7Bi%7D-%5Cmu%20)%2B%7B%5Cfrac%20%7B1%7D%7Bn%7D%7D(%7B%5Coverline%20%7BX%7D%7D-%5Cmu%20)%5E%7B2%7D%5Csum%20_%7Bi%3D1%7D%5E%7Bn%7D1%7B%5Cbigg%20%5D%7D%5C%5C%5B8pt%5D%26%3D%5Coperatorname%20%7BE%7D%20%7B%5Cbigg%20%5B%7D%7B%5Cfrac%20%7B1%7D%7Bn%7D%7D%5Csum%20_%7Bi%3D1%7D%5E%7Bn%7D(X_%7Bi%7D-%5Cmu%20)%5E%7B2%7D-%7B%5Cfrac%20%7B2%7D%7Bn%7D%7D(%7B%5Coverline%20%7BX%7D%7D-%5Cmu%20)%5Csum%20_%7Bi%3D1%7D%5E%7Bn%7D(X_%7Bi%7D-%5Cmu%20)%2B%7B%5Cfrac%20%7B1%7D%7Bn%7D%7D(%7B%5Coverline%20%7BX%7D%7D-%5Cmu%20)%5E%7B2%7D%5Ccdot%20n%7B%5Cbigg%20%5D%7D%5C%5C%5B8pt%5D%26%3D%5Coperatorname%20%7BE%7D%20%7B%5Cbigg%20%5B%7D%7B%5Cfrac%20%7B1%7D%7Bn%7D%7D%5Csum%20_%7Bi%3D1%7D%5E%7Bn%7D(X_%7Bi%7D-%5Cmu%20)%5E%7B2%7D-%7B%5Cfrac%20%7B2%7D%7Bn%7D%7D(%7B%5Coverline%20%7BX%7D%7D-%5Cmu%20)%5Csum%20_%7Bi%3D1%7D%5E%7Bn%7D(X_%7Bi%7D-%5Cmu%20)%2B(%7B%5Coverline%20%7BX%7D%7D-%5Cmu%20)%5E%7B2%7D%7B%5Cbigg%20%5D%7D%5C%5C%5B8pt%5D%5Cend%7Baligned%7D%7D%7D%0A

其中:

%7B%5Cdisplaystyle%20%7B%5Cbegin%7Baligned%7D%7B%5Coverline%20%7BX%7D%7D-%5Cmu%20%3D%7B%5Cfrac%20%7B1%7D%7Bn%7D%7D%5Csum%20_%7Bi%3D1%7D%5E%7Bn%7DX_%7Bi%7D-%5Cmu%20%3D%7B%5Cfrac%20%7B1%7D%7Bn%7D%7D%5Csum%20_%7Bi%3D1%7D%5E%7Bn%7DX_%7Bi%7D-%7B%5Cfrac%20%7B1%7D%7Bn%7D%7D%5Csum%20_%7Bi%3D1%7D%5E%7Bn%7D%5Cmu%20%5C%20%3D%7B%5Cfrac%20%7B1%7D%7Bn%7D%7D%5Csum%20_%7Bi%3D1%7D%5E%7Bn%7D(X_%7Bi%7D-%5Cmu%20).%5C%5C%5B8pt%5D%5Cend%7Baligned%7D%7D%7D%0A

所以我們接著算下去:

%7B%5Cdisplaystyle%20%7B%5Cbegin%7Baligned%7D%5Coperatorname%20%7BE%7D%20%5BS%5E%7B2%7D%5D%26%3D%5Coperatorname%20%7BE%7D%20%7B%5Cbigg%20%5B%7D%7B%5Cfrac%20%7B1%7D%7Bn%7D%7D%5Csum%20_%7Bi%3D1%7D%5E%7Bn%7D(X_%7Bi%7D-%5Cmu%20)%5E%7B2%7D-%7B%5Cfrac%20%7B2%7D%7Bn%7D%7D(%7B%5Coverline%20%7BX%7D%7D-%5Cmu%20)%5Csum%20_%7Bi%3D1%7D%5E%7Bn%7D(X_%7Bi%7D-%5Cmu%20)%2B(%7B%5Coverline%20%7BX%7D%7D-%5Cmu%20)%5E%7B2%7D%7B%5Cbigg%20%5D%7D%5C%5C%5B8pt%5D%26%3D%5Coperatorname%20%7BE%7D%20%7B%5Cbigg%20%5B%7D%7B%5Cfrac%20%7B1%7D%7Bn%7D%7D%5Csum%20_%7Bi%3D1%7D%5E%7Bn%7D(X_%7Bi%7D-%5Cmu%20)%5E%7B2%7D-%7B%5Cfrac%20%7B2%7D%7Bn%7D%7D(%7B%5Coverline%20%7BX%7D%7D-%5Cmu%20)%5Ccdot%20n%5Ccdot%20(%7B%5Coverline%20%7BX%7D%7D-%5Cmu%20)%2B(%7B%5Coverline%20%7BX%7D%7D-%5Cmu%20)%5E%7B2%7D%7B%5Cbigg%20%5D%7D%5C%5C%5B8pt%5D%26%3D%5Coperatorname%20%7BE%7D%20%7B%5Cbigg%20%5B%7D%7B%5Cfrac%20%7B1%7D%7Bn%7D%7D%5Csum%20_%7Bi%3D1%7D%5E%7Bn%7D(X_%7Bi%7D-%5Cmu%20)%5E%7B2%7D-2(%7B%5Coverline%20%7BX%7D%7D-%5Cmu%20)%5E%7B2%7D%2B(%7B%5Coverline%20%7BX%7D%7D-%5Cmu%20)%5E%7B2%7D%7B%5Cbigg%20%5D%7D%5C%5C%5B8pt%5D%26%3D%5Coperatorname%20%7BE%7D%20%7B%5Cbigg%20%5B%7D%7B%5Cfrac%20%7B1%7D%7Bn%7D%7D%5Csum%20_%7Bi%3D1%7D%5E%7Bn%7D(X_%7Bi%7D-%5Cmu%20)%5E%7B2%7D-(%7B%5Coverline%20%7BX%7D%7D-%5Cmu%20)%5E%7B2%7D%7B%5Cbigg%20%5D%7D%5C%5C%5B8pt%5D%26%3D%5Coperatorname%20%7BE%7D%20%7B%5Cbigg%20%5B%7D%7B%5Cfrac%20%7B1%7D%7Bn%7D%7D%5Csum%20_%7Bi%3D1%7D%5E%7Bn%7D(X_%7Bi%7D-%5Cmu%20)%5E%7B2%7D%7B%5Cbigg%20%5D%7D-%5Coperatorname%20%7BE%7D%20%7B%5Cbigg%20%5B%7D(%7B%5Coverline%20%7BX%7D%7D-%5Cmu%20)%5E%7B2%7D%7B%5Cbigg%20%5D%7D%5C%5C%5B8pt%5D%26%3D%5Csigma%20%5E%7B2%7D-%5Coperatorname%20%7BE%7D%20%5Cleft%5B(%7B%5Coverline%20%7BX%7D%7D-%5Cmu%20)%5E%7B2%7D%5Cright%5D%5Cend%7Baligned%7D%7D%7D

其中:

%0A%7B%5Cdisplaystyle%20%5Coperatorname%20%7BE%7D%20%7B%5Cbig%20%5B%7D(%7B%5Coverline%20%7BX%7D%7D-%5Cmu%20)%5E%7B2%7D%7B%5Cbig%20%5D%7D%3D%7B%5Cfrac%20%7B1%7D%7Bn%7D%7D%5Csigma%20%5E%7B2%7D.%7D%0A

所以:

E%5B%5Cfrac%7B1%7D%7Bn%7D%5Csum_%7Bi%3D1%7D%5E%7Bn%7D(X_i-%5Coverline%7BX%7D)%5E2%5D%3D%5Csigma%5E%7B2%7D-%7B%5Cfrac%20%7B1%7D%7Bn%7D%7D%5Csigma%5E%7B2%7D%3D%5Cfrac%7Bn-1%7D%7Bn%7D%5Csigma%5E%7B2%7D

也就是說,低估了%5Cdisplaystyle%7B%5Cfrac%20%7B1%7D%7Bn%7D%7D%5Csigma%5E%7B2%7D,進行一下調(diào)整:

%5Cfrac%7Bn%7D%7Bn-1%7DE%5B%5Cfrac%7B1%7D%7Bn%7D%5Csum_%7Bi%3D1%7D%5E%7Bn%7D(X_i-%5Coverline%7BX%7D)%5E2%5D%3DE%5B%5Cfrac%7B1%7D%7Bn-1%7D%5Csum_%7Bi%3D1%7D%5E%7Bn%7D(X_i-%5Coverline%7BX%7D)%5E2%5D%3D%5Csigma%5E%7B2%7D

因此使用下面這個式子進行估計,得到的就是無偏估計:

S%5E2%3D%5Cfrac%7B1%7D%7Bn-1%7D%5Csum_%7Bi%3D1%7D%5E%7Bn%7D(X_i-%5Coverline%7BX%7D)%5E2


更多內(nèi)容請關(guān)注:馬同學圖解數(shù)學





為什么樣本方差(sample variance)的分母是 n-1?的評論 (共 條)

分享到微博請遵守國家法律
天镇县| 花垣县| 高邮市| 浑源县| 固原市| 巴彦县| 郑州市| 辉县市| 九江市| 云南省| 乌苏市| 遵化市| 鹿泉市| 乌鲁木齐市| 甘孜| 新郑市| 隆子县| SHOW| 门源| 射洪县| 临沂市| 杭锦旗| 策勒县| 江门市| 仪征市| 遂宁市| 吉木萨尔县| 登封市| 东兰县| 西乌珠穆沁旗| 石景山区| 得荣县| 霍林郭勒市| 延川县| 芜湖县| 安西县| 朝阳县| 安仁县| 财经| 乐安县| 普安县|