R語言參數(shù)檢驗(yàn) :需要多少樣本?如何選擇樣本數(shù)量
原文:http://tecdat.cn/?p=3719
?
參數(shù)檢驗(yàn)受制于數(shù)據(jù)屬性的假設(shè)。例如,學(xué)生t檢驗(yàn)是眾所周知的參數(shù)檢驗(yàn),假設(shè)樣本均值具有正態(tài)分布。由于中心極限定理,如果樣本量足夠,測試也可以應(yīng)用于非正態(tài)分布的測量。在這里,我們將研究t檢驗(yàn)有效所需的大致樣本數(shù)。
將正態(tài)分布擬合到采樣均值
為了研究滿足學(xué)生t檢驗(yàn)要求所需的樣本數(shù)量,我們迭代各種樣本量。對于每個(gè)樣本大小,我們從幾個(gè)分布中抽取樣本。然后,計(jì)算樣本的平均值,并將正態(tài)分布擬合到平均值的分布。在每次迭代中,我們記錄描述正態(tài)分布與采樣均值擬合程度的對數(shù)似然。當(dāng)對數(shù)似然變?yōu)檎龝r(shí),我們將考慮采樣均值接近正態(tài)分布。
記錄擬合的概率
調(diào)查結(jié)果,我們可以看到一些分布似乎比其他分布更快地接近正態(tài)分布:
print(result)
## ? Sample_Size ? ? ?Beta ? ? Normal ? ? ? ?Chi ? ?Poisson ? Student
## 1 ? ? ? ? ? 5 ?694.9139 -299.81161 -496.33474 -702.94076 -1971.203
## 2 ? ? ? ? ?10 ?823.0384 -126.68806 -297.08253 -515.18702 -3806.447
## 3 ? ? ? ? ?15 ?909.4417 ?-30.63266 -199.77525 -455.64737 -2119.944
## 4 ? ? ? ? ?20 1045.1414 ? 46.45709 -136.21868 -375.75690 -2263.025
## 5 ? ? ? ? ?50 1235.7655 ?278.66189 ? 84.44694 -117.56140 -3427.721
## 6 ? ? ? ? 100 1397.7265 ?443.81523 ?281.68706 ? 47.87537 -2178.871
## 7 ? ? ? ?1000 1996.2198 1019.70692 ?845.26837 ?619.25871 -3636.674
## 8 ? ? ? ?5000 2398.4267 1402.41433 1260.47873 1018.24454 -3231.983
根據(jù)正對數(shù)似然,β分布產(chǎn)生的正態(tài)分布均值已經(jīng)為5的樣本大小。正態(tài)分布,卡方分布和泊松分布在樣本大小分別為20,50和100時(shí)產(chǎn)生正態(tài)分布均值。最后,學(xué)生分布的方式永遠(yuǎn)不會正常,因?yàn)榫哂幸粋€(gè)自由度的分布具有無限的峰度(非常重的尾部),使得中心極限定理不成立。
驗(yàn)證對數(shù)似然標(biāo)準(zhǔn)
作為結(jié)果的驗(yàn)證,讓我們繪制樣本大小為5的直方圖和平均分布變?yōu)檎5臉颖敬笮。?/p>
plot.means(norm.means)

這些結(jié)果表明對數(shù)似然準(zhǔn)則是正態(tài)性的充分代理。但請注意,從目視檢查來看,平均值的初始貝塔分布似乎不比正態(tài)分布更正常。所以這個(gè)結(jié)果可能是用一粒鹽??纯磳W(xué)生的t分布,我們可以看出為什么它的手段不是正態(tài)分布的:
round(quantile(means$Student), 2)
## ? ? ?0% ? ? 25% ? ? 50% ? ? 75% ? ?100%
## -495.61 ? -0.95 ? ?0.00 ? ?0.98 3422.66
對于一些樣本,平均分布在分布的兩個(gè)尾部具有極端異常值。
結(jié)論
這些實(shí)驗(yàn)的結(jié)果表明,對于小于20的樣本,絕對應(yīng)該避免學(xué)生t檢驗(yàn)。當(dāng)樣本量至少為100時(shí),大多數(shù)分布似乎都滿足了測試的假設(shè)。?
總之,特別建議檢查樣本大小低于100的測量分布。由于中心極限定理不適用于具有無窮方差的分布,因此驗(yàn)證大樣本大小的測量分布也是合理的。排除這種分配的可能性。正如我們在這里看到的,即使在5000的樣本大小下,根據(jù)具有一個(gè)自由度的t分布分布的測量也不滿足測試的假設(shè)。
?
?
非常感謝您閱讀本文,有任何問題請?jiān)谙旅媪粞裕?/h1>
請選中你要保存的內(nèi)容,粘貼到此文本框