最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

R語言參數(shù)檢驗(yàn) :需要多少樣本?如何選擇樣本數(shù)量

2020-11-24 13:20 作者:拓端tecdat  | 我要投稿

原文:http://tecdat.cn/?p=3719

?

參數(shù)檢驗(yàn)受制于數(shù)據(jù)屬性的假設(shè)。例如,學(xué)生t檢驗(yàn)是眾所周知的參數(shù)檢驗(yàn),假設(shè)樣本均值具有正態(tài)分布。由于中心極限定理,如果樣本量足夠,測試也可以應(yīng)用于非正態(tài)分布的測量。在這里,我們將研究t檢驗(yàn)有效所需的大致樣本數(shù)。

將正態(tài)分布擬合到采樣均值

為了研究滿足學(xué)生t檢驗(yàn)要求所需的樣本數(shù)量,我們迭代各種樣本量。對于每個(gè)樣本大小,我們從幾個(gè)分布中抽取樣本。然后,計(jì)算樣本的平均值,并將正態(tài)分布擬合到平均值的分布。在每次迭代中,我們記錄描述正態(tài)分布與采樣均值擬合程度的對數(shù)似然。當(dāng)對數(shù)似然變?yōu)檎龝r(shí),我們將考慮采樣均值接近正態(tài)分布。

記錄擬合的概率

調(diào)查結(jié)果,我們可以看到一些分布似乎比其他分布更快地接近正態(tài)分布:

print(result)

  1. ## ? Sample_Size ? ? ?Beta ? ? Normal ? ? ? ?Chi ? ?Poisson ? Student

  2. ## 1 ? ? ? ? ? 5 ?694.9139 -299.81161 -496.33474 -702.94076 -1971.203

  3. ## 2 ? ? ? ? ?10 ?823.0384 -126.68806 -297.08253 -515.18702 -3806.447

  4. ## 3 ? ? ? ? ?15 ?909.4417 ?-30.63266 -199.77525 -455.64737 -2119.944

  5. ## 4 ? ? ? ? ?20 1045.1414 ? 46.45709 -136.21868 -375.75690 -2263.025

  6. ## 5 ? ? ? ? ?50 1235.7655 ?278.66189 ? 84.44694 -117.56140 -3427.721

  7. ## 6 ? ? ? ? 100 1397.7265 ?443.81523 ?281.68706 ? 47.87537 -2178.871

  8. ## 7 ? ? ? ?1000 1996.2198 1019.70692 ?845.26837 ?619.25871 -3636.674

  9. ## 8 ? ? ? ?5000 2398.4267 1402.41433 1260.47873 1018.24454 -3231.983

根據(jù)正對數(shù)似然,β分布產(chǎn)生的正態(tài)分布均值已經(jīng)為5的樣本大小。正態(tài)分布,卡方分布和泊松分布在樣本大小分別為20,50和100時(shí)產(chǎn)生正態(tài)分布均值。最后,學(xué)生分布的方式永遠(yuǎn)不會正常,因?yàn)榫哂幸粋€(gè)自由度的分布具有無限的峰度(非常重的尾部),使得中心極限定理不成立。

驗(yàn)證對數(shù)似然標(biāo)準(zhǔn)

作為結(jié)果的驗(yàn)證,讓我們繪制樣本大小為5的直方圖和平均分布變?yōu)檎5臉颖敬笮。?/p>

plot.means(norm.means)

這些結(jié)果表明對數(shù)似然準(zhǔn)則是正態(tài)性的充分代理。但請注意,從目視檢查來看,平均值的初始貝塔分布似乎不比正態(tài)分布更正常。所以這個(gè)結(jié)果可能是用一粒鹽??纯磳W(xué)生的t分布,我們可以看出為什么它的手段不是正態(tài)分布的:

round(quantile(means$Student), 2)

  1. ## ? ? ?0% ? ? 25% ? ? 50% ? ? 75% ? ?100%

  2. ## -495.61 ? -0.95 ? ?0.00 ? ?0.98 3422.66

對于一些樣本,平均分布在分布的兩個(gè)尾部具有極端異常值。

結(jié)論

這些實(shí)驗(yàn)的結(jié)果表明,對于小于20的樣本,絕對應(yīng)該避免學(xué)生t檢驗(yàn)。當(dāng)樣本量至少為100時(shí),大多數(shù)分布似乎都滿足了測試的假設(shè)。?

總之,特別建議檢查樣本大小低于100的測量分布。由于中心極限定理不適用于具有無窮方差的分布,因此驗(yàn)證大樣本大小的測量分布也是合理的。排除這種分配的可能性。正如我們在這里看到的,即使在5000的樣本大小下,根據(jù)具有一個(gè)自由度的t分布分布的測量也不滿足測試的假設(shè)。

?

?

非常感謝您閱讀本文,有任何問題請?jiān)谙旅媪粞裕?/h1>

請選中你要保存的內(nèi)容,粘貼到此文本框


R語言參數(shù)檢驗(yàn) :需要多少樣本?如何選擇樣本數(shù)量的評論 (共 條)

分享到微博請遵守國家法律
蒙山县| 古丈县| 泸西县| 张掖市| 监利县| 平阴县| 麻栗坡县| 句容市| 福鼎市| 日照市| 新乡市| 宽甸| 阳曲县| 哈巴河县| 额济纳旗| 临夏市| 营口市| 石家庄市| 钟山县| 宝兴县| 龙胜| 毕节市| 清苑县| 常宁市| 垦利县| 巩义市| 泾源县| 神木县| 都江堰市| 来凤县| 治县。| 古交市| 象山县| 富平县| 南平市| 周口市| 巴林左旗| 会理县| 垫江县| 黎川县| 钟山县|