【十分鐘速成課:統(tǒng)計(jì)學(xué)】第20集 置信區(qū)間

置信區(qū)間:允許一些搖擺,某個(gè)事件范圍內(nèi),大約
95%的置信度 置信區(qū)間 給予我們的觀測(cè)結(jié)果給出的合力軌跡范圍值,它的中心讓然是樣本均值,但預(yù)留了一些空間 不確定性 100名患者的樣本 樣本均值的分布
提供一個(gè)均值數(shù)字范圍而不是某一個(gè)確切的均值值
學(xué)會(huì)假設(shè) 有所變化 再次抽樣 相同樣本量重新做100次,我們將會(huì)得到100個(gè)略有不同的置信區(qū)間,
95%置信區(qū)間的數(shù)字95%告訴我們,如果我們從100個(gè)不同的樣本中計(jì)算置信區(qū)間,其中約95個(gè)將包含真實(shí)的總本均值,我們的“信心”在于計(jì)算這個(gè)置信區(qū)間的過程中,只會(huì)在5%的時(shí)間里沒有將總本均值包含進(jìn)來, 也可以包含不真實(shí)的值,我們無法得到絕對(duì)的值,DNA置信區(qū)間 通常情況下會(huì)包含真實(shí)的總本均值,
計(jì)算:95%指的是包含我們估計(jì)的采樣分不止的中間95%的范圍,為了得到該范圍,我們可以得到Z分?jǐn)?shù),Z分位數(shù)可以告訴我們以標(biāo)準(zhǔn)差為單位的分布均值和數(shù)據(jù)點(diǎn)之間的距離,以前我們用Z分位數(shù)找到百分位數(shù),我們想要中間95%的數(shù)據(jù),標(biāo)準(zhǔn)差誤差 標(biāo)準(zhǔn)差除以根號(hào)下頻數(shù)轉(zhuǎn)回卡路里值,Z分位數(shù)*標(biāo)準(zhǔn)誤差加上平均值 實(shí)際的總本均值在這個(gè)區(qū)間內(nèi),但我們不確定,不過我們可以確定的是如果我們不斷取樣,并假設(shè)每一個(gè)置信區(qū)間都包含總本均值,我們只會(huì)在5%的情況下出錯(cuò),例如一個(gè)膠皮糖工廠會(huì)定期檢查,他們的裝袋機(jī)是否校準(zhǔn)正確,因此他們每周采取100袋膠皮糖的樣本,測(cè)量平均重要和標(biāo)準(zhǔn)差,并計(jì)算95%置信區(qū)間,他們使用置信區(qū)間來決定是否支付高昂的費(fèi)用來請(qǐng)維修工來修膠皮糖套袋機(jī),他們期待膠皮糖大約每袋重十盎司,并且只要置信區(qū)間包含這個(gè)數(shù)據(jù),他們的理想重量,他們就假設(shè)他們的機(jī)器沒有問題,給予他們的置信區(qū)間所做的決定將幫助他們只在5%的情況下不需要請(qǐng)維修工的時(shí)候來請(qǐng)維修工,
研究者使用置信區(qū)間來確定是否包含一些有價(jià)值的信息,比如蛋糕中某卡路里的含量是否是合理的,如果采樣值落在他們的置信區(qū)間內(nèi),似乎這是一個(gè)合理的值,但若采樣值落在置信區(qū)間外,我們也不能說不合理,因?yàn)槲覀儾恢肋@個(gè)置信區(qū)間是那95%個(gè)包含真實(shí)總本均值的置信區(qū)間,還是那5%個(gè)沒包含的,并不總是需要使用95%的置信區(qū)間,我們也可以計(jì)算其他百分比的置信區(qū)間,但 到負(fù)無窮,這你想要的置信區(qū)間包含的百分比越大,你的數(shù)字范圍會(huì)越寬。這種情況下,你可以更自信地說你的置信區(qū)間包含真正的總本均值,但這沒有太大的意義,因此你需要做出取舍,你想要一個(gè)足夠宅的置信區(qū)間,足夠窄到令其結(jié)果有意義,你也想要一個(gè)足夠?qū)挼闹眯艆^(qū)間,足夠?qū)挼酱蟛糠智闆r下包括總本均值,我們不會(huì)總有很大數(shù)據(jù)量的樣本,通常情況下,我們沒有足夠的時(shí)間和金錢去收集100個(gè)數(shù)據(jù)點(diǎn)來計(jì)算置信區(qū)間,樣本量較小時(shí),樣本均值分布并不總是正態(tài)的,所以我們金蟬使用T分布而不是Z分布來找出數(shù)據(jù)中間的95%,與Z分布一樣,T分布式單峰的連續(xù)的概率分布,是表示采樣分布的一個(gè)好方法,t分布根據(jù)信息數(shù)量改變形狀,樣本量較小,信息較少時(shí),t分布的尾部較粗,表示當(dāng)沒有太多數(shù)據(jù)時(shí)我們的估計(jì)更不確定,然而,隨著我們獲得越來也多的數(shù)據(jù),t分布變得與z分布相同,通常,大于30的樣本被認(rèn)為是“足夠大”,科學(xué)家普遍認(rèn)為樣本為30+的樣本分布是足夠接近正態(tài)的,30這個(gè)數(shù)字并沒有什么特殊的含義,就像0.05.但是,當(dāng)我們估算總本比例時(shí),例如色盲人口的總本比例時(shí),通常情況下,你的樣本容量必須足夠大,平均而言,你期望得到至少10個(gè)色盲人和至少10個(gè)非色盲人,因此大多數(shù)人認(rèn)為這“足夠接近”,約8%的男性是色盲,所以如果我又50個(gè)男性的樣本,我將期待每組平均大約有四名男性是色盲, 這時(shí)我的樣本量不足夠大到足以認(rèn)為這是正態(tài)的,所以,這里我會(huì)使用幾乎呈正態(tài)的t分布,如果某正在開發(fā)的藥物聲稱可以減少準(zhǔn)媽媽產(chǎn)下色盲男性的比例,我們可以采取50名男性嬰兒的樣本,看看色盲的比例是否是8%,雖然色盲通常不會(huì)危及生命,但它可能會(huì)帶來不便,所以你決定計(jì)算一個(gè)置信區(qū)間,以確定它是否有效,從服用該藥物的母親產(chǎn)下的嬰兒中隨機(jī)選擇50名男性嬰兒后,計(jì)算得出色盲嬰兒的樣本比例為6%,并計(jì)算有著6%均值(和樣本均值相同)和0.033標(biāo)準(zhǔn)差的樣本比例的分布,由于我們的樣本量不夠大,不能假設(shè)樣本比例的分布形狀像z分布,我們可以使用t分布來計(jì)算我們的95%的置信區(qū)間,我之前提過,t分布的形狀隨著我們擁有的數(shù)據(jù)量而變化,雖然存在t值表,但通常使用統(tǒng)計(jì)程序去計(jì)算,對(duì)應(yīng)于2.5和97.5百分位數(shù)的t值會(huì)更輕松,因?yàn)榇嬖诤芏嗖煌膖分布,電腦告訴你,與這些百分位數(shù)對(duì)應(yīng)的t值為2.01與-2.01,要從t分位數(shù)轉(zhuǎn)換為原始分?jǐn)?shù),我們?cè)俅问褂么斯剑?/p>

這里使用的是t分?jǐn)?shù)而不是z分?jǐn)?shù),色盲男性比例的置信區(qū)間是-0.6%至12.63%,8%在我們的置信區(qū)間捏,因此我們可以認(rèn)為8%可能是真實(shí)的人口比例,即使我們觀察到的人口比例是6%,去得出這個(gè)藥物是否有效的結(jié)論,根據(jù)這個(gè)置信區(qū)間,我們沒有足夠的證據(jù),因此研究藥物的公司非常謹(jǐn)慎,他們決定先放一放,現(xiàn)實(shí)生活中,置信區(qū)間的一個(gè)例子在選舉季節(jié)的新聞中,當(dāng)新聞播報(bào)員報(bào)告民意調(diào)查的結(jié)果時(shí),他們通常會(huì)說出這樣的話,“候選人A的選擇率為6.4%,誤差幅度為3%”,或者你可能會(huì)看到一個(gè)這樣的圖表,邊際誤差通常表示置信區(qū)間的兩邊距均值有多遠(yuǎn),并由置信公式這一部分表示:邊際誤差就像置信區(qū)間一樣,反映了樣本預(yù)測(cè)參數(shù),如平均值或比例的不確定性,如果民意調(diào)查現(xiàn)實(shí)總統(tǒng)候選人目前得到64%的選票,加上或減去3%,若事實(shí)證明真正的投票是61%,我們不應(yīng)該感到驚訝, 因?yàn)檫@是在邊際誤差范圍內(nèi),你可以將邊際誤差或置信區(qū)間內(nèi)的值視為,可能是真實(shí)總本參數(shù)的合理預(yù)測(cè)值,置信區(qū)間量化了我們的不確定性,還展示了準(zhǔn)確性和精度的權(quán)衡,100%置信區(qū)間總是包含真實(shí)的總本均值,但它沒太大用處,我們必須犧牲一點(diǎn)準(zhǔn)確性才能獲得更高的精度,99%的置信區(qū)間將為我們提供更有用的范圍,因?yàn)樗皇菬o限寬,但現(xiàn)在我們的置信區(qū)間可能不包含真正的平均值,你可能咋日常生活中遇到過這種平衡,假設(shè)你正在跑馬拉松(人人都愛馬拉松),同時(shí)你還想用你的iphone聽歌,但你不知道你要跑多久,你可以在ITunes上買150首歌,這很貴,或者只買70首歌,但有可能不夠聽,沒歌聽的風(fēng)險(xiǎn)就增加了,但是你省下了80首歌的錢,或許就能買碟看了,置信區(qū)間證明了這種微妙的平衡能力,并幫助我們理解如何達(dá)到信息與準(zhǔn)確性的最佳平衡點(diǎn),