最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

【微科普】數(shù)字會(huì)騙人嗎?(1)

2020-04-17 19:36 作者:景育  | 我要投稿

(本文主要適用于中學(xué)生)

《晏子春秋》有云:“橘生淮南則為橘,生于淮北則為枳。”這一諺語(yǔ)膾炙人口,揭示了事物因外部條件的差異,結(jié)果也產(chǎn)生了差異。

王老板是林果承包商,一日他聽(tīng)聞?dòng)心撤N新型品種的水果很受歡迎。在經(jīng)過(guò)市場(chǎng)調(diào)研后,他發(fā)現(xiàn)主要消費(fèi)人群主要分布在東北與華南。為了縮減水果的供應(yīng)鏈,他決定在南方和北方分別試種植兩種水果。正如“橘生淮南則為橘,生于淮北則為枳?!彼疲蚕雽?duì)生長(zhǎng)在不同地理環(huán)境下水果的差異進(jìn)行研究。他選擇控制

到了秋收,他在他的兩個(gè)果園各取20個(gè)樣本,統(tǒng)計(jì)水果的質(zhì)量(單位:千克),列表如下:

兩個(gè)果園水果樣本的質(zhì)量(單位:kg)

通過(guò)小學(xué)老師教過(guò)的計(jì)算方法,可以計(jì)算出兩個(gè)果園的平均水果質(zhì)量,南果園2.01 kg,北果園2.10 kg,二者相差0.09 kg。直觀地看,王老板覺(jué)得北果園更適合這種水果的生長(zhǎng)。他的判斷妥當(dāng)嗎?

現(xiàn)在,我們對(duì)南、北果園的標(biāo)準(zhǔn)差進(jìn)行計(jì)算。南果園0.183 kg,北果園0.199?kg,兩者“比較接近”??傮w的標(biāo)準(zhǔn)差0.197 kg。無(wú)論是分別的標(biāo)準(zhǔn)差,還是總體的標(biāo)準(zhǔn)差,都比剛剛計(jì)算出的北果園比南果園平均質(zhì)量多0.09 kg大。

不進(jìn)行規(guī)范地?cái)?shù)學(xué)推導(dǎo),僅直觀地感受,標(biāo)準(zhǔn)差大致在0.18~0.20 kg的范圍,而兩者平均質(zhì)量的差異只有0.09 kg,這么說(shuō)來(lái),似乎王老板的判斷有些欠妥

我們現(xiàn)在對(duì)幾組數(shù)據(jù)的“離差平方和”進(jìn)行計(jì)算和分析。

所謂離差平方和,指的是對(duì)數(shù)據(jù)組中每一個(gè)數(shù)據(jù),和它們的平均值作差,然后將差取平方,再加起來(lái)。例如數(shù)據(jù)1、2、3,它們的平均值是2,離差分別是-1、0、1,再取平方則是1、0 、1,那么離差平方和是1+0+1=2 。

計(jì)算得南果園二十個(gè)樣本的離差平方和為0.67 kg2,北果園二十個(gè)樣本的離差平方和為0.79 kg2,而把四十個(gè)樣本一起考慮,得到的離差平方和為1.55 kg2 。

有人會(huì)問(wèn),0.67 + 0.79 = 1.46 ≠ 1.55,那么,多出來(lái)的0.09 kg2到哪里去了呢?

這0.09 kg2則是兩組之間的離差平方和。上文我們計(jì)算得出了“南果園平均0.183 kg,北果園平均0.199?kg”,而0.183?kg和0.199?kg的離差平方和是0.0046?kg2,考慮到兩個(gè)果園各有20個(gè)樣本,將0.0046?kg2乘以20,得到約0.09?kg2,恰好是“少掉的”那些離差平方和。

就這樣,我們可以列出下表:

南果園 —— 0.67 kg2

北果園 ——?0.79 kg2

兩者之間 ——?0.09?kg2

總體上 ——?1.55 kg2?

由此可見(jiàn),兩者之間的差異比較小,兩組各自?xún)?nèi)部的差異比較大。總體上的差異,主要來(lái)自于兩者內(nèi)部,而不是兩者之間。

在本文的第一部分,我們介紹了王老板的猜想。在本文的第二部分,我們通過(guò)比較標(biāo)準(zhǔn)差,發(fā)覺(jué)組內(nèi)標(biāo)準(zhǔn)差大于組間的差值,從而認(rèn)為王老板的猜想不妥。在本文的第三部分,我們又通過(guò)比較組內(nèi)離差平方和與組間離差平方和的方法,認(rèn)為總體上的差異主要來(lái)自?xún)烧邇?nèi)部,而不是兩者之間。

但是,上面的方法主要是定性的判斷,有沒(méi)有一種更準(zhǔn)確、更合理的判斷方法呢?

這里需要用到的方法稱(chēng)為“T檢驗(yàn)”,T檢驗(yàn)的步驟是根據(jù)已有的數(shù)據(jù),計(jì)算得出一個(gè)t值,用t值與查表得到的t臨界值進(jìn)行比較,則可以判斷“兩者的組間差異顯著不顯著”這個(gè)問(wèn)題。

t值的計(jì)算公式這里不列,具體的推導(dǎo)過(guò)程也略去不寫(xiě),有興趣的朋友可以在參考資料中找到推導(dǎo)、證明與計(jì)算過(guò)程。

本文以Excel為例,使用Excel的功能自動(dòng)計(jì)算t值與t的臨界值。免去了手工計(jì)算的麻煩。

Excel截圖

首先,需要確保Excel啟動(dòng)了“分析工具庫(kù)”,可以單擊左上角“文件”按鈕,再單擊“選項(xiàng)”,在“Excel 選項(xiàng)”窗口中,選擇“加載項(xiàng)”頁(yè)面,然后找到“分析工具庫(kù)”,啟動(dòng)它。

確保啟動(dòng)“分析工具庫(kù)”

然后,在“數(shù)據(jù)”選項(xiàng)卡,使用“數(shù)據(jù)分析”。

在分析工具中選擇“t-檢驗(yàn):雙樣本異方差假設(shè)”

在彈出的窗口中,將變量1、變量2的區(qū)域分別選擇南、北果園,并且選擇“標(biāo)志”,顯著性水平α可以是默認(rèn)的0.05

這樣,能夠得到一張計(jì)算得到的結(jié)果表格。

從表格的t Stat一欄我們可以看出,計(jì)算得到的t值為-1.55,取絕對(duì)值之后便是1.55,而t的雙尾臨界為2.02,將t值與t的臨界值進(jìn)行比較:

1.55<2.02

便得出結(jié)論:兩組之間平均值的差異不顯著。

本文第四段的方法,是“假設(shè)-檢驗(yàn)”法的一種。第四段用了相對(duì)平易的語(yǔ)言來(lái)描述,如果規(guī)范一點(diǎn),則是:

小結(jié):本文的標(biāo)題為“數(shù)字會(huì)騙人嗎?”,如果閱讀完了全文,應(yīng)該可以體會(huì)到:簡(jiǎn)單地根據(jù)數(shù)據(jù)進(jìn)行比較、直觀地判斷有時(shí)候會(huì)得到欠妥的結(jié)論。本文的例子中說(shuō)明,雖然北果園的平均質(zhì)量比南果園大,但是這一差異主要來(lái)自于果園內(nèi)部,而非果園之間。

習(xí)題1:歌姬甲和歌姬乙最近三個(gè)月的投稿數(shù)統(tǒng)計(jì)如下(數(shù)據(jù)為虛構(gòu)):

歌姬甲和歌姬乙最近三個(gè)月的投稿數(shù)

歌姬甲每個(gè)月的投稿數(shù)都比歌姬乙多,平均每月的投稿數(shù)也比乙多,請(qǐng)問(wèn)能說(shuō)明“甲的投稿數(shù)顯著多于乙”嗎?(α取0.05)

習(xí)題2:某人對(duì)30位UP主進(jìn)行調(diào)查,播放量取投稿后120小時(shí)時(shí)的播放量,統(tǒng)計(jì)結(jié)果如下圖所示。(數(shù)據(jù)為虛構(gòu))

直觀地看,從12月開(kāi)始,連續(xù)三個(gè)月都“同比增長(zhǎng)”,因而得出判斷“這30位UP主的播放量在顯著增長(zhǎng)”,請(qǐng)問(wèn)這個(gè)判斷妥當(dāng)嗎?(α取0.05)

參考文獻(xiàn):

① 機(jī)械工業(yè)出版社,宗序平《概率論與數(shù)理統(tǒng)計(jì)》第八章“假設(shè)檢驗(yàn)”

② 化學(xué)工業(yè)出版社,李云雁等《試驗(yàn)設(shè)計(jì)與數(shù)據(jù)處理》第三章“試驗(yàn)的方差分析”

【微科普】數(shù)字會(huì)騙人嗎?(1)的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
梓潼县| 凯里市| 宜昌市| 云南省| 荥阳市| 陵川县| 涞源县| 余干县| 无为县| 黔西| 西峡县| 锡林浩特市| 大冶市| 澳门| 平安县| 平舆县| 石台县| 高安市| 红河县| 太仓市| 阳原县| 宁城县| 龙海市| 台南市| 武清区| 兴海县| 赫章县| 富阳市| 凤凰县| 宁陕县| 芦山县| 天镇县| 衡阳市| 巴中市| 呼伦贝尔市| 和林格尔县| 玉林市| 福鼎市| 贵港市| 微博| 陇南市|