《教育統(tǒng)計(jì)學(xué)》復(fù)習(xí)題及答案
第一章 緒論
第一節(jié) 什么是統(tǒng)計(jì)學(xué)和心理統(tǒng)計(jì)學(xué)
一、什么是統(tǒng)計(jì)學(xué)
統(tǒng)計(jì)學(xué)是研究統(tǒng)計(jì)原理和方法的科學(xué)。具體地說,它是研究如何搜集、整理、分析反映事物總體信息的數(shù)字資料,并以此為依據(jù),對(duì)總體特征進(jìn)行推斷的原理和方法。
統(tǒng)計(jì)學(xué)分為兩大類。一類是數(shù)理統(tǒng)計(jì)學(xué)。它主要是以概率論為基礎(chǔ),對(duì)統(tǒng)計(jì)數(shù)據(jù)數(shù)量關(guān)系的模式加以解釋,對(duì)統(tǒng)計(jì)原理和方法給予數(shù)學(xué)的證明。它是數(shù)學(xué)的一個(gè)分支。另一類是應(yīng)用統(tǒng)計(jì)學(xué)。它是數(shù)理統(tǒng)計(jì)原理和方法在各個(gè)領(lǐng)域中的應(yīng)用,如數(shù)理統(tǒng)計(jì)的原理和方法應(yīng)用到工業(yè)領(lǐng)域,稱為工業(yè)統(tǒng)計(jì)學(xué);應(yīng)用到醫(yī)學(xué)領(lǐng)域,稱為醫(yī)學(xué)統(tǒng)計(jì)學(xué);應(yīng)用到心理學(xué)領(lǐng)域,稱為心理統(tǒng)計(jì)學(xué),等等。應(yīng)用統(tǒng)計(jì)學(xué)是與研究對(duì)象密切結(jié)合的各科專門統(tǒng)計(jì)學(xué)。
二、統(tǒng)計(jì)學(xué)和心理統(tǒng)計(jì)學(xué)的內(nèi)容
統(tǒng)計(jì)學(xué)和心理統(tǒng)計(jì)學(xué)的研究?jī)?nèi)容,從不同角度來分,可以分為不同的類型。從具體應(yīng)用的角度來分,可以分成描述統(tǒng)計(jì),推斷統(tǒng)計(jì)和實(shí)驗(yàn)設(shè)計(jì)三部分。
1.描述統(tǒng)計(jì)
對(duì)已獲得的數(shù)據(jù)進(jìn)行整理、概括,顯示其分布特征的統(tǒng)計(jì)方法,稱為描述統(tǒng)計(jì)。
2.推斷統(tǒng)計(jì)
根據(jù)樣本所提供的信息,運(yùn)用概率的理論進(jìn)行分析、論證,在一定可靠程度上,對(duì)總體分布特征進(jìn)行估計(jì)、推測(cè),這種統(tǒng)計(jì)方法稱為推斷統(tǒng)計(jì)。推斷統(tǒng)計(jì)的內(nèi)容包括總體參數(shù)估計(jì)和假設(shè)檢驗(yàn)兩部分。
3.實(shí)驗(yàn)設(shè)計(jì)
實(shí)驗(yàn)者為了揭示試驗(yàn)中自變量和因變量的關(guān)系,在實(shí)驗(yàn)之前所制定的實(shí)驗(yàn)計(jì)劃,稱為實(shí)驗(yàn)設(shè)計(jì)。其中包括選擇怎樣的抽樣方式;如何計(jì)算樣本容量;確定怎樣的實(shí)驗(yàn)對(duì)照形式;如何實(shí)現(xiàn)實(shí)驗(yàn)組和對(duì)照組的等組化;如何安排實(shí)驗(yàn)因素和如何控制無關(guān)因素;用什么統(tǒng)計(jì)方法處理及分析實(shí)驗(yàn)結(jié)果,等等。
以上三部分內(nèi)容,不是截然分開,而是相互聯(lián)系的。
第二節(jié) 統(tǒng)計(jì)學(xué)中的幾個(gè)基本概念
一、隨機(jī)變量
具有以下三個(gè)特性的現(xiàn)象,成為隨機(jī)變量。第一,一次試驗(yàn)有多中可能結(jié)果,其所有可能結(jié)果是已知的;第二,試驗(yàn)之前不能預(yù)料哪一種結(jié)果會(huì)出現(xiàn);第三,在相同的條件下可以重復(fù)試驗(yàn)。隨機(jī)現(xiàn)象的每一種結(jié)果叫做一個(gè)隨機(jī)事件。我們把能表示隨機(jī)現(xiàn)象各種結(jié)果的變量稱為隨機(jī)變量。統(tǒng)計(jì)處理的變量都是隨機(jī)變量。
二、總體和樣本
總體是我們所研究的具有共同特性的個(gè)體的總和??傮w中的每個(gè)單位成為個(gè)體。樣本是從總體中抽取的作為觀察對(duì)象的一部分個(gè)體。當(dāng)總體所包含的個(gè)數(shù)有限時(shí),這一總體稱為有限總體。而總體所包含的個(gè)數(shù)無限時(shí),則稱為無限總體。樣本中包含的個(gè)體數(shù)目稱為樣本的容量,一般用n來表示。一般來說,樣本中個(gè)體數(shù)目大于30稱為大樣本,等于或小于30稱為小樣本。在對(duì)數(shù)據(jù)進(jìn)行處理時(shí),大樣本和小樣本所用的統(tǒng)計(jì)方法不一定相同。
三、統(tǒng)計(jì)量和參數(shù)
樣本上的數(shù)據(jù)特征是統(tǒng)計(jì)量??傮w上的各種數(shù)字特征是參數(shù)。在進(jìn)行統(tǒng)計(jì)推斷時(shí),就是根據(jù)樣本統(tǒng)計(jì)量來推斷總體相應(yīng)的參數(shù)。
心理統(tǒng)計(jì)學(xué)大綱
第二章 數(shù)據(jù)的初步整理
第一節(jié) 數(shù)據(jù)的來源、種類及其分類
一、統(tǒng)計(jì)資料的來源
統(tǒng)計(jì)資料的來源有兩個(gè)方面:
1、經(jīng)常性資料
2、專題性資料 (1)調(diào)查資料 (2)實(shí)驗(yàn)資料
二、數(shù)據(jù)的種類
數(shù)據(jù)是隨機(jī)變量的觀察值。它是用來描述對(duì)客觀事物觀察測(cè)量的數(shù)值。數(shù)據(jù)的種類不同,統(tǒng)計(jì)處理的方法也不同。
根據(jù)統(tǒng)計(jì)數(shù)據(jù)來源可分為點(diǎn)計(jì)數(shù)據(jù)和度量數(shù)據(jù);按隨機(jī)變量取值情況,可分為間斷性隨機(jī)變量的數(shù)據(jù)和連續(xù)性隨機(jī)變量的數(shù)據(jù)。
1、點(diǎn)計(jì)數(shù)據(jù)和度量數(shù)據(jù)
點(diǎn)計(jì)數(shù)據(jù)是指計(jì)算個(gè)數(shù)所獲得的數(shù)據(jù)。度量數(shù)據(jù)是指用一定的工具或一定的標(biāo)準(zhǔn)測(cè)量所獲得的數(shù)據(jù)。
2、間斷性隨機(jī)變量的數(shù)據(jù)和連續(xù)性隨機(jī)變量的數(shù)據(jù)
取值個(gè)數(shù)有限的數(shù)據(jù),稱為間斷性隨機(jī)變量的數(shù)據(jù)。這種數(shù)據(jù)的單位是獨(dú)立的,兩個(gè)單位之間不能劃分成細(xì)小的單位,一般用整數(shù)表示。取值個(gè)數(shù)無限的(不可數(shù)的)數(shù)據(jù),稱為連續(xù)性隨機(jī)變量的數(shù)據(jù)。它們可能的取值范圍能連續(xù)充滿某一個(gè)區(qū)間。數(shù)據(jù)的單位之間可以再劃分成無限多個(gè)細(xì)小的單位。數(shù)據(jù)可以用小數(shù)表示。
三、數(shù)據(jù)的統(tǒng)計(jì)分類
數(shù)據(jù)的統(tǒng)計(jì)分類,是指按照研究對(duì)象的本質(zhì)特征,根據(jù)分析研究的目的、任務(wù),以及統(tǒng)計(jì)分析時(shí)所用統(tǒng)計(jì)方法的可能性,將所獲得的數(shù)據(jù)進(jìn)行分組歸類。它是對(duì)數(shù)據(jù)進(jìn)行歸納、整理、簡(jiǎn)化、概括的第一步,為進(jìn)一步分析研究打下基礎(chǔ)。
分類的標(biāo)志按形式劃分,可分為性質(zhì)類別和數(shù)量類別。性質(zhì)類別是按事物的不同性質(zhì)進(jìn)行分類。這種分類不表明事物之間的差異。性質(zhì)類別還可以進(jìn)一步分成不同的層次。數(shù)量類別是按數(shù)值大小進(jìn)行分類,并排成順序。在排列順序時(shí),可以直接按數(shù)值大小進(jìn)行排列,也可以用等級(jí)順序進(jìn)行排列。
第二節(jié) 統(tǒng)計(jì)表
一、統(tǒng)計(jì)表的結(jié)構(gòu)及其編制的原則和要求。
統(tǒng)計(jì)表一般由標(biāo)題、表號(hào)、標(biāo)目、線條、數(shù)字、表注等項(xiàng)構(gòu)成。
標(biāo)題 標(biāo)題是表的名稱,應(yīng)確切地、簡(jiǎn)明扼要地說明表的內(nèi)容。
表號(hào) 表號(hào)是表的序號(hào)。
標(biāo)目 標(biāo)目是表格中對(duì)統(tǒng)計(jì)數(shù)據(jù)分類的項(xiàng)目。
線條 線條不宜過多。
數(shù)字 表內(nèi)數(shù)字必須準(zhǔn)確,一律用阿拉伯?dāng)?shù)字表示,位次對(duì)齊,小數(shù)的位數(shù)一致。
表注 它不是表的必要組成部分。
二、統(tǒng)計(jì)表的總類
1、簡(jiǎn)單表
只列出觀察對(duì)象的名稱、地點(diǎn)、時(shí)序或統(tǒng)計(jì)指標(biāo)名稱的統(tǒng)計(jì)表為簡(jiǎn)單表。
2、分組表 只按一個(gè)標(biāo)志分組的統(tǒng)計(jì)表為分組表。
3、復(fù)合表 按兩個(gè)或兩個(gè)以上標(biāo)志分組的統(tǒng)計(jì)表為復(fù)合表。
三、頻數(shù)分布表列法
1、簡(jiǎn)單頻數(shù)分布表
(1)間斷變量的頻數(shù)分布表 (2)連續(xù)變量的頻數(shù)分布表
步驟:①求全距?、跊Q定組數(shù)和組距?、蹧Q定組限決定組限 ④登記頻數(shù)
2、累積頻數(shù)和累積百分比分布表
(1)累積頻數(shù)分布表 用累積頻數(shù)表示的頻數(shù)分布表稱為累積頻數(shù)分布表。
?。?)累積百分比分布表
累積百分比分布表是累積頻數(shù)分布表的變型。它是用累積百分比表示的頻數(shù)分布表。
第三節(jié) 統(tǒng)計(jì)圖
一、統(tǒng)計(jì)圖的結(jié)構(gòu)及其繪制規(guī)則
統(tǒng)計(jì)圖由標(biāo)題、圖號(hào)、標(biāo)目、圖形、圖注等項(xiàng)構(gòu)成。下面按其構(gòu)成部分說明繪圖的基本規(guī)則。
標(biāo)題 圖的名稱應(yīng)簡(jiǎn)明扼要,切合圖的內(nèi)容,必要時(shí)可注明時(shí)間、地點(diǎn)。
圖號(hào) 文章中若有幾幅畫,則需按其出現(xiàn)的先后次序編上序號(hào),寫在圖題的作前方。
標(biāo)目 對(duì)于有縱橫軸的統(tǒng)計(jì)圖,應(yīng)在縱橫軸上分別標(biāo)明統(tǒng)計(jì)項(xiàng)目及其尺度。
圖形 圖形線在圖中為最粗,而且要清晰。
圖注 圖注不是圖中必要組成部分。
二、表示間斷變量的統(tǒng)計(jì)圖
1、直條圖
直條圖是用直條的長(zhǎng)短表示統(tǒng)計(jì)事項(xiàng)數(shù)量的圖形。它主要是用來比較性質(zhì)相似的間斷性資料。
2、圓形圖
圓形圖是用來表示間斷性資料構(gòu)成比的圖形。
三、表示連續(xù)變量的統(tǒng)計(jì)圖
1、線形圖
線形圖用來表示連續(xù)性資料。它能表示兩個(gè)變量之間的函數(shù)關(guān)系;一種事物隨另一種事物變化的情況;某種事物隨時(shí)間推移的發(fā)展趨勢(shì)等。
2、頻數(shù)分布圖
常用的頻數(shù)分布圖有直方圖、多邊圖和累積多邊圖。
?。?)直方圖
直方圖用面積表示頻數(shù)分布。用各組上下限上的矩形面積表示各組頻數(shù)。
?。?)多邊圖
多邊圖以縱軸上的高度表示頻數(shù)的多少。
?。?)累積頻數(shù)和累積百分比多邊圖
第三章 集中量
集中量是代表一組數(shù)據(jù)典型水平或幾種趨勢(shì)的量。它能反映頻數(shù)分布中大量數(shù)據(jù)向某一點(diǎn)集中的情況。
第一節(jié) 算術(shù)平均數(shù)
一、算術(shù)平均數(shù)的概念
算術(shù)平均數(shù)是所有觀察值得總和除以總頻數(shù)所得之商,簡(jiǎn)稱為平均數(shù)或均數(shù)。計(jì)算公式為(3.1)。
算術(shù)平均數(shù)的特征:
(1)觀察值的總和等于算術(shù)平均數(shù)的N倍;
?。?)各觀察值與其算術(shù)平均數(shù)之差的總和等于零;
?。?)若一組觀察值是由兩部分(或幾部分)組成,這組觀察值的算術(shù)平均數(shù)可以由組成部分算術(shù)平均數(shù)而求得;
二、算術(shù)平均數(shù)的應(yīng)用及其優(yōu)缺點(diǎn)
算術(shù)平均數(shù)具備一個(gè)良好的集中量所應(yīng)具備的一些條件:
(1)反應(yīng)靈敏。
?。?)嚴(yán)密確定。簡(jiǎn)明易懂,計(jì)算方便。
?。?)適合代數(shù)運(yùn)算。
?。?)受抽樣變動(dòng)的影響較小。
除此之外,算數(shù)平均數(shù)還有幾個(gè)特殊的優(yōu)點(diǎn):
?。?)只知一組觀察值的總和及總頻數(shù)就可以求出算術(shù)平均數(shù)。
?。?)用加權(quán)法可以求出幾個(gè)平均數(shù)的總平均數(shù)。
?。?)用樣本數(shù)據(jù)推斷總體集中量時(shí),算術(shù)平均數(shù)最接近于總體集中量的真值,它是總體平均數(shù)的最好估計(jì)值。
(4)在計(jì)算方差、標(biāo)準(zhǔn)差、相關(guān)系數(shù)以及進(jìn)行統(tǒng)計(jì)推斷時(shí),都要用到它。
算術(shù)平均數(shù)的缺點(diǎn):
?。?)易受兩極端數(shù)值(極大或極?。┑挠绊?。
(2)一組數(shù)據(jù)中某個(gè)數(shù)值的大小不夠確切時(shí)就無法計(jì)算其算術(shù)平均數(shù)。
第二節(jié) 中位數(shù)
一、中位數(shù)的概念
中位數(shù)是位于依一定順序排列的一組數(shù)據(jù)中央位置的數(shù)值,在這一數(shù)值上、下各有一半頻數(shù)分布著。
二、中位數(shù)的計(jì)算方法
1、原始數(shù)值計(jì)算方法
將一組原始數(shù)據(jù)依大小順序排列后,若總頻數(shù)為奇數(shù),就以位于中央的數(shù)據(jù)作為中位數(shù);若總頻數(shù)為偶數(shù),則以最中間的兩個(gè)數(shù)據(jù)的算術(shù)平均數(shù)作為中位數(shù)。
2、頻數(shù)分布表計(jì)算法
若一組原始數(shù)據(jù)已經(jīng)編成了頻數(shù)分布表,可用內(nèi)插法,通過頻數(shù)分布表計(jì)算中位數(shù)。
三、百分位數(shù)的概念及其計(jì)算方法
百分位數(shù)是位于依一定順序排列的一組數(shù)據(jù)中某一百分位置的數(shù)值。在心理測(cè)量中,常通過計(jì)算百分位數(shù)來說明、解釋和評(píng)價(jià)分?jǐn)?shù)在團(tuán)體中所處的位置。計(jì)算公式為(3.5)。
四、中位數(shù)的應(yīng)用及其優(yōu)缺點(diǎn)
中位數(shù)雖然也具備一個(gè)良好的集中量所應(yīng)具備的某些條件,例如比較嚴(yán)格確定、簡(jiǎn)明易懂,計(jì)算簡(jiǎn)便,受抽樣變動(dòng)影響較小,但是它不適合進(jìn)一步的代數(shù)運(yùn)算。它適用于以下幾種情況:(1)一組數(shù)據(jù)中有特大或特小兩極端數(shù)值時(shí);(2)一組數(shù)據(jù)中有個(gè)別數(shù)據(jù)不確切時(shí);(3)資料屬于等級(jí)性質(zhì)時(shí)。
第三節(jié) 眾數(shù)
一、眾數(shù)的概念
眾數(shù)是集中量的一種指標(biāo)。對(duì)眾數(shù)有理論眾數(shù)及粗略眾數(shù)兩種定義方法。理論眾數(shù)是指與頻數(shù)分布曲線最高點(diǎn)相對(duì)應(yīng)的橫坐標(biāo)上的一點(diǎn)。粗略眾數(shù)是指一組數(shù)據(jù)中頻數(shù)出現(xiàn)最多的那個(gè)數(shù)。
二、眾數(shù)的計(jì)算方法
1、用觀察法直接尋找粗略眾數(shù)
粗略眾數(shù)不需要計(jì)算,可通過觀察直接尋得。
2、用公式求理論眾數(shù)的近似值
(1)皮爾遜(K.Person)的經(jīng)驗(yàn)法
利用皮爾遜發(fā)現(xiàn)的算術(shù)平均數(shù)、中位數(shù)、眾數(shù)三者關(guān)系來求理論眾數(shù)近似值的經(jīng)驗(yàn)公式為(3.6)。
(2)金氏(W.I.King)插補(bǔ)法
當(dāng)頻數(shù)分布呈偏態(tài),即眾數(shù)所在組以上各組頻數(shù)總和與以下各組頻數(shù)總和相差較多時(shí),可以用金氏公式計(jì)算眾數(shù),以進(jìn)行比率調(diào)整。其公式為(3.7)。
三、眾數(shù)的應(yīng)用及其優(yōu)缺點(diǎn)
眾數(shù)雖然簡(jiǎn)明易懂,但是它并不具備一個(gè)良好的集中量的基本條件。它主要在以下情況下使用:(1)當(dāng)需要快速而粗略地找出一組數(shù)據(jù)的代表值時(shí);(2)當(dāng)需要利用算術(shù)平均數(shù)、中位數(shù)和眾數(shù)三者關(guān)系來粗略判斷頻數(shù)分布的形態(tài)時(shí);(3)利用眾數(shù)幫助分析解釋一組頻數(shù)分布是否確實(shí)具有兩個(gè)頻數(shù)最多的集中點(diǎn)時(shí)。
第四節(jié) 加權(quán)平均數(shù)、幾何平均數(shù)
一、加權(quán)平均數(shù)
加權(quán)平均數(shù)是不同比重?cái)?shù)據(jù)(或平均數(shù))的平均數(shù)。計(jì)算公式為(3.8)或(3.9)。
二、幾何平均數(shù)
幾何平均數(shù)是N個(gè)數(shù)值連乘積的N次方根。計(jì)算公式為(3.10)。
當(dāng)一個(gè)數(shù)列的后一個(gè)數(shù)據(jù)是以前一個(gè)數(shù)據(jù)為基礎(chǔ)成比例增長(zhǎng)時(shí),要用幾何平均數(shù)求其平均增長(zhǎng)率。
第四章 差異量
第一節(jié) 全距、四分位距、百分位距(略)
第二節(jié) 平均差
一、平均差的概念
所謂平均差,就是每一個(gè)數(shù)據(jù)與該組數(shù)據(jù)的中位數(shù)(或算術(shù)平均數(shù))離差的絕對(duì)值的算術(shù)平均數(shù)。
二、平均差的計(jì)算方法
用原始數(shù)據(jù)計(jì)算平均差的公式為(4.3)
三、平均差的優(yōu)缺點(diǎn)
平均差意義明確,計(jì)算容易,每個(gè)數(shù)據(jù)都參加了運(yùn)算,考慮到全部的離差,反應(yīng)靈敏。但計(jì)算要用絕對(duì)值,不適合代數(shù)運(yùn)算。
第三節(jié) 方差和標(biāo)準(zhǔn)差
一、方差和標(biāo)準(zhǔn)差的概念
方差是指離差平方的算術(shù)平均數(shù)。其定義公式為(4.5),計(jì)算公式是(4.7)。
標(biāo)準(zhǔn)差是指離差平方和平均后的方根。即方差的平方根。其定義公式為(4.6),計(jì)算公式是(4.8)。
二、方差和標(biāo)準(zhǔn)差的應(yīng)用及其優(yōu)缺點(diǎn)
方差和標(biāo)準(zhǔn)差的優(yōu)點(diǎn):反應(yīng)靈敏,隨任何一個(gè)數(shù)據(jù)的變化而表示;一組數(shù)據(jù)的方差和標(biāo)準(zhǔn)差有確定的值;計(jì)算簡(jiǎn)單;適合代數(shù)計(jì)算,不僅求方差和標(biāo)準(zhǔn)差的過程中可以進(jìn)行代數(shù)運(yùn)算,而且可以將幾個(gè)方差和標(biāo)準(zhǔn)差綜合成一個(gè)總的方差和標(biāo)準(zhǔn)差;用樣本數(shù)據(jù)推斷總體差異量時(shí),方差和標(biāo)準(zhǔn)差是最好的估計(jì)量。
第三節(jié) 相對(duì)差異量
一、相對(duì)差異量的概念
上述全距、四分位距、平均差及標(biāo)準(zhǔn)差都是帶有與原觀察值相同單位的名數(shù),稱為絕對(duì)差異量。這種差異量對(duì)兩種單位不同,或單位相同而兩個(gè)平均數(shù)相差較大的資料,都無法比較差異的大小,必須用相對(duì)差異量(即差異系數(shù))進(jìn)行比較。
所謂差異系數(shù)是指標(biāo)準(zhǔn)差與其算術(shù)平均數(shù)的百分比。它是沒有單位的相對(duì)數(shù)。其計(jì)算公式是(4.11)
二、差異系數(shù)的用途
1、比較不同單位資料的差異程度
2、比較單位相同而平均數(shù)相差數(shù)較大的兩組資料的差異量程度
3、可判斷特殊差異情況
三、差異系數(shù)的應(yīng)用條件
從測(cè)驗(yàn)的理論來說,只有等比量表才使平均數(shù)等于零成為不可能。也就是說,用來測(cè)量的量尺,既具有等距的單位,又具有絕對(duì)零點(diǎn),這時(shí)所測(cè)量出的數(shù)據(jù)其平均數(shù)才不可能等于零,這時(shí)才能計(jì)算差異系數(shù)。
第五節(jié) 偏態(tài)量及峰態(tài)量
偏態(tài)量及峰態(tài)量是用以描述數(shù)據(jù)分布特征的統(tǒng)計(jì)量。
一、偏態(tài)量
1、利用算術(shù)平均數(shù)與眾數(shù)或中位數(shù)的距離來計(jì)算。其公式為(4.12)。
2、根據(jù)動(dòng)差來計(jì)算。其公式為(4.14)。
二、峰態(tài)量
1、用兩個(gè)百分位距來計(jì)算。其公式為(4.16)。
2、根據(jù)動(dòng)差來計(jì)算。其公式為(4.17)。
第五章 概率及概率分布
第一節(jié) 概率的一般概念
一、概率的定義
概率因?qū)で蟮姆椒ú煌袃煞N定義,即后驗(yàn)概率和先驗(yàn)概率。
1、后驗(yàn)概率的定義
以隨機(jī)事件A在大量重復(fù)試驗(yàn)中出現(xiàn)的穩(wěn)定頻率制作為隨機(jī)事件A概率的估計(jì)值,這樣尋得的概率稱為后驗(yàn)概率。計(jì)算公式是(5.2)。
2.先驗(yàn)概率的定義
先驗(yàn)概率是通過古典概率模型加以定義的,故又稱為古典概率。古典概率模型要求滿足兩個(gè)條件:(1)試驗(yàn)的所有可能結(jié)果是有限的;(2)每一種可能結(jié)果出現(xiàn)的可能性(概率)相等。若所有可能結(jié)果的總數(shù)為n,隨機(jī)事件A包括m個(gè)可能結(jié)果,則事件A的概率計(jì)算公式為(5.3)。
二、概率的性質(zhì)
1、任何隨機(jī)事件A的概率都是介于0與1之間的正數(shù);
2、不可能事件的概率等于0;
3、必然事件的概率等于1。
三、概率的加法和乘法
1、概率的加法
在一次試驗(yàn)中不可能同時(shí)出現(xiàn)的事件稱為互不相容的事件。
兩個(gè)互不相容事件和的概率,等于這兩個(gè)事件概率之和。用公式表示為(5.4)和(5.5)。
2.概率的乘法
A事件出現(xiàn)的概率不影響B(tài)事件出現(xiàn)的概率,這兩個(gè)事件為獨(dú)立事件。
兩個(gè)獨(dú)立事件的概率,等于這兩個(gè)事件概率的乘積。用公式表示為(5.6)和(5.7)。
二項(xiàng)分布
一、滿足以下條件的試驗(yàn)稱為二項(xiàng)試驗(yàn):
(1)一次試驗(yàn)只有兩種可能結(jié)果。如:正面和反面;(2)各次試驗(yàn)相互獨(dú)立,互不影響;(3)各次試驗(yàn)中各事件概率相等。
二、二項(xiàng)分布:是一種離散型隨機(jī)變量的概率分布。
用n次方的二項(xiàng)展開式來表達(dá)在n次二項(xiàng)試驗(yàn)中成功事件出現(xiàn)不同次數(shù)(X=0,1,…,n)的概念分布叫做二項(xiàng)分布。
二項(xiàng)展開式的通式(5.8)就是二項(xiàng)分布函數(shù),運(yùn)用這一函數(shù)式可以直接求出成功事件恰好出現(xiàn)X次的概率。
三、二項(xiàng)分布圖
從二項(xiàng)分布圖可以看出,當(dāng)p=q,不管n多大,二項(xiàng)分布呈對(duì)稱形。當(dāng)n很大時(shí),二項(xiàng)分布接近于正態(tài)分布。當(dāng)n趨近于無限大時(shí),正態(tài)分布是二項(xiàng)分布的極限。
四、二項(xiàng)分布的平均數(shù)和標(biāo)準(zhǔn)差
當(dāng)二項(xiàng)分布接近于正態(tài)分布時(shí),在n次二項(xiàng)實(shí)驗(yàn)中成功事件出現(xiàn)次數(shù)的平均數(shù)和標(biāo)準(zhǔn)差分別可以由公式(5.9)和(5.10)計(jì)算而得。
五、二項(xiàng)分布的應(yīng)用
二項(xiàng)分布函數(shù)除了用來求成功事件恰好出現(xiàn)X次的概率之外,在心理學(xué)中主要用來判斷實(shí)驗(yàn)結(jié)果的機(jī)遇性與真實(shí)性的界限。
屬于二項(xiàng)分布的問題,若實(shí)驗(yàn)次數(shù)n較大,一般都用正態(tài)分布近似處理。
第三節(jié) 正態(tài)分布
正態(tài)分布是一種連續(xù)型隨機(jī)變量的概率分布。
一、正態(tài)曲線
1.正態(tài)曲線函數(shù)
正態(tài)曲線的函數(shù)式是公式(5.11)。
標(biāo)準(zhǔn)正態(tài)分布的函數(shù)式是公式(5.12)。
2.正態(tài)曲線的特點(diǎn)
?。?)曲線在Z=0處為最高點(diǎn)。
?。?)曲線以Z=0處為中心,雙側(cè)對(duì)稱。
?。?)曲線從最高點(diǎn)向左右緩慢下降,并無限延伸,但永遠(yuǎn)不與基線相交。
?。?)標(biāo)準(zhǔn)正態(tài)分布上的平均數(shù)為0,標(biāo)準(zhǔn)差為1。
?。?)曲線從最高點(diǎn)向左右延伸時(shí),在正負(fù)1個(gè)標(biāo)準(zhǔn)差是拐點(diǎn)。
二、正態(tài)曲線的面積與縱線
1、累積正態(tài)分布函數(shù)
2、標(biāo)準(zhǔn)正態(tài)分布下面積的求法
3、正態(tài)曲線的縱線
三、正態(tài)分布在測(cè)驗(yàn)計(jì)分方面的應(yīng)用
1、將原始分?jǐn)?shù)轉(zhuǎn)換成標(biāo)準(zhǔn)分?jǐn)?shù)
標(biāo)準(zhǔn)分?jǐn)?shù)的意義:第一,各科標(biāo)準(zhǔn)分?jǐn)?shù)的單位是絕對(duì)等價(jià)的;第二、標(biāo)準(zhǔn)分?jǐn)?shù)的正負(fù)和大小可以反映出考生在全體考分中所處的地位。
2、確定錄用分?jǐn)?shù)線
3、確定等級(jí)評(píng)定的人數(shù)
4、品質(zhì)評(píng)定數(shù)量化
第六章 抽樣分布及總體平均數(shù)的推斷
第一節(jié) 抽樣分布
一、抽樣分布的概念
要區(qū)分以下三種不同性質(zhì)的分布:
1、總體分布:總體內(nèi)個(gè)體數(shù)值的頻數(shù)分布。
2、樣本分布:樣本內(nèi)個(gè)體數(shù)值的頻數(shù)分布。
3、抽樣分布:某一種統(tǒng)計(jì)量的概率分布。
二、平均數(shù)抽樣分布的幾個(gè)定理
1、從總體中隨機(jī)抽出容量為n的一切可能樣本的平均數(shù)之平均數(shù)等于總體的平均數(shù)。公式表示為(6.1)。
2、容量為n的平均數(shù)在抽樣分布上的標(biāo)準(zhǔn)差,等于總體標(biāo)準(zhǔn)差除以n的方根。公式表示為(6.2)。
3.從正態(tài)總體中,隨機(jī)抽取的容量為n的一切可能樣本平均數(shù)的分布也呈正態(tài)分布。
4.雖然總體不呈正態(tài)分布,如果樣本容量較大,反映總體μ和σ的樣本平均數(shù)的抽樣分布,也接近于正態(tài)分布。
三、樣本平均數(shù)與總體平均數(shù)離差統(tǒng)計(jì)量的形態(tài)
從正態(tài)總體中隨機(jī)抽取的容量為n的一切可能樣本平均數(shù)為中心呈正態(tài)分布。當(dāng)總體標(biāo)準(zhǔn)差已知時(shí),一切可能樣本平均數(shù)與總體平均數(shù)的離差統(tǒng)計(jì)量呈標(biāo)準(zhǔn)正態(tài)分布(6.3)。
總體標(biāo)準(zhǔn)差σ的無偏估計(jì)量S等于樣本統(tǒng)計(jì)量σx乘以貝賽耳氏校正數(shù),公式(6.4)。
從正態(tài)總體中隨機(jī)抽取容量為n的一切可能樣本平均數(shù)的抽樣分布呈正態(tài)分布。當(dāng)總體標(biāo)準(zhǔn)差σ未知,需用估計(jì)值S來代替,于是平均數(shù)標(biāo)準(zhǔn)誤也被平均數(shù)標(biāo)準(zhǔn)誤的估計(jì)值所代替,這時(shí)一切可能樣本平均數(shù)與總體平均數(shù)的離差統(tǒng)計(jì)量呈t分布(6.6)。
t分布與正態(tài)分布的相似之處:t分布基線上的t值從-∞-+∞;從平均數(shù)等于0處,左側(cè)t值為負(fù),右側(cè)t值為正;曲線以平均數(shù)處為最高點(diǎn)向兩側(cè)逐漸下降,尾部無限延伸,永不與基線相接,呈單峰對(duì)稱形。區(qū)別之處在于:t分布的形態(tài)隨自由度(df=n-1)的變化呈一簇分布形態(tài)(即自由度不同的t分布形態(tài)也不同,見圖6.1)。自由度逐漸增大時(shí),t分布逐漸接近正態(tài)分布。
自由度是指總體參數(shù)估計(jì)量中變量值獨(dú)立自由變化的個(gè)數(shù)。
第二節(jié) 總體平均數(shù)的參數(shù)估計(jì)
一、總體參數(shù)估計(jì)的基本原理
1、點(diǎn)估計(jì)
用某一樣本統(tǒng)計(jì)量的值來估計(jì)相應(yīng)總體參數(shù)的值叫總體參數(shù)的點(diǎn)估計(jì)。
2、區(qū)間估計(jì)
以樣本統(tǒng)計(jì)量的抽樣分布(概率分布)為理論依據(jù),按一定概率要求,由樣本統(tǒng)計(jì)量的值估計(jì)總體參數(shù)值的所在范圍,稱為總體參數(shù)的區(qū)間估計(jì)。
區(qū)間估計(jì)涉及置信水平和置信區(qū)間。
二、σ已知條件下總體平均數(shù)的區(qū)間估計(jì)
當(dāng)總體σ已知,總體呈正態(tài)分布,樣本容量無論大小時(shí),或者當(dāng)總體σ已知,總體雖不呈正態(tài)分布,但樣本容量較大(n >30)時(shí),樣本平均數(shù)與總體平均數(shù)離差統(tǒng)計(jì)量均呈正態(tài)分布。區(qū)間估計(jì)的計(jì)算公式為(6.8)和(6.9)。
三、σ未知條件下總體平均數(shù)的區(qū)間估計(jì)
1、σ未知條件下總體平均數(shù)的區(qū)間估計(jì)的基本原理
當(dāng)總體σ未知,總體呈正態(tài)分布,樣本容量無論大小時(shí),或者當(dāng)總體σ未知,總體雖不呈正態(tài)分布,但樣本容量較大(n >30)時(shí),樣本平均數(shù)與總體平均數(shù)離差統(tǒng)計(jì)量均呈t分布。區(qū)間估計(jì)的計(jì)算公式為(6.10)和(6.11)。
2、小樣本的情況
3、大樣本的情況
可以用正態(tài)分布近似處理。
第三節(jié) 假設(shè)檢驗(yàn)的基本原理
利用樣本信息,根據(jù)一定概率,對(duì)總體參數(shù)或分布的某一假設(shè)作出拒絕或保留的決斷,稱為假設(shè)檢驗(yàn)。
一、假設(shè)
假設(shè)檢驗(yàn)一般有兩個(gè)相互對(duì)立的假設(shè)。即零假設(shè)(或稱原假設(shè)、虛無假設(shè)、解消假設(shè))和備擇假設(shè)(或稱研究假設(shè)、對(duì)立假設(shè))。假設(shè)檢驗(yàn)是從零假設(shè)出發(fā),視其被拒絕的機(jī)會(huì),從而得出決斷。
二、小概率事件
把出現(xiàn)小概率的隨機(jī)事件稱為小概率事件。小概率事件是否出現(xiàn),這是對(duì)假設(shè)作出決斷的依據(jù)。
三、顯著性水平
拒絕零假設(shè)的概率稱為顯著性水平。顯著性水平和可靠性程度之間的關(guān)系是:兩者之和為1。
四、統(tǒng)計(jì)決斷的兩類錯(cuò)誤及其控制
如果拒絕了屬于真實(shí)的零假設(shè),即如果樣本統(tǒng)計(jì)量的總體參數(shù)正是假設(shè)的總體參數(shù),但是由于樣本統(tǒng)計(jì)量的值落入了拒絕區(qū)域。而零假設(shè)遭到拒絕,這時(shí)就會(huì)犯第一類型的錯(cuò)誤。這種錯(cuò)誤的可能性大小正是顯著性水平的大小,故又稱這類錯(cuò)誤為α錯(cuò)誤。如果保留了屬于不真實(shí)的零假設(shè),就會(huì)犯第二類型的錯(cuò)誤。犯這種“假設(shè)屬偽而被保留”的第二類錯(cuò)誤的概率,等于β值,故又稱這類錯(cuò)誤為β錯(cuò)誤。
要使第一類錯(cuò)誤的概率保持在需要的水平上,而控制第二類錯(cuò)誤的概率,有以下方法:(1)利用已知的實(shí)際總體參數(shù)與假設(shè)參數(shù)值之間的大小關(guān)系,合理安排拒絕領(lǐng)域的位置,選擇雙側(cè)檢驗(yàn)還是單側(cè)檢驗(yàn),左側(cè)檢驗(yàn)還是右側(cè)檢驗(yàn);(2)加大樣本容量。
第四節(jié) 總體平均數(shù)的顯著性檢驗(yàn)
總體平均數(shù)的顯著性檢驗(yàn)的適用公式與相應(yīng)的參數(shù)估計(jì)一脈相承。
一、σ已知條件下總體平均數(shù)的顯著性檢驗(yàn)(公式6.3)
二、σ未知條件下總體平均數(shù)的假設(shè)檢驗(yàn)
1、小樣本的情況(公式6.16)
2、大樣本的情況(公式6.3)
第七章 平均數(shù)差異的顯著性檢驗(yàn)
第一節(jié) 相關(guān)樣本平均數(shù)差異的顯著性檢驗(yàn)
兩個(gè)樣本內(nèi)個(gè)體之間存在著一一對(duì)應(yīng)的關(guān)系,這兩個(gè)樣本稱為相關(guān)樣本。相關(guān)樣本有以下兩種情況:
(1)用同一測(cè)驗(yàn)對(duì)同一組被試在試驗(yàn)前后進(jìn)行兩次測(cè)驗(yàn),所獲得的兩組測(cè)驗(yàn)結(jié)果是相關(guān)樣本。
?。?)根據(jù)某些條件基本相同的原則,把被試一一匹配成對(duì),然后將每對(duì)被試隨機(jī)地分入實(shí)驗(yàn)組和對(duì)照組,對(duì)兩組被試施行不同的實(shí)驗(yàn)處理之后,用同一測(cè)驗(yàn)所獲得的測(cè)驗(yàn)結(jié)果,也是相關(guān)樣本。
相關(guān)樣本平均數(shù)差異的顯著性檢驗(yàn)方法和步驟:
?。?)提出假設(shè)
(2)選擇檢驗(yàn)統(tǒng)計(jì)量并計(jì)算其值。在小樣本情況下,其檢驗(yàn)統(tǒng)計(jì)量為公式(7.9);在大樣本情況下用公式(7.12)。
?。?)確定檢驗(yàn)形式
?。?)統(tǒng)計(jì)決斷
第二節(jié) 獨(dú)立樣本平均數(shù)差異的顯著性檢驗(yàn)
兩個(gè)樣本內(nèi)的個(gè)體是隨機(jī)抽取的,它們之間不存在一一的對(duì)應(yīng)關(guān)系,這樣的兩個(gè)樣本稱為獨(dú)立樣本。
一、獨(dú)立大樣本平均數(shù)差異的顯著性檢驗(yàn)
兩個(gè)樣本容量n1和n1都大于30的獨(dú)立樣本稱為獨(dú)立大樣本。
獨(dú)立大樣本平均數(shù)差異的顯著性檢驗(yàn)所用的公式是(7.17)。
二、獨(dú)立小樣本平均數(shù)差異的顯著性檢驗(yàn)
兩個(gè)樣本容量n1和n1均小于30,或其中一個(gè)小于30的獨(dú)立樣本稱為獨(dú)立小樣本。
獨(dú)立小樣本平均數(shù)差異的顯著性檢驗(yàn)方法:
1、方差齊性時(shí)
如果兩個(gè)獨(dú)立樣本的總體方差未知,經(jīng)方差齊性檢驗(yàn)表明兩個(gè)總體方差相等,則統(tǒng)計(jì)量公式為(7.23)-(7.25),這三個(gè)公式是等價(jià)的。
2、方差不齊性時(shí)
對(duì)于方差不齊性的兩個(gè)獨(dú)立樣本平均數(shù)差異顯著性檢驗(yàn),需要用校正的t'作為檢驗(yàn)統(tǒng)計(jì)量,用公式(7.26),t'的臨界值則用公式(7.29)和(7.32)來計(jì)算。
第三節(jié) 方差齊性檢驗(yàn)
一、F分布
若從方差相同的兩個(gè)正態(tài)總體中,隨機(jī)抽取兩個(gè)獨(dú)立樣本,以此為基礎(chǔ),分別求出兩個(gè)相應(yīng)總體總體方差的估計(jì)值,這兩個(gè)總體方差估計(jì)值的比值稱為F比值,F(xiàn)比值的抽樣分布稱為F分布。F分布的形態(tài)隨F比值分子和分母中自由度的變化而形成一簇正偏態(tài)分布。
一般情況下,經(jīng)常應(yīng)用的是右側(cè)F檢驗(yàn),計(jì)算F值時(shí),將大的總體方差估計(jì)值作為分子,小的作為分母。
二、兩個(gè)獨(dú)立樣本的方差齊性檢驗(yàn)
用公式(7.35)。
三、兩個(gè)相關(guān)樣本的方差齊性檢驗(yàn)
用公式(7.38)。
第八章 方差分析
第一節(jié) 方差分析的基本原理
一、方差分析的目的
方差分析的基本功能就在于它對(duì)多組平均數(shù)差異的顯著性進(jìn)行檢驗(yàn)的作用。
二、方差分析的邏輯
組間差異對(duì)組內(nèi)差異的比值越大,則各組平均數(shù)的差異就越明顯。通過對(duì)組間差異與組內(nèi)差異比值的分析,來推斷幾個(gè)相應(yīng)平均數(shù)差異的顯著性,這就是方差分析的邏輯。
三、以F檢驗(yàn)來推斷幾個(gè)平均數(shù)差異的顯著性
四、方差分析中的幾個(gè)概念
實(shí)驗(yàn)中的自變量稱為因素。只有一個(gè)自變量的實(shí)驗(yàn)稱為單因素實(shí)驗(yàn)。有兩個(gè)或兩個(gè)以上自變量的實(shí)驗(yàn)稱為多因素實(shí)驗(yàn)。某一個(gè)因素的不同情況稱為因素的“水平”。包括量差或質(zhì)別兩類情況,按各個(gè)“水平”條件進(jìn)行的重復(fù)實(shí)驗(yàn)稱為各種處理。
第二節(jié) 完全隨機(jī)設(shè)計(jì)的方差分析
為了檢驗(yàn)?zāi)骋粋€(gè)因素多種不同水平間的差異的顯著性,將從同一個(gè)總體中隨機(jī)抽取的被試,再隨機(jī)地分入各實(shí)驗(yàn)組,施以各種不同的實(shí)驗(yàn)處理以后,用方差分析法對(duì)這多個(gè)獨(dú)立樣本平均數(shù)差異的顯著性進(jìn)行檢驗(yàn),稱為完全隨機(jī)設(shè)計(jì)的方差分析。
一、n 相等的情況
用公式(8.4)-(8.6)。
二、n 不相等的情況
用公式(8.7)-(8.8)。
三、運(yùn)用樣本統(tǒng)計(jì)量進(jìn)行組間與組內(nèi)方差的F檢驗(yàn)
用第181頁(yè)上的公式。
第三節(jié) 隨機(jī)區(qū)組設(shè)計(jì)的方差分析
用方差分析法對(duì)多個(gè)相關(guān)樣本平均數(shù)差異所進(jìn)行的顯著性檢驗(yàn),稱之為隨機(jī)區(qū)組設(shè)計(jì)的方差分析
每一區(qū)組內(nèi)被試的人數(shù)分配有以下三種方式:
?。?)一個(gè)被試作為一個(gè)區(qū)組;
?。?)每一區(qū)組內(nèi)被試的人數(shù)是實(shí)驗(yàn)處理數(shù)的整數(shù)倍;
?。?)區(qū)組內(nèi)以一個(gè)團(tuán)體為一個(gè)基本單元。
區(qū)組平方和等數(shù)據(jù)的計(jì)算用公式(8.9)-(8.11)。
第四節(jié) 各個(gè)平均數(shù)差異的顯著性檢驗(yàn)
對(duì)多組平均數(shù)的逐對(duì)差異檢驗(yàn),以Newman-Keul提出的q檢驗(yàn)法(或稱N-K)最為常用。
一、完全隨機(jī)設(shè)計(jì)的q檢驗(yàn)
公式(8.14)或(8.15)。
二、隨機(jī)區(qū)組設(shè)計(jì)的q檢驗(yàn)
公式(8.16)。
第五節(jié) 多組方差的齊性檢驗(yàn)
多組方差的顯著性可以用哈特萊(Hartley)所提出的最大F值檢驗(yàn)法進(jìn)行齊性檢驗(yàn)。公式(8.17)。
第六節(jié) 多因素方差分析簡(jiǎn)介
一、多因素方差分析的功能
多因素方差分析不僅可以檢驗(yàn)各個(gè)因素對(duì)因變量作用的顯著性,而且還可以檢驗(yàn)因素與因素間共同結(jié)合對(duì)因變量發(fā)生交互作用的顯著性。
二、雙因素完全隨機(jī)設(shè)計(jì)方差分析的基本方法
計(jì)算時(shí)使用公式(8.18)-(8.20)和第204-205頁(yè)上的公式。
第九章 總體比率的推斷
第一節(jié) 比率的抽樣分布
一、數(shù)據(jù)的特點(diǎn)
對(duì)點(diǎn)計(jì)數(shù)據(jù)的統(tǒng)計(jì)推斷,應(yīng)采用總體比率的推斷方法或卡方檢驗(yàn)。當(dāng)事物僅被劃分成兩類,可用總體比率的推斷進(jìn)行統(tǒng)計(jì)推斷;當(dāng)事物被劃分為成兩類以上時(shí),則需用卡方檢驗(yàn)進(jìn)行統(tǒng)計(jì)推斷。當(dāng)然卡方檢驗(yàn)也可以對(duì)僅有兩種類別的資料進(jìn)行統(tǒng)計(jì)推斷。
二、比率的抽樣分布
比率的抽樣分布是二項(xiàng)分布。當(dāng)p=q,無論n的大小,二項(xiàng)分布呈對(duì)稱形;當(dāng)p <q且np≥5,或p >q且np≥5時(shí),二項(xiàng)分布已經(jīng)開始接近正態(tài)分布。
三、比率的標(biāo)準(zhǔn)誤
比率的標(biāo)準(zhǔn)誤是由二項(xiàng)分布的標(biāo)準(zhǔn)差除以n而獲得。
第二節(jié) 總體比率的區(qū)間估計(jì)
一、正態(tài)近似法
公式(9.3)-(9.5)。
二、查表法
用附表6。
第三節(jié) 總體比率的假設(shè)檢驗(yàn)
一、正態(tài)近似法
公式(9.6)-(9.5)。
二、查表法
用附表6。
第四節(jié) 總體比率差異的顯著性檢驗(yàn)
一、兩個(gè)獨(dú)立樣本比率差異的顯著性檢驗(yàn)
兩個(gè)獨(dú)立樣本比率差異的標(biāo)準(zhǔn)誤:公式(9.8)。
如果兩個(gè)獨(dú)立樣本的最小頻數(shù)都等于或大于5,兩個(gè)樣本比率之差的抽樣分布也接近于正態(tài),于是可用Z檢驗(yàn)兩個(gè)比率之差的顯著性。其檢驗(yàn)統(tǒng)計(jì)量為公式(9.11)。
二、兩個(gè)相關(guān)樣本比率差異的顯著性檢驗(yàn)
兩個(gè)相關(guān)樣本比率之差的檢驗(yàn)公式為(9.13)。
第十章 卡方檢驗(yàn)
第一節(jié) χ2及其分布
一、卡方檢驗(yàn)的特點(diǎn)
卡方檢驗(yàn)是對(duì)樣本的頻數(shù)分布所來自的總體分布是否服從某種理論分布或某種假設(shè)分布所作的假設(shè)檢驗(yàn)。即根據(jù)樣本的頻數(shù)分布來推斷總體的分布。它屬于自由分布的非參數(shù)檢驗(yàn)。它可以處理一個(gè)因素分為多種類別,或多種因素各有多種類別的資料。所以,凡是可以應(yīng)用比率進(jìn)行檢驗(yàn)的資料,都可以用卡方檢驗(yàn)。
二、卡方檢驗(yàn)的統(tǒng)計(jì)量
卡方檢驗(yàn)統(tǒng)計(jì)量的基本形式為公式(10.1)。
χ2值有以下幾個(gè)特點(diǎn):
?。?)χ2值具有可加性。
?。?)χ2值永遠(yuǎn)是正值。
(3)χ2值的大小隨實(shí)際頻數(shù)與理論頻數(shù)差的大小而變化。
三、χ2的抽樣分布
χ2分布有以下幾個(gè)特點(diǎn):
(1)χ2分布呈正偏態(tài),右側(cè)無限延伸,但永不與基線相交。
?。?)χ2分布隨自由度的變化而形成一簇分布形態(tài)。
自由度越小,χ2分布偏斜度越大;自由度越大,χ2分布形態(tài)越趨于對(duì)稱。
第二節(jié) 單向表的卡方檢驗(yàn)
把實(shí)得的點(diǎn)計(jì)數(shù)據(jù)按一種分類標(biāo)準(zhǔn)編制成表就是單向表。對(duì)于單向表的數(shù)據(jù)所進(jìn)行的卡方檢驗(yàn)就是單向表的卡方檢驗(yàn),即單因素的卡方檢驗(yàn)。
一、按一定比率決定理論頻數(shù)的卡方檢驗(yàn)
二、一個(gè)自由度的卡方檢驗(yàn)
當(dāng)df=1,其中只有一個(gè)組的ft <5,就要運(yùn)用亞茨(Yates)連續(xù)性校正法(10.2)。
三、頻數(shù)分布正態(tài)性的卡方檢驗(yàn)
第三節(jié) 雙向表的卡方檢驗(yàn)
把實(shí)得的點(diǎn)計(jì)數(shù)據(jù)按兩種分類標(biāo)準(zhǔn)編制成的表就是雙向表。對(duì)雙向表的數(shù)據(jù)進(jìn)行的卡方檢驗(yàn),就是雙向表的卡方檢驗(yàn),即雙因素的卡方檢驗(yàn)。
在雙向表的卡方檢驗(yàn)中,如果要判斷兩種分類特征,即兩個(gè)因素之間是否有依從關(guān)系,這種檢驗(yàn)稱為獨(dú)立性卡方檢驗(yàn)。
在雙向表卡方檢驗(yàn)中,如果是判斷幾次重復(fù)實(shí)驗(yàn)的結(jié)果是否相同,這種卡方檢驗(yàn)稱為同質(zhì)性檢驗(yàn)。
雙向表的獨(dú)立性卡方檢驗(yàn)和同質(zhì)性卡方檢驗(yàn),只是檢驗(yàn)的意義不同,而方法完全相同,都應(yīng)用公式(10.3)或(10.4)。對(duì)于同一組數(shù)據(jù)所進(jìn)行的卡方檢驗(yàn),有時(shí)即可以理解為獨(dú)立性卡方檢驗(yàn),又可以理解為同質(zhì)性檢驗(yàn),兩者無本質(zhì)區(qū)別。
第四節(jié) 四格表的卡方檢驗(yàn)
一、獨(dú)立樣本四格表的卡方檢驗(yàn)
獨(dú)立樣本四格表的卡方檢驗(yàn),就是雙向表中2*2表的卡方檢驗(yàn)。它即可以用縮減公式由實(shí)際頻數(shù)直接計(jì)算χ2值,又可以用上述求理論頻數(shù)的方法計(jì)算χ2值。
1.縮減公式χ2值的計(jì)算
獨(dú)立樣本四格表χ2值的縮減公式為(10.6)。
2.校正χ2值的計(jì)算
當(dāng)df=1,樣本容量總和N <30或N <50時(shí)(決定于對(duì)檢驗(yàn)結(jié)果要求的嚴(yán)格程度),應(yīng)對(duì)χ2值進(jìn)行亞茨連續(xù)性校正。其校正公式為(10.7)。
二、相關(guān)樣本四格表的卡方檢驗(yàn)
1.縮減公式χ2值的計(jì)算
相關(guān)樣本四格表χ2值的縮減公式為(10.8)。
2.校正χ2值的計(jì)算
當(dāng)df=1,兩個(gè)相關(guān)樣本四格表中(b+c) <30或(b+c) <50(決定于對(duì)檢驗(yàn)結(jié)果要求的嚴(yán)格程度),應(yīng)對(duì)χ2值進(jìn)行亞茨連續(xù)性校正。其校正公式(10.9)。
第十一章 相關(guān)分析
第一節(jié) 相關(guān)的意義
一、相關(guān)的概念
兩個(gè)變量之間不精確、不穩(wěn)定的變化關(guān)系稱為相關(guān)關(guān)系。
二、相關(guān)系數(shù)
用來描述兩個(gè)變量相互之間變化方向及密切程度的數(shù)字特征量稱為相關(guān)系數(shù)。一般用r表示。
相關(guān)系數(shù)的值,僅僅是一個(gè)比值。它不是由相等單位度量而來(即不等距),也不是百分比,因此,不能直接作加、減、乘、除。
相關(guān)系數(shù)只能描述兩個(gè)變量之間的變化方向及密切程度,并不能揭示二者之間的內(nèi)在本質(zhì)聯(lián)系。
第二節(jié) 積差相關(guān)
一、概念及其適用范圍
1.積差相關(guān)的概念
當(dāng)兩個(gè)變量都是正態(tài)連續(xù)變量,而且兩者之間呈線性關(guān)系,表示這兩個(gè)變量之間的相關(guān)稱為積差相關(guān)。
2.積差相關(guān)使用的條件
?。?)兩個(gè)變量都
第十二章 回歸分析
第一節(jié) 一元線性回歸
一元線性回歸是指只有一個(gè)自變量的線性回歸。
一、回歸線
一條最能代表散點(diǎn)圖上分布趨勢(shì)的直線,這條最優(yōu)擬合線即稱為回歸線。常用的擬合這條回歸線的原則,就是使各點(diǎn)與該線縱向距離的平方和為最小。
二、回歸方程
確定回歸線的方程稱回歸方程。
1.用最小二乘方法求回歸系數(shù)
公式(12.2a)或(12.2b)。
2.求截距
公式(12.3a)或(12.3b)。
三、用原始數(shù)據(jù)計(jì)算回歸系數(shù)
公式(12.4a)或(12.4b)。
第二節(jié) 一元線性回歸方程的檢驗(yàn)
一、估計(jì)誤差的標(biāo)準(zhǔn)差
公式(12.9)。
二、一元線性回歸方程檢驗(yàn)的方法
一元線性回歸方程檢驗(yàn)有三種等效的方法:
(1)對(duì)回歸方程進(jìn)行方差分析;
(2)對(duì)兩個(gè)變量的相關(guān)系數(shù)進(jìn)行與總體零相關(guān)的顯著性檢驗(yàn);
?。?)對(duì)回歸系數(shù)進(jìn)行顯著性檢驗(yàn)
三、一元線性回歸系數(shù)顯著性檢驗(yàn)方法
在回歸線上,當(dāng)與所有自變量X相對(duì)應(yīng)的各組因變量Y的殘值都呈正態(tài)分布,并且殘值方差為齊性時(shí),由X估計(jì)Y回歸系數(shù)的標(biāo)準(zhǔn)誤為公式(12.11)或(12.12)??梢杂霉剑?2.13)或公式(12.14)進(jìn)行顯著性檢驗(yàn)。
三、測(cè)定系數(shù)
測(cè)定系數(shù)指回歸平方和在總平方和中所占比例,這個(gè)比例越大,意味著誤差平方和所占比例越小,預(yù)測(cè)效果就越好。測(cè)定系數(shù)同時(shí)等于相關(guān)系數(shù)的平方。
第三節(jié) 一元線性回歸方程的應(yīng)用
一、用樣本回歸方程推算因變量的回歸值
二、對(duì)因變量真值的預(yù)測(cè)
第四節(jié) 多元線性回歸簡(jiǎn)介
一、二元線性回歸方程
1.二元線性回歸方程的意義
二元線性回歸方程是指Y對(duì)X1與X2的線性回歸方程。
2.二元線性回歸方程的建立原理
和一元線性回歸方程一樣,二元線性回歸方程也用最小二乘法來確定回歸系數(shù)。用公式(12.25a)和(12.25b)。
3.二元線性標(biāo)準(zhǔn)回歸方程
為了比較兩個(gè)自變量在估計(jì)預(yù)測(cè)因變量時(shí)所起作用的大小,需要將三個(gè)變量分別轉(zhuǎn)換成標(biāo)準(zhǔn)分?jǐn)?shù),然后比較由標(biāo)準(zhǔn)分?jǐn)?shù)所建立的標(biāo)準(zhǔn)回歸方程中的兩個(gè)標(biāo)準(zhǔn)回歸系數(shù),以此判斷兩個(gè)自變量作用的大小。
二、二元線性回歸的檢驗(yàn)
二元線性回歸的檢驗(yàn)包括兩個(gè)方面:一是檢驗(yàn)回歸方程的顯著性;另一是檢驗(yàn)兩個(gè)偏回歸系數(shù)的顯著性。
(一)二元線性回歸的檢驗(yàn)
二元線性回歸方程的顯著性有兩種等效的檢驗(yàn)方法:一是方差分析,二是復(fù)相關(guān)系數(shù)顯著性檢驗(yàn)。
復(fù)相關(guān)系數(shù)表示兩個(gè)自變量組合起來與因變量之間的相關(guān)程度。可通過對(duì)二元測(cè)定系數(shù)開平方根得到,然后通過查表進(jìn)行顯著性檢驗(yàn)。
(二)偏回歸系數(shù)的顯著性檢驗(yàn)
兩個(gè)偏回歸系數(shù)的顯著性檢驗(yàn)公式為(12.29a)和(12.29b)。
三、多元線性回歸方程中自變量的選擇
1.從組成回歸方程的所有自變量中選擇最優(yōu)的自變量
對(duì)所有可能的回歸方程逐一檢驗(yàn),選擇一個(gè)顯著性程度最強(qiáng)的方程。
2.逐步回歸
逐步回歸的原理是按每個(gè)自變量對(duì)因變量的作用,從大到小逐個(gè)地引入回歸方程,每引入一個(gè)自變量要對(duì)回歸方程中的每一個(gè)自變量都進(jìn)行顯著性檢驗(yàn)(即對(duì)其偏回歸系數(shù)進(jìn)行顯著性檢驗(yàn))。這樣逐步地引入自變量,并剔除不顯著的自變量,直至將所有的自變量都引入,并將不顯著的自變量都剔除為止,最后形成的回歸方程就是最優(yōu)方程。
第十三章 非參數(shù)檢驗(yàn)
假設(shè)檢驗(yàn)的方法有兩種:參數(shù)檢驗(yàn)和非參數(shù)檢驗(yàn)。
在實(shí)際研究工作中,樣本所屬的總體分布形態(tài)一般是未知的,所獲得的資料也不一定是等距變量或比率變量,因此需要采用新的統(tǒng)計(jì)方法進(jìn)行檢驗(yàn)。這種檢驗(yàn)方法不要求樣本所屬的總體呈正態(tài)分布,一般也不是對(duì)總體進(jìn)行檢驗(yàn),故稱之為自由分布的非參數(shù)檢驗(yàn)方法。非參數(shù)檢驗(yàn)不僅適用于非正態(tài)總體名義變量和次序變量的資料,而且也適用于正態(tài)總體等距變量和比率變量的資料。故應(yīng)用廣泛,但靈敏度和精確度不如參數(shù)檢驗(yàn)。
第一節(jié) 符號(hào)檢驗(yàn)
符號(hào)檢驗(yàn)是通過多兩個(gè)相關(guān)樣本的每對(duì)數(shù)據(jù)之差的符號(hào)(正號(hào)或負(fù)號(hào))進(jìn)行檢驗(yàn),以比較這兩個(gè)樣本差異的顯著性。
一、小樣本的情況
當(dāng)樣本容量較小,n <25時(shí),可用查表法進(jìn)行符號(hào)檢驗(yàn)。
二、大樣本的情況
對(duì)差數(shù)的正號(hào)與負(fù)號(hào)差異的檢驗(yàn)本屬于二項(xiàng)分布的問題,當(dāng)樣本容量較大,即n >25時(shí),二項(xiàng)分布接近正態(tài)分布,因此可以用正態(tài)分布近似處理,公式用(13.2)。
第二節(jié) 符號(hào)秩序檢驗(yàn)
威爾科克遜(F.Wilcoxon)提出了既考慮差數(shù)符號(hào),又考慮差數(shù)大小的符號(hào)秩次檢驗(yàn)法。
一、小樣本的情況
當(dāng)樣本容量n <25時(shí),可用查表法進(jìn)行符號(hào)秩次檢驗(yàn)。
二、大樣本的情況
當(dāng)樣本容量n >25時(shí),二項(xiàng)分布接近與正態(tài)。于是可用正態(tài)分布近似處理。
檢驗(yàn)統(tǒng)計(jì)量為公式(13.5)。
第三節(jié) 秩和檢驗(yàn)
當(dāng)比較兩個(gè)獨(dú)立樣本的差異時(shí),可以采用曼-惠特尼(Mann-Whitney)兩人提出的秩和檢驗(yàn)方法。又稱曼-惠特尼U檢驗(yàn)法。
一、小樣本的情況
當(dāng)兩個(gè)獨(dú)立樣本的容量n1和n2都小于10,并且n1≤n2時(shí),可以用查表法。
二、大樣本的情況
當(dāng)兩個(gè)獨(dú)立樣本的n1和n2都大于10,T分布接近與正態(tài),對(duì)于兩個(gè)樣本的差異可以用正態(tài)分布的Z比率進(jìn)行檢驗(yàn)。公式(13.8)。
第四節(jié) 中位數(shù)檢驗(yàn)
中位數(shù)的檢驗(yàn)方法是將各組樣本數(shù)據(jù)合在一起找出共同的中位數(shù),然后分別計(jì)算每個(gè)樣本在共同中位數(shù)上、下的頻數(shù),再進(jìn)行r×c表卡方檢驗(yàn)。
第五節(jié) 單向秩次方差分析
對(duì)于幾個(gè)獨(dú)立樣本差異的顯著性,可以用克魯斯?fàn)枺╓.H.Kruskal)和沃利斯(W.A.Wallis)所提出的單向秩次方差分析進(jìn)行檢驗(yàn)。這種方法又稱為H檢驗(yàn)法。它相當(dāng)于對(duì)多組平均數(shù)所進(jìn)行的參數(shù)的方差分析。但是它不需要對(duì)樣本所屬的幾個(gè)總體做正態(tài)分布及方差齊性的假定。它處理的是秩次變量的資料,是用秩次進(jìn)行的非參數(shù)的方差分析。
這種檢驗(yàn)方法是將所有樣本的數(shù)據(jù)合在一起,按從小到達(dá)編秩次,然后計(jì)算各樣本的秩次和。如果各組有顯著性差異,在各組容量相等的情況下,各組秩次和應(yīng)當(dāng)相等或趨于相等;如果各組秩次和相差較大,那么各組有顯著性差異的可能性較大。
一、樣本容量較小或組數(shù)較小的情況
當(dāng)各組容量n≤5時(shí),或者樣本組數(shù)k≤3,可用公式(13.9)作為檢驗(yàn)統(tǒng)計(jì)量。
二、樣本容量較大或組數(shù)較多的情況
當(dāng)各組容量n >5,或樣本組數(shù)k >3時(shí),H值的抽樣分布接近于自由度df=k-1的卡方分布,因此,可進(jìn)行卡方檢驗(yàn)。
第六節(jié) 雙向秩次方差分析
雙向秩次方差分析,處理的是幾個(gè)相關(guān)樣本次序變量的資料。雙向秩次方差分析是在同一個(gè)對(duì)象(或匹配的對(duì)象)接受k次實(shí)驗(yàn)處理所獲得原始數(shù)據(jù)之間編秩次。如果各次實(shí)驗(yàn)導(dǎo)致差異不顯著,各次實(shí)驗(yàn)產(chǎn)生的秩次和應(yīng)當(dāng)相等或趨于相等;如果各次實(shí)驗(yàn)秩次和相差較大,那么,實(shí)驗(yàn)產(chǎn)生顯著性差異的可能性較大。
一、樣本容量較小及實(shí)驗(yàn)次數(shù)較少的情況
當(dāng)樣本容量n≤9;k=3;或n≤4,k=4時(shí),可用公式(13.10)作為檢驗(yàn)統(tǒng)計(jì)量。
二、樣本容量較大或?qū)嶒?yàn)次數(shù)較多的情況
當(dāng)k=3,n >9;k=4,n >4;或k >4時(shí),上述檢驗(yàn)統(tǒng)計(jì)量的抽樣分布接近于df=k-1的卡方分布,于是可以用卡方近似處理。
第十四章 抽樣設(shè)計(jì)
第一節(jié) 抽樣方法
一、單純隨機(jī)抽樣
如果總體中每個(gè)個(gè)體被抽到的機(jī)會(huì)是均等的,并且在抽取一個(gè)個(gè)體之后總體內(nèi)成分不變(抽樣的獨(dú)立性),這種抽樣方法稱為單純隨機(jī)抽樣。
二、機(jī)械抽樣
把總體中的所有個(gè)體按一定順序編號(hào),然后依固定的間隔取樣,這種抽樣方法稱為機(jī)械抽樣。
三、分層抽樣
按與研究?jī)?nèi)容有關(guān)的因素或指標(biāo)先將總體劃分成幾個(gè)部分(層),然后從各部分(層)中進(jìn)行單純隨機(jī)抽樣或機(jī)械隨機(jī)抽樣,這種抽樣方法稱為分層抽樣。
在確定從各層抽取對(duì)象的個(gè)數(shù)時(shí),即考慮各層的個(gè)體數(shù)比例,又考慮各層標(biāo)準(zhǔn)差的大小,這種方法稱為最優(yōu)配置法,公式(14.1)。
四、整群抽樣
從總體中抽出來的研究對(duì)象,不是以個(gè)體作為單位,而是以整群為單位的抽樣方法,稱為整群抽樣。
第二節(jié) 總體平均數(shù)統(tǒng)計(jì)推斷時(shí)樣本容量的確定
一、由樣本平均數(shù)估計(jì)總體平均數(shù)時(shí)樣本容量的確定
1.總體標(biāo)準(zhǔn)差已知的情況
用公式(14.2)。
2. 總體標(biāo)準(zhǔn)差未知的情況
用公式(14.3)。
二、樣本平均數(shù)與總體平均數(shù)差異顯著性檢驗(yàn)時(shí)樣本容量的確定
1.總體標(biāo)準(zhǔn)差已知的情況
用公式(14.4)或(14.5)。
2.總體標(biāo)準(zhǔn)差未知的情況
用公式(14.6)或(14.7)。
三、兩個(gè)樣本平均數(shù)差異顯著性檢驗(yàn)時(shí)樣本容量的確定
1.兩個(gè)獨(dú)立樣本平均數(shù)差異顯著性檢驗(yàn)時(shí)樣本容量的確定
用公式(14.8)或(14.9)。
2.兩個(gè)相關(guān)樣本平均數(shù)差異顯著性檢驗(yàn)時(shí)樣本容量的確定
用公式(14.10)或(14.11)。
第三節(jié) 總體比率統(tǒng)計(jì)推斷及相關(guān)系數(shù)顯著性檢驗(yàn)時(shí)樣本容量的確定
一、用樣本比率估計(jì)總體比率時(shí)樣本容量的確定
當(dāng)總體比率接近0.5,隨n的增大,樣本比率的抽樣分布趨向正態(tài),這時(shí)可以近似用公式(14.12)進(jìn)行估計(jì)。
二、兩個(gè)樣本比率差異顯著性檢驗(yàn)時(shí)樣本容量的確定
用公式(14.13)或(14.14)。
三、樣本相關(guān)系數(shù)顯著性檢驗(yàn)時(shí)樣本容量的確定
在確定樣本容量時(shí),可直接查相關(guān)系數(shù)顯著性檢驗(yàn)所需樣本的容量表。
?