最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

《教育統(tǒng)計(jì)學(xué)》復(fù)習(xí)題及答案

2023-11-18 10:10 作者:答案資料  | 我要投稿

第一章 緒論

第一節(jié) 什么是統(tǒng)計(jì)學(xué)和心理統(tǒng)計(jì)學(xué)

一、什么是統(tǒng)計(jì)學(xué)

  統(tǒng)計(jì)學(xué)是研究統(tǒng)計(jì)原理和方法的科學(xué)。具體地說,它是研究如何搜集、整理、分析反映事物總體信息的數(shù)字資料,并以此為依據(jù),對(duì)總體特征進(jìn)行推斷的原理和方法。

  統(tǒng)計(jì)學(xué)分為兩大類。一類是數(shù)理統(tǒng)計(jì)學(xué)。它主要是以概率論為基礎(chǔ),對(duì)統(tǒng)計(jì)數(shù)據(jù)數(shù)量關(guān)系的模式加以解釋,對(duì)統(tǒng)計(jì)原理和方法給予數(shù)學(xué)的證明。它是數(shù)學(xué)的一個(gè)分支。另一類是應(yīng)用統(tǒng)計(jì)學(xué)。它是數(shù)理統(tǒng)計(jì)原理和方法在各個(gè)領(lǐng)域中的應(yīng)用,如數(shù)理統(tǒng)計(jì)的原理和方法應(yīng)用到工業(yè)領(lǐng)域,稱為工業(yè)統(tǒng)計(jì)學(xué);應(yīng)用到醫(yī)學(xué)領(lǐng)域,稱為醫(yī)學(xué)統(tǒng)計(jì)學(xué);應(yīng)用到心理學(xué)領(lǐng)域,稱為心理統(tǒng)計(jì)學(xué),等等。應(yīng)用統(tǒng)計(jì)學(xué)是與研究對(duì)象密切結(jié)合的各科專門統(tǒng)計(jì)學(xué)。

  二、統(tǒng)計(jì)學(xué)和心理統(tǒng)計(jì)學(xué)的內(nèi)容

  統(tǒng)計(jì)學(xué)和心理統(tǒng)計(jì)學(xué)的研究?jī)?nèi)容,從不同角度來分,可以分為不同的類型。從具體應(yīng)用的角度來分,可以分成描述統(tǒng)計(jì),推斷統(tǒng)計(jì)和實(shí)驗(yàn)設(shè)計(jì)三部分。

  1.描述統(tǒng)計(jì)

  對(duì)已獲得的數(shù)據(jù)進(jìn)行整理、概括,顯示其分布特征的統(tǒng)計(jì)方法,稱為描述統(tǒng)計(jì)。

  2.推斷統(tǒng)計(jì)

  根據(jù)樣本所提供的信息,運(yùn)用概率的理論進(jìn)行分析、論證,在一定可靠程度上,對(duì)總體分布特征進(jìn)行估計(jì)、推測(cè),這種統(tǒng)計(jì)方法稱為推斷統(tǒng)計(jì)。推斷統(tǒng)計(jì)的內(nèi)容包括總體參數(shù)估計(jì)和假設(shè)檢驗(yàn)兩部分。

  3.實(shí)驗(yàn)設(shè)計(jì)

  實(shí)驗(yàn)者為了揭示試驗(yàn)中自變量和因變量的關(guān)系,在實(shí)驗(yàn)之前所制定的實(shí)驗(yàn)計(jì)劃,稱為實(shí)驗(yàn)設(shè)計(jì)。其中包括選擇怎樣的抽樣方式;如何計(jì)算樣本容量;確定怎樣的實(shí)驗(yàn)對(duì)照形式;如何實(shí)現(xiàn)實(shí)驗(yàn)組和對(duì)照組的等組化;如何安排實(shí)驗(yàn)因素和如何控制無關(guān)因素;用什么統(tǒng)計(jì)方法處理及分析實(shí)驗(yàn)結(jié)果,等等。

  以上三部分內(nèi)容,不是截然分開,而是相互聯(lián)系的。

第二節(jié) 統(tǒng)計(jì)學(xué)中的幾個(gè)基本概念

  一、隨機(jī)變量

  具有以下三個(gè)特性的現(xiàn)象,成為隨機(jī)變量。第一,一次試驗(yàn)有多中可能結(jié)果,其所有可能結(jié)果是已知的;第二,試驗(yàn)之前不能預(yù)料哪一種結(jié)果會(huì)出現(xiàn);第三,在相同的條件下可以重復(fù)試驗(yàn)。隨機(jī)現(xiàn)象的每一種結(jié)果叫做一個(gè)隨機(jī)事件。我們把能表示隨機(jī)現(xiàn)象各種結(jié)果的變量稱為隨機(jī)變量。統(tǒng)計(jì)處理的變量都是隨機(jī)變量。

  二、總體和樣本

  總體是我們所研究的具有共同特性的個(gè)體的總和??傮w中的每個(gè)單位成為個(gè)體。樣本是從總體中抽取的作為觀察對(duì)象的一部分個(gè)體。當(dāng)總體所包含的個(gè)數(shù)有限時(shí),這一總體稱為有限總體。而總體所包含的個(gè)數(shù)無限時(shí),則稱為無限總體。樣本中包含的個(gè)體數(shù)目稱為樣本的容量,一般用n來表示。一般來說,樣本中個(gè)體數(shù)目大于30稱為大樣本,等于或小于30稱為小樣本。在對(duì)數(shù)據(jù)進(jìn)行處理時(shí),大樣本和小樣本所用的統(tǒng)計(jì)方法不一定相同。

  三、統(tǒng)計(jì)量和參數(shù)

  樣本上的數(shù)據(jù)特征是統(tǒng)計(jì)量??傮w上的各種數(shù)字特征是參數(shù)。在進(jìn)行統(tǒng)計(jì)推斷時(shí),就是根據(jù)樣本統(tǒng)計(jì)量來推斷總體相應(yīng)的參數(shù)。

心理統(tǒng)計(jì)學(xué)大綱

第二章 數(shù)據(jù)的初步整理

第一節(jié) 數(shù)據(jù)的來源、種類及其分類

  一、統(tǒng)計(jì)資料的來源

  統(tǒng)計(jì)資料的來源有兩個(gè)方面:

  1、經(jīng)常性資料

  2、專題性資料 (1)調(diào)查資料 (2)實(shí)驗(yàn)資料

  二、數(shù)據(jù)的種類

  數(shù)據(jù)是隨機(jī)變量的觀察值。它是用來描述對(duì)客觀事物觀察測(cè)量的數(shù)值。數(shù)據(jù)的種類不同,統(tǒng)計(jì)處理的方法也不同。

  根據(jù)統(tǒng)計(jì)數(shù)據(jù)來源可分為點(diǎn)計(jì)數(shù)據(jù)和度量數(shù)據(jù);按隨機(jī)變量取值情況,可分為間斷性隨機(jī)變量的數(shù)據(jù)和連續(xù)性隨機(jī)變量的數(shù)據(jù)。

  1、點(diǎn)計(jì)數(shù)據(jù)和度量數(shù)據(jù)

  點(diǎn)計(jì)數(shù)據(jù)是指計(jì)算個(gè)數(shù)所獲得的數(shù)據(jù)。度量數(shù)據(jù)是指用一定的工具或一定的標(biāo)準(zhǔn)測(cè)量所獲得的數(shù)據(jù)。

  2、間斷性隨機(jī)變量的數(shù)據(jù)和連續(xù)性隨機(jī)變量的數(shù)據(jù)

  取值個(gè)數(shù)有限的數(shù)據(jù),稱為間斷性隨機(jī)變量的數(shù)據(jù)。這種數(shù)據(jù)的單位是獨(dú)立的,兩個(gè)單位之間不能劃分成細(xì)小的單位,一般用整數(shù)表示。取值個(gè)數(shù)無限的(不可數(shù)的)數(shù)據(jù),稱為連續(xù)性隨機(jī)變量的數(shù)據(jù)。它們可能的取值范圍能連續(xù)充滿某一個(gè)區(qū)間。數(shù)據(jù)的單位之間可以再劃分成無限多個(gè)細(xì)小的單位。數(shù)據(jù)可以用小數(shù)表示。

  三、數(shù)據(jù)的統(tǒng)計(jì)分類

  數(shù)據(jù)的統(tǒng)計(jì)分類,是指按照研究對(duì)象的本質(zhì)特征,根據(jù)分析研究的目的、任務(wù),以及統(tǒng)計(jì)分析時(shí)所用統(tǒng)計(jì)方法的可能性,將所獲得的數(shù)據(jù)進(jìn)行分組歸類。它是對(duì)數(shù)據(jù)進(jìn)行歸納、整理、簡(jiǎn)化、概括的第一步,為進(jìn)一步分析研究打下基礎(chǔ)。

  分類的標(biāo)志按形式劃分,可分為性質(zhì)類別和數(shù)量類別。性質(zhì)類別是按事物的不同性質(zhì)進(jìn)行分類。這種分類不表明事物之間的差異。性質(zhì)類別還可以進(jìn)一步分成不同的層次。數(shù)量類別是按數(shù)值大小進(jìn)行分類,并排成順序。在排列順序時(shí),可以直接按數(shù)值大小進(jìn)行排列,也可以用等級(jí)順序進(jìn)行排列。

第二節(jié) 統(tǒng)計(jì)表

一、統(tǒng)計(jì)表的結(jié)構(gòu)及其編制的原則和要求。

統(tǒng)計(jì)表一般由標(biāo)題、表號(hào)、標(biāo)目、線條、數(shù)字、表注等項(xiàng)構(gòu)成。

標(biāo)題 標(biāo)題是表的名稱,應(yīng)確切地、簡(jiǎn)明扼要地說明表的內(nèi)容。

表號(hào) 表號(hào)是表的序號(hào)。

標(biāo)目 標(biāo)目是表格中對(duì)統(tǒng)計(jì)數(shù)據(jù)分類的項(xiàng)目。

線條 線條不宜過多。

數(shù)字 表內(nèi)數(shù)字必須準(zhǔn)確,一律用阿拉伯?dāng)?shù)字表示,位次對(duì)齊,小數(shù)的位數(shù)一致。

表注 它不是表的必要組成部分。

二、統(tǒng)計(jì)表的總類

  1、簡(jiǎn)單表

  只列出觀察對(duì)象的名稱、地點(diǎn)、時(shí)序或統(tǒng)計(jì)指標(biāo)名稱的統(tǒng)計(jì)表為簡(jiǎn)單表。

  2、分組表 只按一個(gè)標(biāo)志分組的統(tǒng)計(jì)表為分組表。

  3、復(fù)合表 按兩個(gè)或兩個(gè)以上標(biāo)志分組的統(tǒng)計(jì)表為復(fù)合表。

  三、頻數(shù)分布表列法

  1、簡(jiǎn)單頻數(shù)分布表

  (1)間斷變量的頻數(shù)分布表 (2)連續(xù)變量的頻數(shù)分布表

  步驟:①求全距?、跊Q定組數(shù)和組距?、蹧Q定組限決定組限 ④登記頻數(shù)

  2、累積頻數(shù)和累積百分比分布表

  (1)累積頻數(shù)分布表 用累積頻數(shù)表示的頻數(shù)分布表稱為累積頻數(shù)分布表。

 ?。?)累積百分比分布表

  累積百分比分布表是累積頻數(shù)分布表的變型。它是用累積百分比表示的頻數(shù)分布表。

第三節(jié) 統(tǒng)計(jì)圖

  一、統(tǒng)計(jì)圖的結(jié)構(gòu)及其繪制規(guī)則

  統(tǒng)計(jì)圖由標(biāo)題、圖號(hào)、標(biāo)目、圖形、圖注等項(xiàng)構(gòu)成。下面按其構(gòu)成部分說明繪圖的基本規(guī)則。

  標(biāo)題 圖的名稱應(yīng)簡(jiǎn)明扼要,切合圖的內(nèi)容,必要時(shí)可注明時(shí)間、地點(diǎn)。

  圖號(hào) 文章中若有幾幅畫,則需按其出現(xiàn)的先后次序編上序號(hào),寫在圖題的作前方。

  標(biāo)目 對(duì)于有縱橫軸的統(tǒng)計(jì)圖,應(yīng)在縱橫軸上分別標(biāo)明統(tǒng)計(jì)項(xiàng)目及其尺度。

  圖形 圖形線在圖中為最粗,而且要清晰。

  圖注 圖注不是圖中必要組成部分。

  二、表示間斷變量的統(tǒng)計(jì)圖

  1、直條圖

  直條圖是用直條的長(zhǎng)短表示統(tǒng)計(jì)事項(xiàng)數(shù)量的圖形。它主要是用來比較性質(zhì)相似的間斷性資料。

  2、圓形圖

  圓形圖是用來表示間斷性資料構(gòu)成比的圖形。

  三、表示連續(xù)變量的統(tǒng)計(jì)圖

  1、線形圖

  線形圖用來表示連續(xù)性資料。它能表示兩個(gè)變量之間的函數(shù)關(guān)系;一種事物隨另一種事物變化的情況;某種事物隨時(shí)間推移的發(fā)展趨勢(shì)等。

  2、頻數(shù)分布圖

  常用的頻數(shù)分布圖有直方圖、多邊圖和累積多邊圖。

 ?。?)直方圖

  直方圖用面積表示頻數(shù)分布。用各組上下限上的矩形面積表示各組頻數(shù)。

 ?。?)多邊圖

  多邊圖以縱軸上的高度表示頻數(shù)的多少。

 ?。?)累積頻數(shù)和累積百分比多邊圖

第三章 集中量

  集中量是代表一組數(shù)據(jù)典型水平或幾種趨勢(shì)的量。它能反映頻數(shù)分布中大量數(shù)據(jù)向某一點(diǎn)集中的情況。

第一節(jié) 算術(shù)平均數(shù)

  一、算術(shù)平均數(shù)的概念

  算術(shù)平均數(shù)是所有觀察值得總和除以總頻數(shù)所得之商,簡(jiǎn)稱為平均數(shù)或均數(shù)。計(jì)算公式為(3.1)。

  算術(shù)平均數(shù)的特征:

  (1)觀察值的總和等于算術(shù)平均數(shù)的N倍;

 ?。?)各觀察值與其算術(shù)平均數(shù)之差的總和等于零;

 ?。?)若一組觀察值是由兩部分(或幾部分)組成,這組觀察值的算術(shù)平均數(shù)可以由組成部分算術(shù)平均數(shù)而求得;

  二、算術(shù)平均數(shù)的應(yīng)用及其優(yōu)缺點(diǎn)

  算術(shù)平均數(shù)具備一個(gè)良好的集中量所應(yīng)具備的一些條件:

  (1)反應(yīng)靈敏。

 ?。?)嚴(yán)密確定。簡(jiǎn)明易懂,計(jì)算方便。

 ?。?)適合代數(shù)運(yùn)算。

 ?。?)受抽樣變動(dòng)的影響較小。

  除此之外,算數(shù)平均數(shù)還有幾個(gè)特殊的優(yōu)點(diǎn):

 ?。?)只知一組觀察值的總和及總頻數(shù)就可以求出算術(shù)平均數(shù)。

 ?。?)用加權(quán)法可以求出幾個(gè)平均數(shù)的總平均數(shù)。

 ?。?)用樣本數(shù)據(jù)推斷總體集中量時(shí),算術(shù)平均數(shù)最接近于總體集中量的真值,它是總體平均數(shù)的最好估計(jì)值。

  (4)在計(jì)算方差、標(biāo)準(zhǔn)差、相關(guān)系數(shù)以及進(jìn)行統(tǒng)計(jì)推斷時(shí),都要用到它。

  算術(shù)平均數(shù)的缺點(diǎn):

 ?。?)易受兩極端數(shù)值(極大或極?。┑挠绊?。

(2)一組數(shù)據(jù)中某個(gè)數(shù)值的大小不夠確切時(shí)就無法計(jì)算其算術(shù)平均數(shù)。

第二節(jié) 中位數(shù)

  一、中位數(shù)的概念

  中位數(shù)是位于依一定順序排列的一組數(shù)據(jù)中央位置的數(shù)值,在這一數(shù)值上、下各有一半頻數(shù)分布著。

  二、中位數(shù)的計(jì)算方法

  1、原始數(shù)值計(jì)算方法

  將一組原始數(shù)據(jù)依大小順序排列后,若總頻數(shù)為奇數(shù),就以位于中央的數(shù)據(jù)作為中位數(shù);若總頻數(shù)為偶數(shù),則以最中間的兩個(gè)數(shù)據(jù)的算術(shù)平均數(shù)作為中位數(shù)。

  2、頻數(shù)分布表計(jì)算法

  若一組原始數(shù)據(jù)已經(jīng)編成了頻數(shù)分布表,可用內(nèi)插法,通過頻數(shù)分布表計(jì)算中位數(shù)。

  三、百分位數(shù)的概念及其計(jì)算方法

  百分位數(shù)是位于依一定順序排列的一組數(shù)據(jù)中某一百分位置的數(shù)值。在心理測(cè)量中,常通過計(jì)算百分位數(shù)來說明、解釋和評(píng)價(jià)分?jǐn)?shù)在團(tuán)體中所處的位置。計(jì)算公式為(3.5)。

  四、中位數(shù)的應(yīng)用及其優(yōu)缺點(diǎn)

中位數(shù)雖然也具備一個(gè)良好的集中量所應(yīng)具備的某些條件,例如比較嚴(yán)格確定、簡(jiǎn)明易懂,計(jì)算簡(jiǎn)便,受抽樣變動(dòng)影響較小,但是它不適合進(jìn)一步的代數(shù)運(yùn)算。它適用于以下幾種情況:(1)一組數(shù)據(jù)中有特大或特小兩極端數(shù)值時(shí);(2)一組數(shù)據(jù)中有個(gè)別數(shù)據(jù)不確切時(shí);(3)資料屬于等級(jí)性質(zhì)時(shí)。

第三節(jié) 眾數(shù)

  一、眾數(shù)的概念

  眾數(shù)是集中量的一種指標(biāo)。對(duì)眾數(shù)有理論眾數(shù)及粗略眾數(shù)兩種定義方法。理論眾數(shù)是指與頻數(shù)分布曲線最高點(diǎn)相對(duì)應(yīng)的橫坐標(biāo)上的一點(diǎn)。粗略眾數(shù)是指一組數(shù)據(jù)中頻數(shù)出現(xiàn)最多的那個(gè)數(shù)。

  二、眾數(shù)的計(jì)算方法

  1、用觀察法直接尋找粗略眾數(shù)

  粗略眾數(shù)不需要計(jì)算,可通過觀察直接尋得。

  2、用公式求理論眾數(shù)的近似值

  (1)皮爾遜(K.Person)的經(jīng)驗(yàn)法

  利用皮爾遜發(fā)現(xiàn)的算術(shù)平均數(shù)、中位數(shù)、眾數(shù)三者關(guān)系來求理論眾數(shù)近似值的經(jīng)驗(yàn)公式為(3.6)。

  (2)金氏(W.I.King)插補(bǔ)法

  當(dāng)頻數(shù)分布呈偏態(tài),即眾數(shù)所在組以上各組頻數(shù)總和與以下各組頻數(shù)總和相差較多時(shí),可以用金氏公式計(jì)算眾數(shù),以進(jìn)行比率調(diào)整。其公式為(3.7)。

  三、眾數(shù)的應(yīng)用及其優(yōu)缺點(diǎn)

  眾數(shù)雖然簡(jiǎn)明易懂,但是它并不具備一個(gè)良好的集中量的基本條件。它主要在以下情況下使用:(1)當(dāng)需要快速而粗略地找出一組數(shù)據(jù)的代表值時(shí);(2)當(dāng)需要利用算術(shù)平均數(shù)、中位數(shù)和眾數(shù)三者關(guān)系來粗略判斷頻數(shù)分布的形態(tài)時(shí);(3)利用眾數(shù)幫助分析解釋一組頻數(shù)分布是否確實(shí)具有兩個(gè)頻數(shù)最多的集中點(diǎn)時(shí)。

第四節(jié) 加權(quán)平均數(shù)、幾何平均數(shù)

  一、加權(quán)平均數(shù)

  加權(quán)平均數(shù)是不同比重?cái)?shù)據(jù)(或平均數(shù))的平均數(shù)。計(jì)算公式為(3.8)或(3.9)。

  二、幾何平均數(shù)

  幾何平均數(shù)是N個(gè)數(shù)值連乘積的N次方根。計(jì)算公式為(3.10)。

  當(dāng)一個(gè)數(shù)列的后一個(gè)數(shù)據(jù)是以前一個(gè)數(shù)據(jù)為基礎(chǔ)成比例增長(zhǎng)時(shí),要用幾何平均數(shù)求其平均增長(zhǎng)率。

第四章 差異量

第一節(jié) 全距、四分位距、百分位距(略)

第二節(jié) 平均差

  一、平均差的概念

  所謂平均差,就是每一個(gè)數(shù)據(jù)與該組數(shù)據(jù)的中位數(shù)(或算術(shù)平均數(shù))離差的絕對(duì)值的算術(shù)平均數(shù)。

  二、平均差的計(jì)算方法

  用原始數(shù)據(jù)計(jì)算平均差的公式為(4.3)

  三、平均差的優(yōu)缺點(diǎn)

  平均差意義明確,計(jì)算容易,每個(gè)數(shù)據(jù)都參加了運(yùn)算,考慮到全部的離差,反應(yīng)靈敏。但計(jì)算要用絕對(duì)值,不適合代數(shù)運(yùn)算。

第三節(jié) 方差和標(biāo)準(zhǔn)差

  一、方差和標(biāo)準(zhǔn)差的概念

  方差是指離差平方的算術(shù)平均數(shù)。其定義公式為(4.5),計(jì)算公式是(4.7)。

  標(biāo)準(zhǔn)差是指離差平方和平均后的方根。即方差的平方根。其定義公式為(4.6),計(jì)算公式是(4.8)。

  二、方差和標(biāo)準(zhǔn)差的應(yīng)用及其優(yōu)缺點(diǎn)

  方差和標(biāo)準(zhǔn)差的優(yōu)點(diǎn):反應(yīng)靈敏,隨任何一個(gè)數(shù)據(jù)的變化而表示;一組數(shù)據(jù)的方差和標(biāo)準(zhǔn)差有確定的值;計(jì)算簡(jiǎn)單;適合代數(shù)計(jì)算,不僅求方差和標(biāo)準(zhǔn)差的過程中可以進(jìn)行代數(shù)運(yùn)算,而且可以將幾個(gè)方差和標(biāo)準(zhǔn)差綜合成一個(gè)總的方差和標(biāo)準(zhǔn)差;用樣本數(shù)據(jù)推斷總體差異量時(shí),方差和標(biāo)準(zhǔn)差是最好的估計(jì)量。

第三節(jié) 相對(duì)差異量

  一、相對(duì)差異量的概念

  上述全距、四分位距、平均差及標(biāo)準(zhǔn)差都是帶有與原觀察值相同單位的名數(shù),稱為絕對(duì)差異量。這種差異量對(duì)兩種單位不同,或單位相同而兩個(gè)平均數(shù)相差較大的資料,都無法比較差異的大小,必須用相對(duì)差異量(即差異系數(shù))進(jìn)行比較。

  所謂差異系數(shù)是指標(biāo)準(zhǔn)差與其算術(shù)平均數(shù)的百分比。它是沒有單位的相對(duì)數(shù)。其計(jì)算公式是(4.11)

  二、差異系數(shù)的用途

  1、比較不同單位資料的差異程度

  2、比較單位相同而平均數(shù)相差數(shù)較大的兩組資料的差異量程度

  3、可判斷特殊差異情況

  三、差異系數(shù)的應(yīng)用條件

  從測(cè)驗(yàn)的理論來說,只有等比量表才使平均數(shù)等于零成為不可能。也就是說,用來測(cè)量的量尺,既具有等距的單位,又具有絕對(duì)零點(diǎn),這時(shí)所測(cè)量出的數(shù)據(jù)其平均數(shù)才不可能等于零,這時(shí)才能計(jì)算差異系數(shù)。

第五節(jié) 偏態(tài)量及峰態(tài)量

  偏態(tài)量及峰態(tài)量是用以描述數(shù)據(jù)分布特征的統(tǒng)計(jì)量。

  一、偏態(tài)量

  1、利用算術(shù)平均數(shù)與眾數(shù)或中位數(shù)的距離來計(jì)算。其公式為(4.12)。

  2、根據(jù)動(dòng)差來計(jì)算。其公式為(4.14)。

  二、峰態(tài)量

  1、用兩個(gè)百分位距來計(jì)算。其公式為(4.16)。

  2、根據(jù)動(dòng)差來計(jì)算。其公式為(4.17)。

第五章 概率及概率分布

第一節(jié) 概率的一般概念

  一、概率的定義

  概率因?qū)で蟮姆椒ú煌袃煞N定義,即后驗(yàn)概率和先驗(yàn)概率。

  1、后驗(yàn)概率的定義

  以隨機(jī)事件A在大量重復(fù)試驗(yàn)中出現(xiàn)的穩(wěn)定頻率制作為隨機(jī)事件A概率的估計(jì)值,這樣尋得的概率稱為后驗(yàn)概率。計(jì)算公式是(5.2)。

  2.先驗(yàn)概率的定義

  先驗(yàn)概率是通過古典概率模型加以定義的,故又稱為古典概率。古典概率模型要求滿足兩個(gè)條件:(1)試驗(yàn)的所有可能結(jié)果是有限的;(2)每一種可能結(jié)果出現(xiàn)的可能性(概率)相等。若所有可能結(jié)果的總數(shù)為n,隨機(jī)事件A包括m個(gè)可能結(jié)果,則事件A的概率計(jì)算公式為(5.3)。

  二、概率的性質(zhì)

  1、任何隨機(jī)事件A的概率都是介于0與1之間的正數(shù);

  2、不可能事件的概率等于0;

  3、必然事件的概率等于1。

  三、概率的加法和乘法

  1、概率的加法

  在一次試驗(yàn)中不可能同時(shí)出現(xiàn)的事件稱為互不相容的事件。

  兩個(gè)互不相容事件和的概率,等于這兩個(gè)事件概率之和。用公式表示為(5.4)和(5.5)。

  2.概率的乘法

  A事件出現(xiàn)的概率不影響B(tài)事件出現(xiàn)的概率,這兩個(gè)事件為獨(dú)立事件。

  兩個(gè)獨(dú)立事件的概率,等于這兩個(gè)事件概率的乘積。用公式表示為(5.6)和(5.7)。

 二項(xiàng)分布

一、滿足以下條件的試驗(yàn)稱為二項(xiàng)試驗(yàn):

(1)一次試驗(yàn)只有兩種可能結(jié)果。如:正面和反面;(2)各次試驗(yàn)相互獨(dú)立,互不影響;(3)各次試驗(yàn)中各事件概率相等。

二、二項(xiàng)分布:是一種離散型隨機(jī)變量的概率分布。

用n次方的二項(xiàng)展開式來表達(dá)在n次二項(xiàng)試驗(yàn)中成功事件出現(xiàn)不同次數(shù)(X=0,1,…,n)的概念分布叫做二項(xiàng)分布。

  二項(xiàng)展開式的通式(5.8)就是二項(xiàng)分布函數(shù),運(yùn)用這一函數(shù)式可以直接求出成功事件恰好出現(xiàn)X次的概率。

  三、二項(xiàng)分布圖

  從二項(xiàng)分布圖可以看出,當(dāng)p=q,不管n多大,二項(xiàng)分布呈對(duì)稱形。當(dāng)n很大時(shí),二項(xiàng)分布接近于正態(tài)分布。當(dāng)n趨近于無限大時(shí),正態(tài)分布是二項(xiàng)分布的極限。

  四、二項(xiàng)分布的平均數(shù)和標(biāo)準(zhǔn)差

  當(dāng)二項(xiàng)分布接近于正態(tài)分布時(shí),在n次二項(xiàng)實(shí)驗(yàn)中成功事件出現(xiàn)次數(shù)的平均數(shù)和標(biāo)準(zhǔn)差分別可以由公式(5.9)和(5.10)計(jì)算而得。

  五、二項(xiàng)分布的應(yīng)用

  二項(xiàng)分布函數(shù)除了用來求成功事件恰好出現(xiàn)X次的概率之外,在心理學(xué)中主要用來判斷實(shí)驗(yàn)結(jié)果的機(jī)遇性與真實(shí)性的界限。

  屬于二項(xiàng)分布的問題,若實(shí)驗(yàn)次數(shù)n較大,一般都用正態(tài)分布近似處理。

第三節(jié) 正態(tài)分布

  正態(tài)分布是一種連續(xù)型隨機(jī)變量的概率分布。

  一、正態(tài)曲線

  1.正態(tài)曲線函數(shù)

  正態(tài)曲線的函數(shù)式是公式(5.11)。

  標(biāo)準(zhǔn)正態(tài)分布的函數(shù)式是公式(5.12)。

  2.正態(tài)曲線的特點(diǎn)

 ?。?)曲線在Z=0處為最高點(diǎn)。

 ?。?)曲線以Z=0處為中心,雙側(cè)對(duì)稱。

 ?。?)曲線從最高點(diǎn)向左右緩慢下降,并無限延伸,但永遠(yuǎn)不與基線相交。

 ?。?)標(biāo)準(zhǔn)正態(tài)分布上的平均數(shù)為0,標(biāo)準(zhǔn)差為1。

 ?。?)曲線從最高點(diǎn)向左右延伸時(shí),在正負(fù)1個(gè)標(biāo)準(zhǔn)差是拐點(diǎn)。

  二、正態(tài)曲線的面積與縱線

  1、累積正態(tài)分布函數(shù)

  2、標(biāo)準(zhǔn)正態(tài)分布下面積的求法

  3、正態(tài)曲線的縱線

  三、正態(tài)分布在測(cè)驗(yàn)計(jì)分方面的應(yīng)用

  1、將原始分?jǐn)?shù)轉(zhuǎn)換成標(biāo)準(zhǔn)分?jǐn)?shù)

  標(biāo)準(zhǔn)分?jǐn)?shù)的意義:第一,各科標(biāo)準(zhǔn)分?jǐn)?shù)的單位是絕對(duì)等價(jià)的;第二、標(biāo)準(zhǔn)分?jǐn)?shù)的正負(fù)和大小可以反映出考生在全體考分中所處的地位。

  2、確定錄用分?jǐn)?shù)線

  3、確定等級(jí)評(píng)定的人數(shù)

  4、品質(zhì)評(píng)定數(shù)量化

第六章 抽樣分布及總體平均數(shù)的推斷

第一節(jié) 抽樣分布

  一、抽樣分布的概念

  要區(qū)分以下三種不同性質(zhì)的分布:

  1、總體分布:總體內(nèi)個(gè)體數(shù)值的頻數(shù)分布。

  2、樣本分布:樣本內(nèi)個(gè)體數(shù)值的頻數(shù)分布。

  3、抽樣分布:某一種統(tǒng)計(jì)量的概率分布。

  二、平均數(shù)抽樣分布的幾個(gè)定理

  1、從總體中隨機(jī)抽出容量為n的一切可能樣本的平均數(shù)之平均數(shù)等于總體的平均數(shù)。公式表示為(6.1)。

  2、容量為n的平均數(shù)在抽樣分布上的標(biāo)準(zhǔn)差,等于總體標(biāo)準(zhǔn)差除以n的方根。公式表示為(6.2)。

  3.從正態(tài)總體中,隨機(jī)抽取的容量為n的一切可能樣本平均數(shù)的分布也呈正態(tài)分布。

  4.雖然總體不呈正態(tài)分布,如果樣本容量較大,反映總體μ和σ的樣本平均數(shù)的抽樣分布,也接近于正態(tài)分布。

  三、樣本平均數(shù)與總體平均數(shù)離差統(tǒng)計(jì)量的形態(tài)

  從正態(tài)總體中隨機(jī)抽取的容量為n的一切可能樣本平均數(shù)為中心呈正態(tài)分布。當(dāng)總體標(biāo)準(zhǔn)差已知時(shí),一切可能樣本平均數(shù)與總體平均數(shù)的離差統(tǒng)計(jì)量呈標(biāo)準(zhǔn)正態(tài)分布(6.3)。

  總體標(biāo)準(zhǔn)差σ的無偏估計(jì)量S等于樣本統(tǒng)計(jì)量σx乘以貝賽耳氏校正數(shù),公式(6.4)。

  從正態(tài)總體中隨機(jī)抽取容量為n的一切可能樣本平均數(shù)的抽樣分布呈正態(tài)分布。當(dāng)總體標(biāo)準(zhǔn)差σ未知,需用估計(jì)值S來代替,于是平均數(shù)標(biāo)準(zhǔn)誤也被平均數(shù)標(biāo)準(zhǔn)誤的估計(jì)值所代替,這時(shí)一切可能樣本平均數(shù)與總體平均數(shù)的離差統(tǒng)計(jì)量呈t分布(6.6)。

  t分布與正態(tài)分布的相似之處:t分布基線上的t值從-∞-+∞;從平均數(shù)等于0處,左側(cè)t值為負(fù),右側(cè)t值為正;曲線以平均數(shù)處為最高點(diǎn)向兩側(cè)逐漸下降,尾部無限延伸,永不與基線相接,呈單峰對(duì)稱形。區(qū)別之處在于:t分布的形態(tài)隨自由度(df=n-1)的變化呈一簇分布形態(tài)(即自由度不同的t分布形態(tài)也不同,見圖6.1)。自由度逐漸增大時(shí),t分布逐漸接近正態(tài)分布。

  自由度是指總體參數(shù)估計(jì)量中變量值獨(dú)立自由變化的個(gè)數(shù)。

第二節(jié) 總體平均數(shù)的參數(shù)估計(jì)

  一、總體參數(shù)估計(jì)的基本原理

  1、點(diǎn)估計(jì)

  用某一樣本統(tǒng)計(jì)量的值來估計(jì)相應(yīng)總體參數(shù)的值叫總體參數(shù)的點(diǎn)估計(jì)。

  2、區(qū)間估計(jì)

  以樣本統(tǒng)計(jì)量的抽樣分布(概率分布)為理論依據(jù),按一定概率要求,由樣本統(tǒng)計(jì)量的值估計(jì)總體參數(shù)值的所在范圍,稱為總體參數(shù)的區(qū)間估計(jì)。

  區(qū)間估計(jì)涉及置信水平和置信區(qū)間。

  二、σ已知條件下總體平均數(shù)的區(qū)間估計(jì)

  當(dāng)總體σ已知,總體呈正態(tài)分布,樣本容量無論大小時(shí),或者當(dāng)總體σ已知,總體雖不呈正態(tài)分布,但樣本容量較大(n >30)時(shí),樣本平均數(shù)與總體平均數(shù)離差統(tǒng)計(jì)量均呈正態(tài)分布。區(qū)間估計(jì)的計(jì)算公式為(6.8)和(6.9)。

  三、σ未知條件下總體平均數(shù)的區(qū)間估計(jì)

  1、σ未知條件下總體平均數(shù)的區(qū)間估計(jì)的基本原理

  當(dāng)總體σ未知,總體呈正態(tài)分布,樣本容量無論大小時(shí),或者當(dāng)總體σ未知,總體雖不呈正態(tài)分布,但樣本容量較大(n >30)時(shí),樣本平均數(shù)與總體平均數(shù)離差統(tǒng)計(jì)量均呈t分布。區(qū)間估計(jì)的計(jì)算公式為(6.10)和(6.11)。

  2、小樣本的情況

  3、大樣本的情況

  可以用正態(tài)分布近似處理。

第三節(jié) 假設(shè)檢驗(yàn)的基本原理

  利用樣本信息,根據(jù)一定概率,對(duì)總體參數(shù)或分布的某一假設(shè)作出拒絕或保留的決斷,稱為假設(shè)檢驗(yàn)。

  一、假設(shè)

  假設(shè)檢驗(yàn)一般有兩個(gè)相互對(duì)立的假設(shè)。即零假設(shè)(或稱原假設(shè)、虛無假設(shè)、解消假設(shè))和備擇假設(shè)(或稱研究假設(shè)、對(duì)立假設(shè))。假設(shè)檢驗(yàn)是從零假設(shè)出發(fā),視其被拒絕的機(jī)會(huì),從而得出決斷。

  二、小概率事件

  把出現(xiàn)小概率的隨機(jī)事件稱為小概率事件。小概率事件是否出現(xiàn),這是對(duì)假設(shè)作出決斷的依據(jù)。

  三、顯著性水平

  拒絕零假設(shè)的概率稱為顯著性水平。顯著性水平和可靠性程度之間的關(guān)系是:兩者之和為1。

  四、統(tǒng)計(jì)決斷的兩類錯(cuò)誤及其控制

  如果拒絕了屬于真實(shí)的零假設(shè),即如果樣本統(tǒng)計(jì)量的總體參數(shù)正是假設(shè)的總體參數(shù),但是由于樣本統(tǒng)計(jì)量的值落入了拒絕區(qū)域。而零假設(shè)遭到拒絕,這時(shí)就會(huì)犯第一類型的錯(cuò)誤。這種錯(cuò)誤的可能性大小正是顯著性水平的大小,故又稱這類錯(cuò)誤為α錯(cuò)誤。如果保留了屬于不真實(shí)的零假設(shè),就會(huì)犯第二類型的錯(cuò)誤。犯這種“假設(shè)屬偽而被保留”的第二類錯(cuò)誤的概率,等于β值,故又稱這類錯(cuò)誤為β錯(cuò)誤。

  要使第一類錯(cuò)誤的概率保持在需要的水平上,而控制第二類錯(cuò)誤的概率,有以下方法:(1)利用已知的實(shí)際總體參數(shù)與假設(shè)參數(shù)值之間的大小關(guān)系,合理安排拒絕領(lǐng)域的位置,選擇雙側(cè)檢驗(yàn)還是單側(cè)檢驗(yàn),左側(cè)檢驗(yàn)還是右側(cè)檢驗(yàn);(2)加大樣本容量。

第四節(jié) 總體平均數(shù)的顯著性檢驗(yàn)

總體平均數(shù)的顯著性檢驗(yàn)的適用公式與相應(yīng)的參數(shù)估計(jì)一脈相承。

一、σ已知條件下總體平均數(shù)的顯著性檢驗(yàn)(公式6.3)

二、σ未知條件下總體平均數(shù)的假設(shè)檢驗(yàn)

1、小樣本的情況(公式6.16)

2、大樣本的情況(公式6.3)

第七章 平均數(shù)差異的顯著性檢驗(yàn)

第一節(jié) 相關(guān)樣本平均數(shù)差異的顯著性檢驗(yàn)

  兩個(gè)樣本內(nèi)個(gè)體之間存在著一一對(duì)應(yīng)的關(guān)系,這兩個(gè)樣本稱為相關(guān)樣本。相關(guān)樣本有以下兩種情況:

  (1)用同一測(cè)驗(yàn)對(duì)同一組被試在試驗(yàn)前后進(jìn)行兩次測(cè)驗(yàn),所獲得的兩組測(cè)驗(yàn)結(jié)果是相關(guān)樣本。

 ?。?)根據(jù)某些條件基本相同的原則,把被試一一匹配成對(duì),然后將每對(duì)被試隨機(jī)地分入實(shí)驗(yàn)組和對(duì)照組,對(duì)兩組被試施行不同的實(shí)驗(yàn)處理之后,用同一測(cè)驗(yàn)所獲得的測(cè)驗(yàn)結(jié)果,也是相關(guān)樣本。

  相關(guān)樣本平均數(shù)差異的顯著性檢驗(yàn)方法和步驟:

 ?。?)提出假設(shè)

  (2)選擇檢驗(yàn)統(tǒng)計(jì)量并計(jì)算其值。在小樣本情況下,其檢驗(yàn)統(tǒng)計(jì)量為公式(7.9);在大樣本情況下用公式(7.12)。

 ?。?)確定檢驗(yàn)形式

 ?。?)統(tǒng)計(jì)決斷

第二節(jié) 獨(dú)立樣本平均數(shù)差異的顯著性檢驗(yàn)

  兩個(gè)樣本內(nèi)的個(gè)體是隨機(jī)抽取的,它們之間不存在一一的對(duì)應(yīng)關(guān)系,這樣的兩個(gè)樣本稱為獨(dú)立樣本。

  一、獨(dú)立大樣本平均數(shù)差異的顯著性檢驗(yàn)

  兩個(gè)樣本容量n1和n1都大于30的獨(dú)立樣本稱為獨(dú)立大樣本。

  獨(dú)立大樣本平均數(shù)差異的顯著性檢驗(yàn)所用的公式是(7.17)。

  二、獨(dú)立小樣本平均數(shù)差異的顯著性檢驗(yàn)

  兩個(gè)樣本容量n1和n1均小于30,或其中一個(gè)小于30的獨(dú)立樣本稱為獨(dú)立小樣本。

  獨(dú)立小樣本平均數(shù)差異的顯著性檢驗(yàn)方法:

  1、方差齊性時(shí)

  如果兩個(gè)獨(dú)立樣本的總體方差未知,經(jīng)方差齊性檢驗(yàn)表明兩個(gè)總體方差相等,則統(tǒng)計(jì)量公式為(7.23)-(7.25),這三個(gè)公式是等價(jià)的。

  2、方差不齊性時(shí)

  對(duì)于方差不齊性的兩個(gè)獨(dú)立樣本平均數(shù)差異顯著性檢驗(yàn),需要用校正的t'作為檢驗(yàn)統(tǒng)計(jì)量,用公式(7.26),t'的臨界值則用公式(7.29)和(7.32)來計(jì)算。

第三節(jié) 方差齊性檢驗(yàn)

  一、F分布

  若從方差相同的兩個(gè)正態(tài)總體中,隨機(jī)抽取兩個(gè)獨(dú)立樣本,以此為基礎(chǔ),分別求出兩個(gè)相應(yīng)總體總體方差的估計(jì)值,這兩個(gè)總體方差估計(jì)值的比值稱為F比值,F(xiàn)比值的抽樣分布稱為F分布。F分布的形態(tài)隨F比值分子和分母中自由度的變化而形成一簇正偏態(tài)分布。

  一般情況下,經(jīng)常應(yīng)用的是右側(cè)F檢驗(yàn),計(jì)算F值時(shí),將大的總體方差估計(jì)值作為分子,小的作為分母。

  二、兩個(gè)獨(dú)立樣本的方差齊性檢驗(yàn)

  用公式(7.35)。

  三、兩個(gè)相關(guān)樣本的方差齊性檢驗(yàn)

  用公式(7.38)。

第八章 方差分析

第一節(jié) 方差分析的基本原理

  一、方差分析的目的

  方差分析的基本功能就在于它對(duì)多組平均數(shù)差異的顯著性進(jìn)行檢驗(yàn)的作用。

  二、方差分析的邏輯

  組間差異對(duì)組內(nèi)差異的比值越大,則各組平均數(shù)的差異就越明顯。通過對(duì)組間差異與組內(nèi)差異比值的分析,來推斷幾個(gè)相應(yīng)平均數(shù)差異的顯著性,這就是方差分析的邏輯。

  三、以F檢驗(yàn)來推斷幾個(gè)平均數(shù)差異的顯著性

  四、方差分析中的幾個(gè)概念

  實(shí)驗(yàn)中的自變量稱為因素。只有一個(gè)自變量的實(shí)驗(yàn)稱為單因素實(shí)驗(yàn)。有兩個(gè)或兩個(gè)以上自變量的實(shí)驗(yàn)稱為多因素實(shí)驗(yàn)。某一個(gè)因素的不同情況稱為因素的“水平”。包括量差或質(zhì)別兩類情況,按各個(gè)“水平”條件進(jìn)行的重復(fù)實(shí)驗(yàn)稱為各種處理。

第二節(jié) 完全隨機(jī)設(shè)計(jì)的方差分析

  為了檢驗(yàn)?zāi)骋粋€(gè)因素多種不同水平間的差異的顯著性,將從同一個(gè)總體中隨機(jī)抽取的被試,再隨機(jī)地分入各實(shí)驗(yàn)組,施以各種不同的實(shí)驗(yàn)處理以后,用方差分析法對(duì)這多個(gè)獨(dú)立樣本平均數(shù)差異的顯著性進(jìn)行檢驗(yàn),稱為完全隨機(jī)設(shè)計(jì)的方差分析。

  一、n 相等的情況

  用公式(8.4)-(8.6)。

  二、n 不相等的情況

  用公式(8.7)-(8.8)。

  三、運(yùn)用樣本統(tǒng)計(jì)量進(jìn)行組間與組內(nèi)方差的F檢驗(yàn)

  用第181頁(yè)上的公式。

第三節(jié) 隨機(jī)區(qū)組設(shè)計(jì)的方差分析

  用方差分析法對(duì)多個(gè)相關(guān)樣本平均數(shù)差異所進(jìn)行的顯著性檢驗(yàn),稱之為隨機(jī)區(qū)組設(shè)計(jì)的方差分析

  每一區(qū)組內(nèi)被試的人數(shù)分配有以下三種方式:

 ?。?)一個(gè)被試作為一個(gè)區(qū)組;

 ?。?)每一區(qū)組內(nèi)被試的人數(shù)是實(shí)驗(yàn)處理數(shù)的整數(shù)倍;

 ?。?)區(qū)組內(nèi)以一個(gè)團(tuán)體為一個(gè)基本單元。

  區(qū)組平方和等數(shù)據(jù)的計(jì)算用公式(8.9)-(8.11)。

第四節(jié) 各個(gè)平均數(shù)差異的顯著性檢驗(yàn)

  對(duì)多組平均數(shù)的逐對(duì)差異檢驗(yàn),以Newman-Keul提出的q檢驗(yàn)法(或稱N-K)最為常用。

  一、完全隨機(jī)設(shè)計(jì)的q檢驗(yàn)

  公式(8.14)或(8.15)。

  二、隨機(jī)區(qū)組設(shè)計(jì)的q檢驗(yàn)

  公式(8.16)。

第五節(jié) 多組方差的齊性檢驗(yàn)

  多組方差的顯著性可以用哈特萊(Hartley)所提出的最大F值檢驗(yàn)法進(jìn)行齊性檢驗(yàn)。公式(8.17)。

第六節(jié) 多因素方差分析簡(jiǎn)介

  一、多因素方差分析的功能

  多因素方差分析不僅可以檢驗(yàn)各個(gè)因素對(duì)因變量作用的顯著性,而且還可以檢驗(yàn)因素與因素間共同結(jié)合對(duì)因變量發(fā)生交互作用的顯著性。

  二、雙因素完全隨機(jī)設(shè)計(jì)方差分析的基本方法

  計(jì)算時(shí)使用公式(8.18)-(8.20)和第204-205頁(yè)上的公式。

第九章 總體比率的推斷

第一節(jié) 比率的抽樣分布

  一、數(shù)據(jù)的特點(diǎn)

  對(duì)點(diǎn)計(jì)數(shù)據(jù)的統(tǒng)計(jì)推斷,應(yīng)采用總體比率的推斷方法或卡方檢驗(yàn)。當(dāng)事物僅被劃分成兩類,可用總體比率的推斷進(jìn)行統(tǒng)計(jì)推斷;當(dāng)事物被劃分為成兩類以上時(shí),則需用卡方檢驗(yàn)進(jìn)行統(tǒng)計(jì)推斷。當(dāng)然卡方檢驗(yàn)也可以對(duì)僅有兩種類別的資料進(jìn)行統(tǒng)計(jì)推斷。

  二、比率的抽樣分布

  比率的抽樣分布是二項(xiàng)分布。當(dāng)p=q,無論n的大小,二項(xiàng)分布呈對(duì)稱形;當(dāng)p <q且np≥5,或p >q且np≥5時(shí),二項(xiàng)分布已經(jīng)開始接近正態(tài)分布。

  三、比率的標(biāo)準(zhǔn)誤

  比率的標(biāo)準(zhǔn)誤是由二項(xiàng)分布的標(biāo)準(zhǔn)差除以n而獲得。

第二節(jié) 總體比率的區(qū)間估計(jì)

  一、正態(tài)近似法

  公式(9.3)-(9.5)。

  二、查表法

  用附表6。

第三節(jié) 總體比率的假設(shè)檢驗(yàn)

  一、正態(tài)近似法

  公式(9.6)-(9.5)。

  二、查表法

  用附表6。

第四節(jié) 總體比率差異的顯著性檢驗(yàn)

  一、兩個(gè)獨(dú)立樣本比率差異的顯著性檢驗(yàn)

  兩個(gè)獨(dú)立樣本比率差異的標(biāo)準(zhǔn)誤:公式(9.8)。

  如果兩個(gè)獨(dú)立樣本的最小頻數(shù)都等于或大于5,兩個(gè)樣本比率之差的抽樣分布也接近于正態(tài),于是可用Z檢驗(yàn)兩個(gè)比率之差的顯著性。其檢驗(yàn)統(tǒng)計(jì)量為公式(9.11)。

  二、兩個(gè)相關(guān)樣本比率差異的顯著性檢驗(yàn)

  兩個(gè)相關(guān)樣本比率之差的檢驗(yàn)公式為(9.13)。

第十章 卡方檢驗(yàn)

第一節(jié) χ2及其分布

  一、卡方檢驗(yàn)的特點(diǎn)

  卡方檢驗(yàn)是對(duì)樣本的頻數(shù)分布所來自的總體分布是否服從某種理論分布或某種假設(shè)分布所作的假設(shè)檢驗(yàn)。即根據(jù)樣本的頻數(shù)分布來推斷總體的分布。它屬于自由分布的非參數(shù)檢驗(yàn)。它可以處理一個(gè)因素分為多種類別,或多種因素各有多種類別的資料。所以,凡是可以應(yīng)用比率進(jìn)行檢驗(yàn)的資料,都可以用卡方檢驗(yàn)。

 二、卡方檢驗(yàn)的統(tǒng)計(jì)量

  卡方檢驗(yàn)統(tǒng)計(jì)量的基本形式為公式(10.1)。

  χ2值有以下幾個(gè)特點(diǎn):

 ?。?)χ2值具有可加性。

 ?。?)χ2值永遠(yuǎn)是正值。

  (3)χ2值的大小隨實(shí)際頻數(shù)與理論頻數(shù)差的大小而變化。

 三、χ2的抽樣分布

  χ2分布有以下幾個(gè)特點(diǎn):

  (1)χ2分布呈正偏態(tài),右側(cè)無限延伸,但永不與基線相交。

 ?。?)χ2分布隨自由度的變化而形成一簇分布形態(tài)。

  自由度越小,χ2分布偏斜度越大;自由度越大,χ2分布形態(tài)越趨于對(duì)稱。

第二節(jié) 單向表的卡方檢驗(yàn)

  把實(shí)得的點(diǎn)計(jì)數(shù)據(jù)按一種分類標(biāo)準(zhǔn)編制成表就是單向表。對(duì)于單向表的數(shù)據(jù)所進(jìn)行的卡方檢驗(yàn)就是單向表的卡方檢驗(yàn),即單因素的卡方檢驗(yàn)。

  一、按一定比率決定理論頻數(shù)的卡方檢驗(yàn)

  二、一個(gè)自由度的卡方檢驗(yàn)

  當(dāng)df=1,其中只有一個(gè)組的ft <5,就要運(yùn)用亞茨(Yates)連續(xù)性校正法(10.2)。

  三、頻數(shù)分布正態(tài)性的卡方檢驗(yàn)

第三節(jié) 雙向表的卡方檢驗(yàn)

  把實(shí)得的點(diǎn)計(jì)數(shù)據(jù)按兩種分類標(biāo)準(zhǔn)編制成的表就是雙向表。對(duì)雙向表的數(shù)據(jù)進(jìn)行的卡方檢驗(yàn),就是雙向表的卡方檢驗(yàn),即雙因素的卡方檢驗(yàn)。

  在雙向表的卡方檢驗(yàn)中,如果要判斷兩種分類特征,即兩個(gè)因素之間是否有依從關(guān)系,這種檢驗(yàn)稱為獨(dú)立性卡方檢驗(yàn)。

  在雙向表卡方檢驗(yàn)中,如果是判斷幾次重復(fù)實(shí)驗(yàn)的結(jié)果是否相同,這種卡方檢驗(yàn)稱為同質(zhì)性檢驗(yàn)。

  雙向表的獨(dú)立性卡方檢驗(yàn)和同質(zhì)性卡方檢驗(yàn),只是檢驗(yàn)的意義不同,而方法完全相同,都應(yīng)用公式(10.3)或(10.4)。對(duì)于同一組數(shù)據(jù)所進(jìn)行的卡方檢驗(yàn),有時(shí)即可以理解為獨(dú)立性卡方檢驗(yàn),又可以理解為同質(zhì)性檢驗(yàn),兩者無本質(zhì)區(qū)別。

第四節(jié) 四格表的卡方檢驗(yàn)

  一、獨(dú)立樣本四格表的卡方檢驗(yàn)

  獨(dú)立樣本四格表的卡方檢驗(yàn),就是雙向表中2*2表的卡方檢驗(yàn)。它即可以用縮減公式由實(shí)際頻數(shù)直接計(jì)算χ2值,又可以用上述求理論頻數(shù)的方法計(jì)算χ2值。

  1.縮減公式χ2值的計(jì)算

  獨(dú)立樣本四格表χ2值的縮減公式為(10.6)。

  2.校正χ2值的計(jì)算

  當(dāng)df=1,樣本容量總和N <30或N <50時(shí)(決定于對(duì)檢驗(yàn)結(jié)果要求的嚴(yán)格程度),應(yīng)對(duì)χ2值進(jìn)行亞茨連續(xù)性校正。其校正公式為(10.7)。

  二、相關(guān)樣本四格表的卡方檢驗(yàn)

  1.縮減公式χ2值的計(jì)算

  相關(guān)樣本四格表χ2值的縮減公式為(10.8)。

  2.校正χ2值的計(jì)算

  當(dāng)df=1,兩個(gè)相關(guān)樣本四格表中(b+c) <30或(b+c) <50(決定于對(duì)檢驗(yàn)結(jié)果要求的嚴(yán)格程度),應(yīng)對(duì)χ2值進(jìn)行亞茨連續(xù)性校正。其校正公式(10.9)。

第十一章 相關(guān)分析

第一節(jié) 相關(guān)的意義

  一、相關(guān)的概念

  兩個(gè)變量之間不精確、不穩(wěn)定的變化關(guān)系稱為相關(guān)關(guān)系。

  二、相關(guān)系數(shù)

  用來描述兩個(gè)變量相互之間變化方向及密切程度的數(shù)字特征量稱為相關(guān)系數(shù)。一般用r表示。

相關(guān)系數(shù)的值,僅僅是一個(gè)比值。它不是由相等單位度量而來(即不等距),也不是百分比,因此,不能直接作加、減、乘、除。

  相關(guān)系數(shù)只能描述兩個(gè)變量之間的變化方向及密切程度,并不能揭示二者之間的內(nèi)在本質(zhì)聯(lián)系。

第二節(jié) 積差相關(guān)

  一、概念及其適用范圍

  1.積差相關(guān)的概念

  當(dāng)兩個(gè)變量都是正態(tài)連續(xù)變量,而且兩者之間呈線性關(guān)系,表示這兩個(gè)變量之間的相關(guān)稱為積差相關(guān)。

  2.積差相關(guān)使用的條件

 ?。?)兩個(gè)變量都

第十二章 回歸分析

第一節(jié) 一元線性回歸

  一元線性回歸是指只有一個(gè)自變量的線性回歸。

  一、回歸線

  一條最能代表散點(diǎn)圖上分布趨勢(shì)的直線,這條最優(yōu)擬合線即稱為回歸線。常用的擬合這條回歸線的原則,就是使各點(diǎn)與該線縱向距離的平方和為最小。

  二、回歸方程

  確定回歸線的方程稱回歸方程。

  1.用最小二乘方法求回歸系數(shù)

  公式(12.2a)或(12.2b)。

  2.求截距

  公式(12.3a)或(12.3b)。

  三、用原始數(shù)據(jù)計(jì)算回歸系數(shù)

  公式(12.4a)或(12.4b)。

第二節(jié) 一元線性回歸方程的檢驗(yàn)

  一、估計(jì)誤差的標(biāo)準(zhǔn)差

  公式(12.9)。

  二、一元線性回歸方程檢驗(yàn)的方法

  一元線性回歸方程檢驗(yàn)有三種等效的方法:

  (1)對(duì)回歸方程進(jìn)行方差分析;

  (2)對(duì)兩個(gè)變量的相關(guān)系數(shù)進(jìn)行與總體零相關(guān)的顯著性檢驗(yàn);

 ?。?)對(duì)回歸系數(shù)進(jìn)行顯著性檢驗(yàn)

  三、一元線性回歸系數(shù)顯著性檢驗(yàn)方法

  在回歸線上,當(dāng)與所有自變量X相對(duì)應(yīng)的各組因變量Y的殘值都呈正態(tài)分布,并且殘值方差為齊性時(shí),由X估計(jì)Y回歸系數(shù)的標(biāo)準(zhǔn)誤為公式(12.11)或(12.12)??梢杂霉剑?2.13)或公式(12.14)進(jìn)行顯著性檢驗(yàn)。

  三、測(cè)定系數(shù)

  測(cè)定系數(shù)指回歸平方和在總平方和中所占比例,這個(gè)比例越大,意味著誤差平方和所占比例越小,預(yù)測(cè)效果就越好。測(cè)定系數(shù)同時(shí)等于相關(guān)系數(shù)的平方。

第三節(jié) 一元線性回歸方程的應(yīng)用

  一、用樣本回歸方程推算因變量的回歸值

  二、對(duì)因變量真值的預(yù)測(cè)

第四節(jié) 多元線性回歸簡(jiǎn)介

  一、二元線性回歸方程

  1.二元線性回歸方程的意義

  二元線性回歸方程是指Y對(duì)X1與X2的線性回歸方程。

  2.二元線性回歸方程的建立原理

  和一元線性回歸方程一樣,二元線性回歸方程也用最小二乘法來確定回歸系數(shù)。用公式(12.25a)和(12.25b)。

  3.二元線性標(biāo)準(zhǔn)回歸方程

  為了比較兩個(gè)自變量在估計(jì)預(yù)測(cè)因變量時(shí)所起作用的大小,需要將三個(gè)變量分別轉(zhuǎn)換成標(biāo)準(zhǔn)分?jǐn)?shù),然后比較由標(biāo)準(zhǔn)分?jǐn)?shù)所建立的標(biāo)準(zhǔn)回歸方程中的兩個(gè)標(biāo)準(zhǔn)回歸系數(shù),以此判斷兩個(gè)自變量作用的大小。

  二、二元線性回歸的檢驗(yàn)

  二元線性回歸的檢驗(yàn)包括兩個(gè)方面:一是檢驗(yàn)回歸方程的顯著性;另一是檢驗(yàn)兩個(gè)偏回歸系數(shù)的顯著性。

  (一)二元線性回歸的檢驗(yàn)

  二元線性回歸方程的顯著性有兩種等效的檢驗(yàn)方法:一是方差分析,二是復(fù)相關(guān)系數(shù)顯著性檢驗(yàn)。

  復(fù)相關(guān)系數(shù)表示兩個(gè)自變量組合起來與因變量之間的相關(guān)程度。可通過對(duì)二元測(cè)定系數(shù)開平方根得到,然后通過查表進(jìn)行顯著性檢驗(yàn)。

  (二)偏回歸系數(shù)的顯著性檢驗(yàn)

  兩個(gè)偏回歸系數(shù)的顯著性檢驗(yàn)公式為(12.29a)和(12.29b)。

  三、多元線性回歸方程中自變量的選擇

  1.從組成回歸方程的所有自變量中選擇最優(yōu)的自變量

  對(duì)所有可能的回歸方程逐一檢驗(yàn),選擇一個(gè)顯著性程度最強(qiáng)的方程。

  2.逐步回歸

  逐步回歸的原理是按每個(gè)自變量對(duì)因變量的作用,從大到小逐個(gè)地引入回歸方程,每引入一個(gè)自變量要對(duì)回歸方程中的每一個(gè)自變量都進(jìn)行顯著性檢驗(yàn)(即對(duì)其偏回歸系數(shù)進(jìn)行顯著性檢驗(yàn))。這樣逐步地引入自變量,并剔除不顯著的自變量,直至將所有的自變量都引入,并將不顯著的自變量都剔除為止,最后形成的回歸方程就是最優(yōu)方程。

第十三章 非參數(shù)檢驗(yàn)

  假設(shè)檢驗(yàn)的方法有兩種:參數(shù)檢驗(yàn)和非參數(shù)檢驗(yàn)。

在實(shí)際研究工作中,樣本所屬的總體分布形態(tài)一般是未知的,所獲得的資料也不一定是等距變量或比率變量,因此需要采用新的統(tǒng)計(jì)方法進(jìn)行檢驗(yàn)。這種檢驗(yàn)方法不要求樣本所屬的總體呈正態(tài)分布,一般也不是對(duì)總體進(jìn)行檢驗(yàn),故稱之為自由分布的非參數(shù)檢驗(yàn)方法。非參數(shù)檢驗(yàn)不僅適用于非正態(tài)總體名義變量和次序變量的資料,而且也適用于正態(tài)總體等距變量和比率變量的資料。故應(yīng)用廣泛,但靈敏度和精確度不如參數(shù)檢驗(yàn)。

第一節(jié) 符號(hào)檢驗(yàn)

  符號(hào)檢驗(yàn)是通過多兩個(gè)相關(guān)樣本的每對(duì)數(shù)據(jù)之差的符號(hào)(正號(hào)或負(fù)號(hào))進(jìn)行檢驗(yàn),以比較這兩個(gè)樣本差異的顯著性。

  一、小樣本的情況

  當(dāng)樣本容量較小,n <25時(shí),可用查表法進(jìn)行符號(hào)檢驗(yàn)。

  二、大樣本的情況

  對(duì)差數(shù)的正號(hào)與負(fù)號(hào)差異的檢驗(yàn)本屬于二項(xiàng)分布的問題,當(dāng)樣本容量較大,即n >25時(shí),二項(xiàng)分布接近正態(tài)分布,因此可以用正態(tài)分布近似處理,公式用(13.2)。

第二節(jié) 符號(hào)秩序檢驗(yàn)

  威爾科克遜(F.Wilcoxon)提出了既考慮差數(shù)符號(hào),又考慮差數(shù)大小的符號(hào)秩次檢驗(yàn)法。

  一、小樣本的情況

  當(dāng)樣本容量n <25時(shí),可用查表法進(jìn)行符號(hào)秩次檢驗(yàn)。

  二、大樣本的情況

  當(dāng)樣本容量n >25時(shí),二項(xiàng)分布接近與正態(tài)。于是可用正態(tài)分布近似處理。

  檢驗(yàn)統(tǒng)計(jì)量為公式(13.5)。

第三節(jié) 秩和檢驗(yàn)

  當(dāng)比較兩個(gè)獨(dú)立樣本的差異時(shí),可以采用曼-惠特尼(Mann-Whitney)兩人提出的秩和檢驗(yàn)方法。又稱曼-惠特尼U檢驗(yàn)法。

  一、小樣本的情況

  當(dāng)兩個(gè)獨(dú)立樣本的容量n1和n2都小于10,并且n1≤n2時(shí),可以用查表法。

  二、大樣本的情況

  當(dāng)兩個(gè)獨(dú)立樣本的n1和n2都大于10,T分布接近與正態(tài),對(duì)于兩個(gè)樣本的差異可以用正態(tài)分布的Z比率進(jìn)行檢驗(yàn)。公式(13.8)。

第四節(jié) 中位數(shù)檢驗(yàn)

  中位數(shù)的檢驗(yàn)方法是將各組樣本數(shù)據(jù)合在一起找出共同的中位數(shù),然后分別計(jì)算每個(gè)樣本在共同中位數(shù)上、下的頻數(shù),再進(jìn)行r×c表卡方檢驗(yàn)。

第五節(jié) 單向秩次方差分析

  對(duì)于幾個(gè)獨(dú)立樣本差異的顯著性,可以用克魯斯?fàn)枺╓.H.Kruskal)和沃利斯(W.A.Wallis)所提出的單向秩次方差分析進(jìn)行檢驗(yàn)。這種方法又稱為H檢驗(yàn)法。它相當(dāng)于對(duì)多組平均數(shù)所進(jìn)行的參數(shù)的方差分析。但是它不需要對(duì)樣本所屬的幾個(gè)總體做正態(tài)分布及方差齊性的假定。它處理的是秩次變量的資料,是用秩次進(jìn)行的非參數(shù)的方差分析。

  這種檢驗(yàn)方法是將所有樣本的數(shù)據(jù)合在一起,按從小到達(dá)編秩次,然后計(jì)算各樣本的秩次和。如果各組有顯著性差異,在各組容量相等的情況下,各組秩次和應(yīng)當(dāng)相等或趨于相等;如果各組秩次和相差較大,那么各組有顯著性差異的可能性較大。

  一、樣本容量較小或組數(shù)較小的情況

  當(dāng)各組容量n≤5時(shí),或者樣本組數(shù)k≤3,可用公式(13.9)作為檢驗(yàn)統(tǒng)計(jì)量。

  二、樣本容量較大或組數(shù)較多的情況

  當(dāng)各組容量n >5,或樣本組數(shù)k >3時(shí),H值的抽樣分布接近于自由度df=k-1的卡方分布,因此,可進(jìn)行卡方檢驗(yàn)。

第六節(jié) 雙向秩次方差分析

  雙向秩次方差分析,處理的是幾個(gè)相關(guān)樣本次序變量的資料。雙向秩次方差分析是在同一個(gè)對(duì)象(或匹配的對(duì)象)接受k次實(shí)驗(yàn)處理所獲得原始數(shù)據(jù)之間編秩次。如果各次實(shí)驗(yàn)導(dǎo)致差異不顯著,各次實(shí)驗(yàn)產(chǎn)生的秩次和應(yīng)當(dāng)相等或趨于相等;如果各次實(shí)驗(yàn)秩次和相差較大,那么,實(shí)驗(yàn)產(chǎn)生顯著性差異的可能性較大。

  一、樣本容量較小及實(shí)驗(yàn)次數(shù)較少的情況

  當(dāng)樣本容量n≤9;k=3;或n≤4,k=4時(shí),可用公式(13.10)作為檢驗(yàn)統(tǒng)計(jì)量。

  二、樣本容量較大或?qū)嶒?yàn)次數(shù)較多的情況

  當(dāng)k=3,n >9;k=4,n >4;或k >4時(shí),上述檢驗(yàn)統(tǒng)計(jì)量的抽樣分布接近于df=k-1的卡方分布,于是可以用卡方近似處理。

第十四章 抽樣設(shè)計(jì)

第一節(jié) 抽樣方法

  一、單純隨機(jī)抽樣

  如果總體中每個(gè)個(gè)體被抽到的機(jī)會(huì)是均等的,并且在抽取一個(gè)個(gè)體之后總體內(nèi)成分不變(抽樣的獨(dú)立性),這種抽樣方法稱為單純隨機(jī)抽樣。

  二、機(jī)械抽樣

  把總體中的所有個(gè)體按一定順序編號(hào),然后依固定的間隔取樣,這種抽樣方法稱為機(jī)械抽樣。

  三、分層抽樣

  按與研究?jī)?nèi)容有關(guān)的因素或指標(biāo)先將總體劃分成幾個(gè)部分(層),然后從各部分(層)中進(jìn)行單純隨機(jī)抽樣或機(jī)械隨機(jī)抽樣,這種抽樣方法稱為分層抽樣。

  在確定從各層抽取對(duì)象的個(gè)數(shù)時(shí),即考慮各層的個(gè)體數(shù)比例,又考慮各層標(biāo)準(zhǔn)差的大小,這種方法稱為最優(yōu)配置法,公式(14.1)。

  四、整群抽樣

  從總體中抽出來的研究對(duì)象,不是以個(gè)體作為單位,而是以整群為單位的抽樣方法,稱為整群抽樣。

第二節(jié) 總體平均數(shù)統(tǒng)計(jì)推斷時(shí)樣本容量的確定

  一、由樣本平均數(shù)估計(jì)總體平均數(shù)時(shí)樣本容量的確定

  1.總體標(biāo)準(zhǔn)差已知的情況

  用公式(14.2)。

  2. 總體標(biāo)準(zhǔn)差未知的情況

  用公式(14.3)。

  二、樣本平均數(shù)與總體平均數(shù)差異顯著性檢驗(yàn)時(shí)樣本容量的確定

  1.總體標(biāo)準(zhǔn)差已知的情況

  用公式(14.4)或(14.5)。

  2.總體標(biāo)準(zhǔn)差未知的情況

  用公式(14.6)或(14.7)。

  三、兩個(gè)樣本平均數(shù)差異顯著性檢驗(yàn)時(shí)樣本容量的確定

  1.兩個(gè)獨(dú)立樣本平均數(shù)差異顯著性檢驗(yàn)時(shí)樣本容量的確定

  用公式(14.8)或(14.9)。

  2.兩個(gè)相關(guān)樣本平均數(shù)差異顯著性檢驗(yàn)時(shí)樣本容量的確定

  用公式(14.10)或(14.11)。

第三節(jié) 總體比率統(tǒng)計(jì)推斷及相關(guān)系數(shù)顯著性檢驗(yàn)時(shí)樣本容量的確定

  一、用樣本比率估計(jì)總體比率時(shí)樣本容量的確定

  當(dāng)總體比率接近0.5,隨n的增大,樣本比率的抽樣分布趨向正態(tài),這時(shí)可以近似用公式(14.12)進(jìn)行估計(jì)。

  二、兩個(gè)樣本比率差異顯著性檢驗(yàn)時(shí)樣本容量的確定

  用公式(14.13)或(14.14)。

  三、樣本相關(guān)系數(shù)顯著性檢驗(yàn)時(shí)樣本容量的確定

  在確定樣本容量時(shí),可直接查相關(guān)系數(shù)顯著性檢驗(yàn)所需樣本的容量表。

?


《教育統(tǒng)計(jì)學(xué)》復(fù)習(xí)題及答案的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
遂川县| 湘潭县| 连江县| 江安县| 云南省| 蓝山县| 朝阳区| 独山县| 深州市| 芒康县| 宝清县| 柞水县| 永泰县| 陈巴尔虎旗| 五寨县| 龙游县| 桦南县| 台江县| 萝北县| 财经| 东源县| 松阳县| 白河县| 拜泉县| 古蔺县| 万宁市| 平山县| 灵武市| 砀山县| 剑川县| 聂拉木县| 保定市| 保靖县| 聂荣县| 琼中| 丰县| 虞城县| 普定县| 宜兴市| 巨鹿县| 和硕县|