【心理學(xué)考研】統(tǒng)計方法適用情形合集 | 參數(shù)檢驗篇
在開始這一期之前,先給大家分享一個小故事。
某個下午有一群人在品茶,這時有一位女士聲稱自己在喝英式茶的時候能區(qū)分出來是茶先倒進杯子還是奶先倒進杯子。大部分人都覺得這位女士在瞎說,只有一位男士提出要用科學(xué)的方法去證明到底一不一樣。
常識告訴我們,如果想得到科學(xué)的結(jié)論,就應(yīng)隨機給女士幾杯茶讓女士鑒別一番,根據(jù)她答對的次數(shù)或比例來判斷她是否有這個能力。
可是問題是,要做多少次實驗?zāi)兀?/p>
?這位男士是這么做的:他調(diào)配出了八杯其他條件一模一樣而僅僅是倒茶倒奶順序相反的茶,兩類條件各四杯,他首先假設(shè)女士嘗不出來區(qū)別(原假設(shè)H0),如果女士全部區(qū)分出這八杯茶,就說明在原假設(shè)成立的情況下,發(fā)生了非常反常的現(xiàn)象,以至于說明原假設(shè)是令人懷疑的。
已經(jīng)學(xué)習(xí)一輪統(tǒng)計的同學(xué)們應(yīng)該知道,在原假設(shè)成立的前提下,發(fā)生了非常小概率的事件,那我們就有理由懷疑原假設(shè)的真實性。
這個故事最早出現(xiàn)在統(tǒng)計學(xué)家Fisher發(fā)表于1935年的著作《the design of experiment》中,故事中的男士就是其本人。
同學(xué)們在使用描述統(tǒng)計的方法發(fā)現(xiàn)了兩組數(shù)據(jù)存在差異后,我們希望知道這種差異是真正存在的差異還是由于一些誤差所引起的、以及差異存在在哪里、由哪些變異源產(chǎn)生的,這時我們需要用到推論統(tǒng)計的一些方法。
假設(shè)檢驗是以反證法、小概率原理為基礎(chǔ),提出假設(shè)驗證假設(shè)的過程,并由此提出兩類錯誤。其核心是反證法,思路很簡單,下面開始一段繞口令:
若要證明一個結(jié)論是正確的,那么先假設(shè)這個結(jié)論是錯誤的。以這個假設(shè)為前提進行推理,若推理出來的結(jié)果與假設(shè)矛盾,就說明這個假設(shè)是錯誤的,也即這個結(jié)論不是錯誤的,而是正確的。
接下來又可以分情況,當(dāng)我們可以假定樣本數(shù)據(jù)來自具有特定分布的總體時,可使用參數(shù)檢驗。如果不能對數(shù)據(jù)集作出必要的假設(shè),則需使用非參數(shù)檢驗。
今天第一期,咱們就先聊聊參數(shù)檢驗。
先來簡單回顧下相一些概念:
同學(xué)們最常用到,也即考試最??嫉降膮?shù)檢驗,一般包括Z檢驗、t檢驗、方差分析。
篇幅有限,太具體的概念和公式等,同學(xué)們可以翻閱參考書或瀏覽我的課程。我這邊主要舉來講講幾種參數(shù)檢驗使用的實例。
注:以下思維導(dǎo)圖和舉例來自學(xué)霸分享
同學(xué)們回顧下這幾種檢驗的適用情形:
以心理學(xué)與生活的統(tǒng)計學(xué)部分的一個簡單的例子來說明。
假設(shè)某心理學(xué)系的教授想看看,某門課程助教的性別是否對學(xué)習(xí)這門課的男女學(xué)生的成績有所影響。為此,教授把一半學(xué)生隨機分配給一位男助教,另一半分配給另一位女助教。
假設(shè)我們是這位教授,分配的時候就要記住控制隨機分配給男女助教的學(xué)生人數(shù)、男女比例、分配的學(xué)生的總體能力水平和專業(yè)水平、人口特征等。
如果只想看看一個班,樣本量只有幾十個,那么我們可以使用獨立樣本t檢驗的方法,對兩組(男助教組和女助教組)數(shù)據(jù)的差異進行分析;當(dāng)然,如果數(shù)據(jù)足夠大,例如某一城市或某一區(qū)域的整體調(diào)查,則可以使用獨立樣本Z檢驗的方法進行分析。
同一個研究,根據(jù)我們想探究的目的不同,可以隨時變換統(tǒng)計方法。
再舉個老生常談又通俗易懂的例子。
假設(shè)同學(xué)們收到一個任務(wù),要你們?nèi)パ芯磕撤N詞匯記憶的方法是否有效,大家能想到的方法便是隨機選取某個地區(qū)的學(xué)生進行詞匯記憶任務(wù)考察,然后抽取一定容量的樣本進行記憶訓(xùn)練培訓(xùn),最后根據(jù)所得的成績進行差異檢驗。
咱們按實驗設(shè)計的思路一步步來。
首先,按慣例,為了更好地突出自變量對因變量的影響,我們要對一些額外變量進行控制。如題目中需要對學(xué)生的詞匯記憶能力進行測試,所以我們需要控制被試的年齡、年級、性別、智商、學(xué)習(xí)成績等因素的影響。
數(shù)據(jù)收上來后我們得分析。
如果條件允許,抽取了大量的樣本,則可以使用Z檢驗對總體成績和進行培訓(xùn)后的被試成績進行差異檢驗。
如果因為條件限制只能選取小樣本,則用T檢驗對總體成績和進行培訓(xùn)后的被試的成績進行差異檢驗。
害怕總體成績數(shù)據(jù)量過大怎么辦?我們也可以先所有的被試進行前測,然后全部進行記憶方法培訓(xùn),最后再進行一次后測,根據(jù)樣本容量的大小,對被試的前后測成績使用相關(guān)樣本Z或T檢驗。
假如做到一半,任務(wù)分配方要求你研究研究這個詞匯記憶方法是否存在性別差異,我們便把性別這個變量挑出來,選取一定數(shù)量的男生和女生進行詞匯記憶訓(xùn)練,得到兩組被試成績的均值。同理,如果選取的被試是大樣本,則可以用獨立樣本Z檢驗進行差異檢驗,如果是小樣本則可以使用獨立樣本T檢驗進行差異檢驗。
性別的影響分析完,甲方又加要求,想讓你看看除了記憶方法,記憶的材料是不是也會有影響。這時一個自變量就變成兩個,每個自變量又至少有2個水平,我們便需要求助方差分析。
同樣的,在實施實驗時,需要控制被試的年齡、年紀(jì)、性別、智商、學(xué)習(xí)成績等因素,但因為又加入了記憶材料這個變量,所以還需要控制單詞、句子的長度、詞義等因素。
要注意的是,詞匯記憶方法一般只能做被試間變量,即一組使用記憶方法,另一組不使用記憶方法;而記憶材料可以作被試間變量也可以作被試內(nèi)變量。
如果記憶材料有句子、單詞兩種,做被試間變量時,我們這個實驗就是2×2的被試間設(shè)計,用多因素完全隨機方差分析;做被試內(nèi)變量時,那這個實驗就是2×2的混合實驗設(shè)計,采用多因素的重復(fù)測量方差分析。
這時你又突發(fā)奇想,只想看看不同的記憶材料對學(xué)生記憶效果的影響,但記憶材料變?yōu)榫渥?、單詞、圖畫三種,那此時研究設(shè)計就是單因素的實驗設(shè)計。同樣,當(dāng)每個被試只接受一種記憶材料的處理時,屬于單因素被試間設(shè)計,采用單因素完全隨機方差分析;當(dāng)每一個被試要接受所有記憶材料的處理時,屬于單因素被試內(nèi)設(shè)計,采用單因素重復(fù)測量方差分析。
如果我們想研究疫情嚴(yán)重程度和共情能力對個體心理健康的影響,同學(xué)們試著請找出實驗的自變量,嘗試從不同的目的來說說實驗的統(tǒng)計方法。