最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

正態(tài)性檢驗處理流程

2023-03-07 09:55 作者:SPSSAU官方賬號  | 我要投稿

正態(tài)性檢驗處理流程

一、分析問題

在實際研究中,正態(tài)性是很多研究方法在進行分析時需要滿足的前提條件。常見的比如方差分析、T檢驗、相關(guān)分析、回歸分析等等,這些分析方法使用的前提假定就是需要數(shù)據(jù)滿足正態(tài)分布。

但是這一點經(jīng)常被分析人員有意或無意的忽略掉。原因一可能在于大家“心照不宣”的默認數(shù)據(jù)滿足正態(tài)性;原因二可能是分析人員的數(shù)據(jù)分析基礎(chǔ)知識不夠,不知道需要進行正態(tài)性檢驗;原因三可能在于知道數(shù)據(jù)需要滿足正態(tài)分布,但是數(shù)據(jù)無論如何都無法滿足正態(tài)性,就放棄了。

如果說數(shù)據(jù)分析方法沒有滿足需要的前提條件,那么分析得到的結(jié)果就是不夠科學(xué)、不夠嚴謹?shù)?,甚至得到的分析結(jié)論也會“本末倒置”。這就提示我們數(shù)據(jù)分析一定要嚴謹,正態(tài)性檢驗必不可少,接下來將介紹一下正態(tài)性檢驗方式。

二、檢驗方式

正態(tài)性檢驗方式主要有統(tǒng)計檢驗法、描述法、圖示法這三大類。

當(dāng)前有3個班級90名同學(xué)的期中考試成績,現(xiàn)在要檢驗成績是否滿足正態(tài)分布,部分數(shù)據(jù)如下:

我們將分別使用這三類分析方法進行正態(tài)性檢驗,這三類方法都可以在SPSSAU系統(tǒng)找到,下面將一一進行介紹說明。

1.統(tǒng)計檢驗法

統(tǒng)計檢驗法是檢驗正態(tài)性的最嚴格方法,對數(shù)據(jù)要求最為嚴格。統(tǒng)計檢驗法包括兩種檢驗方式,分別是Kolmogorov-Smirnov檢驗和Shapiro-Wilk檢驗。如果樣本量大于50,則使用K-S檢驗(Kolmogorov-Smirnov檢驗),反之則使用S-W檢驗(Shapiro-Wilk檢驗)。

SPSSAU正態(tài)性檢驗分析結(jié)果如下:

因為樣本量為90,大于50,所以使用K-S檢驗進行,具體來看,成績?nèi)烤鶝]有呈現(xiàn)顯著性(p>0.05),所以成績?nèi)烤哂姓龖B(tài)性特質(zhì),滿足正態(tài)分布。

2.描述法

統(tǒng)計檢驗法一般來講是很難滿足的,所以在正態(tài)性檢驗分析結(jié)果中,還可以看峰度和偏度兩個指標(biāo),描述法是使用峰度和偏度考察數(shù)據(jù)的正態(tài)性。一般認為,如果峰度絕對值小于10并且偏度絕對值小于3,則說明數(shù)據(jù)雖然不是絕對正態(tài),但基本可接受為正態(tài)分布。

從上圖通過查看偏度和峰度,也可以得到數(shù)據(jù)滿足正態(tài)分布的性質(zhì)。

3.圖示法

大部分情況下,如果對數(shù)據(jù)要求不是特別嚴格,一般使用圖示法進行數(shù)據(jù)的正態(tài)性檢驗。圖示法包括查看數(shù)據(jù)直方圖、P-P圖和Q-Q圖三種。

3.1 直方圖

如果直方圖的形狀近似滿足“中間高,兩頭低”的鐘形分布,則說明數(shù)據(jù)近似滿足正態(tài)分布特性,不必過多糾結(jié)數(shù)據(jù)的正態(tài)性。

SPSSAU直方圖輸出結(jié)果如下:

從上圖可以看出,成績的直方圖基本滿足“中間高,兩頭低”的鐘形分布,說明數(shù)據(jù)滿足正態(tài)分布特性。

3.2 P-P圖

P-P圖其原理在于如果數(shù)據(jù)正態(tài),那么數(shù)據(jù)的累積比例與正態(tài)分布累積比例基本保持一致。分別計算出數(shù)據(jù)累積比例,和假定正態(tài)時的數(shù)據(jù)分布累積比例;并且將實際數(shù)據(jù)累積比例作為X軸,將對應(yīng)正態(tài)分布累積比例作為Y軸,作散點圖。

SPSSAU的P-P圖輸出結(jié)果如下:

從P-P圖可以看出,散點圖近似呈現(xiàn)一條對角直線,說明成績呈現(xiàn)正態(tài)分布。

3.3 Q-Q圖

Q-Q圖其原理在于如果數(shù)據(jù)正態(tài),那么其假定的正態(tài)分位數(shù)會與實際數(shù)據(jù)基本一致。計算出假定正態(tài)時的數(shù)據(jù)分位數(shù);并且將實際數(shù)據(jù)作為X軸,將假定正態(tài)時的數(shù)據(jù)分位數(shù)作為Y軸,作散點圖。

SPSSAU的Q-Q圖輸出結(jié)果如下:

從Q-Q圖可以看出,散點圖近似呈現(xiàn)一條對角直線,說明成績呈現(xiàn)正態(tài)分布。

三、非正態(tài)轉(zhuǎn)化

從理論上講,很多研究方法需要滿足正態(tài)分布特質(zhì),但現(xiàn)實情況下,很難滿足正態(tài)分布性。這樣就需要進行非正態(tài)轉(zhuǎn)化,想辦法將不滿足正態(tài)性特性的數(shù)據(jù),經(jīng)過一些方法,轉(zhuǎn)化為滿足正態(tài)分布的數(shù)據(jù)。非正態(tài)轉(zhuǎn)化為正態(tài)數(shù)據(jù)的常見方法有以下幾種:

1.取對數(shù)

?a'=log(a)將原始數(shù)據(jù)a的對數(shù)值作為新的數(shù)據(jù)再進行分析;當(dāng)原始數(shù)據(jù)中含有0或者負數(shù)時,可以根據(jù)內(nèi)容自主進行相應(yīng)改動:如 a'=log(a+x)。

2.開根號

a'=sqrt(a)將原始數(shù)據(jù)a的平方根作為新的數(shù)據(jù)再進行分析;同樣的,如果a為0,可以將a加上一個合適的值進行變換。

3.取倒數(shù)

a'=1/a將原始數(shù)據(jù)a的倒數(shù)值作為新的數(shù)據(jù)再進行分析。

4.移除異常值

異常值,也稱離群值,是指樣本中的個別值,其數(shù)值明顯偏離所屬樣本的絕大部分觀測值。不論進行什么分析,如果數(shù)據(jù)中存在異常值,都應(yīng)該在分析前進行處理,否則很可能影響分析結(jié)果,甚至扭曲結(jié)論。異常值可在SPSSAU->數(shù)據(jù)處理->異常值中進行處理。

5.BOX-COX轉(zhuǎn)換

針對數(shù)據(jù)進行Box-Cox變換,盡量讓數(shù)據(jù)滿足正態(tài)性。

例如現(xiàn)在有一份數(shù)據(jù),在進行正態(tài)性檢驗時,p值為0.019<0.05,說明數(shù)據(jù)不具有正態(tài)性特質(zhì)。將數(shù)據(jù)進行BOX-COX轉(zhuǎn)換后,二者進行正態(tài)性檢驗得到分析結(jié)果如下表:

從上表可以看出,雖然再經(jīng)過BOX-COX轉(zhuǎn)換后p值仍小于0.05,沒有通過正態(tài)性檢驗,但p值從0.019變?yōu)?.042,明顯接近0.05,說明BOX-COX轉(zhuǎn)換對于正態(tài)性的改善是有作用的。

6.Johnson轉(zhuǎn)換

同樣的,Johnson轉(zhuǎn)換與BOX-COX轉(zhuǎn)換一樣,都是通過某種變換使得數(shù)據(jù)盡量滿足正態(tài)性。

從上表可以明顯看出,雖然再經(jīng)過Johnson轉(zhuǎn)換后p值仍小于0.05,沒有通過正態(tài)性檢驗,但p值從0.019變?yōu)?.042,明顯接近0.05,說明Johnson轉(zhuǎn)換對于正態(tài)性的改善是有作用的。

7.加大樣本量

一般認為,有可能隨著樣本數(shù)增加越傾向于拒絕原假設(shè)(服從正態(tài)分布)。即樣本數(shù)據(jù)量越大,則可以認為數(shù)據(jù)越具有正態(tài)性特質(zhì)。所以可以通過加大樣本量的方法提高數(shù)據(jù)的正態(tài)性。但這種方法在實際情況中很難實現(xiàn),因為數(shù)據(jù)一般都是已經(jīng)收集完成再進行分析的,此時再去收集數(shù)據(jù)加大樣本量并不現(xiàn)實。

四、正態(tài)轉(zhuǎn)化優(yōu)劣對比

并不是所有數(shù)據(jù)在進行以上非正態(tài)轉(zhuǎn)化后都可以呈現(xiàn)出正態(tài)性特征的。如果在進行非正態(tài)轉(zhuǎn)化后數(shù)據(jù)仍不滿足正態(tài)性,此時說明數(shù)據(jù)并不適合使用方差分析、t檢驗等方法,可以選擇其他方法進行分析。舉例說明如下圖:

五、總結(jié)

在實際研究中,很多分析方法的前提條件都要求數(shù)據(jù)滿足正態(tài)性特征,所以在分析前需要進行正態(tài)性檢驗。正態(tài)性檢驗的方法包括統(tǒng)計檢驗法、描述法、圖示法三大類。其中,統(tǒng)計檢驗法對于數(shù)據(jù)正態(tài)性要求最為嚴格,絕對正態(tài)數(shù)據(jù)一般很難達到。一般使用描述法或圖示法進行檢驗,數(shù)據(jù)近似滿足正態(tài)性特征即可。如果經(jīng)過檢驗發(fā)現(xiàn)數(shù)據(jù)并不滿足正態(tài)性特征,這個時候可以先進行數(shù)據(jù)的非正態(tài)轉(zhuǎn)化,但是轉(zhuǎn)化并不能保證數(shù)據(jù)一定能滿足正態(tài)性特征。同時需要注意,有實際意義的數(shù)據(jù)經(jīng)過轉(zhuǎn)化后可能失去實際意義。如果無論如何數(shù)據(jù)都不能滿足正態(tài)性,此時可以考慮使用非參數(shù)檢驗等方法進行分析。

正態(tài)性檢驗處理流程的評論 (共 條)

分享到微博請遵守國家法律
阿瓦提县| 神池县| 桑日县| 广昌县| 若羌县| 合水县| 德江县| 沅江市| 石泉县| 金门县| 东港市| 康保县| 榆林市| 安远县| 广平县| 盐亭县| 望奎县| 甘德县| 璧山县| 宿松县| 伊吾县| 滕州市| 双江| 镇平县| 阜城县| 思茅市| 广昌县| 巩义市| 师宗县| 东丰县| 茶陵县| 庆阳市| 兴城市| 抚州市| 三台县| 沅陵县| 西畴县| 四川省| 区。| 安国市| 兖州市|