最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

數(shù)據(jù)不正態(tài)分布怎么辦?

2021-11-12 11:24 作者:SPSSAU官方賬號  | 我要投稿

在實際研究中,很多時候都需要數(shù)據(jù)滿足正態(tài)分布才可以。比如說回歸分析,其實做回歸分析有一個前提條件即因變量需要滿足正態(tài)分布性。也比如說方差分析,其有一個潛在的前提假定即因變量Y需要滿足正態(tài)分布。還有很多種情況,比如T檢驗,相關(guān)分析等等。

但這種情況往往被分析人員忽略掉,或者是數(shù)學基本不夠扎實,或者是無論如何數(shù)據(jù)均不滿足正態(tài)分布等客觀條件,也或者其它情況等。如果說沒有滿足前提條件,分析的結(jié)果會變得不科學嚴謹,分析結(jié)論會受到置疑。

哪些研究方法需要數(shù)據(jù)滿足正態(tài)分布才行呢?以及如果不滿足正態(tài)分布時應(yīng)該如何處理呢?接下來會逐步說明。

第一:需要滿足正態(tài)分布的幾類常見研究方法:

SPSSAU整理

常見會涉及五種研究方法,它們對正態(tài)性要求相對較高,如果不滿足正態(tài)性則會有對應(yīng)的處理。

線性回歸分析

線性回歸分析,很多時候也稱回歸分析。其對正態(tài)性的要求較為嚴格,包括因變量Y需要滿足正態(tài)性要求,同時殘差也需要滿足正態(tài)性。如果說因變量Y不滿足正態(tài)分布,通常情況下有以下幾種處理辦法。

第1:對因變量Y取對數(shù)處理(包括自然對數(shù)和10為底的對數(shù));這可以在SPSSAU的生成變量功能里面找到;

第2:如果數(shù)據(jù)接近于正態(tài)分布,則接受其為正態(tài)分布性。此種情況較多,因為在研究影響關(guān)系時,線性回歸最適合,如果不進行線性回歸,通常情況下很難有更適合的研究方法。因而很多時候只要數(shù)據(jù)接受于正態(tài)性即可,而不用強求數(shù)據(jù)完美的正態(tài),事實上在生活中絕對的“正態(tài)性”并不存在。使用正態(tài)分布檢驗方法進行驗證正態(tài)性最為嚴苛,因而可使用正態(tài)分布圖直觀查看數(shù)據(jù)分布情況,接近于“正態(tài)分布”更符合實際情況;

第3:加大樣本量;有時候數(shù)據(jù)太少時,即使正態(tài)分布的數(shù)據(jù),也因為樣本小沒有辦法覆蓋各種情況,從而變得不正態(tài),因而加大樣本量會減少這種情況產(chǎn)生。

Pearson相關(guān)分析

Pearson相關(guān)分析(也稱皮爾遜相關(guān)分析,很多時候直接稱呼為相關(guān)分析),在實際研究中使用最多。其實Pearson相關(guān)分析也有著默認的前提條件,即數(shù)據(jù)滿足正態(tài)分布性。但現(xiàn)實中的數(shù)據(jù)很難滿足正態(tài)分布性,此時建議使用Spearman(斯皮爾曼)相關(guān)系數(shù)進行研究即可。

方差分析

方差分析(這里特指單因素方差分析),其默認有個前提條件是因變量需要符合正態(tài)分布性,可能是由于即使非正態(tài)分布,方差分析的結(jié)果也較為穩(wěn)健,因而很少有人先進行正態(tài)分布性檢驗。

事實上方差分析的因變量也需要滿足正態(tài)分布特質(zhì),如果沒有滿足,則可以使用非參數(shù)檢驗進行檢驗。具體非參數(shù)檢驗的類型來看,如果X的組別為兩組,例如研究人員想知道不同性別學生的購買意愿是否有顯著差異,按性別分為男和女共兩組,則應(yīng)該使用MannWhitney統(tǒng)計量,如果組別超過兩組,則應(yīng)該使用Kruskal-Wallis統(tǒng)計量結(jié)果。SPSSAU自動為你選擇MannWhitney或者Kruskal-Wallis統(tǒng)計量。

獨立T檢驗

獨立T檢驗(也稱T檢驗),其默認有個前提條件是因變量需要符合正態(tài)分布性,如果不滿足,此時可考慮使用非參數(shù)檢驗,具體來講應(yīng)該是MannWhitney檢驗進行研究。

單樣本T檢驗

單樣本T檢驗,其默認前提條件是數(shù)據(jù)需要符合正態(tài)分布性,如果不滿足,此時可考慮使用非參數(shù)檢驗,具體來講應(yīng)該是單樣本W(wǎng)ilcoxon檢驗進行研究。

配對樣本T檢驗

配對樣本T檢驗,其默認前提條件是差值數(shù)據(jù)需要符合正態(tài)分布性,如果不滿足,此時可考慮使用非參數(shù)檢驗,具體來講應(yīng)該是單樣本W(wǎng)ilcoxon檢驗進行研究。其實配對樣本T檢驗與單樣本T檢驗的原理是一模一樣,無非是進行了一次數(shù)據(jù)相減(即差值)處理而已,因而其和單樣本T檢驗保持一致。

第二:理論與現(xiàn)實的“相?!?/h1>

從理論上講,很多研究方法需要滿足正態(tài)分布特質(zhì),但現(xiàn)實情況下,很難滿足正態(tài)分布性。SPSSAU認為有兩點原因。

1是抽樣樣本過少,很難cover所有情況,所以導(dǎo)致總體是正態(tài)分布,但抽樣樣本不滿足正態(tài)分布,比如中國13億人的身高肯定是正態(tài)分布,但抽樣100個人可能就不會正態(tài)分布;

2是認知的不一致,事實上正態(tài)性是一種數(shù)學理論上的分布,實際情況下只要數(shù)據(jù)分布基本滿足“鐘形曲線”特征,SPSSAU認為也應(yīng)該將數(shù)據(jù)看成是正態(tài)分布。

因而在實際研究過程中,很可能會出現(xiàn)需要滿足正態(tài)性要求,但是并不滿足,此時應(yīng)該如何處理呢?SPSSAU認為有三種處理方式,如下圖:

SPSSAU整理

第一種:使用正態(tài)分布圖直觀判斷正態(tài)分布特質(zhì),而不是使用檢驗方法。原因在于檢驗方法比較嚴苛,而現(xiàn)實數(shù)據(jù)滿足“鐘形曲線”特征即可;

第二種:將數(shù)據(jù)取對數(shù),或者開根號等處理。如果數(shù)據(jù)值非常大,取對數(shù)或者開根號等,會對數(shù)據(jù)進行“壓縮”處理,相對意義上單位會減小,但值的相對意義還是一樣,通常情況下,數(shù)據(jù)會變得相對“正態(tài)”一些;此步可使用SPSSAU的“生成變量”功能即可完成。

第三種:使用其它研究方法。如果是使用方差分析,T檢驗等,如果不滿足正態(tài)性,則有對應(yīng)的非參數(shù)檢驗方法可以使用。如果是非參數(shù)檢驗方法進行差異對比,則應(yīng)該使用中位數(shù)去表述大小差異等,而一般不使用平均值(滿足正態(tài)分布性時才使用平均值表示整體水平)。當然,SPSSAU均會提供對應(yīng)的非參數(shù)檢驗方法等,可直接使用。

第三:正態(tài)分布的“檢驗方法”

上述已經(jīng)講了很多關(guān)于正態(tài)分布的話題,那如何對正態(tài)分布性進行檢驗?zāi)??SPSSAU共提供以下幾種檢驗,如下:

第一種:圖示法(使用SPSSAU的正態(tài)圖即可,可得到類似如下的圖等)

第二種:檢驗方法

SPSSAU結(jié)果輸出界面

SPSSAU共提供兩種正態(tài)性檢驗方法,包括S-W檢驗和K-S檢驗。小樣本(小于50)時建議使用S-W檢驗,大樣本(大于50)時建議使用K-S檢驗;此兩個檢驗的原假設(shè)為數(shù)據(jù)正態(tài)分布,因而P值>0.05,說明該項具有正態(tài)分布特質(zhì);這些均會在SPSSAU的智能分析中默認提供。


數(shù)據(jù)不正態(tài)分布怎么辦?的評論 (共 條)

分享到微博請遵守國家法律
壶关县| 建平县| 长宁县| 景谷| 乾安县| 南宫市| 盐源县| 宜兴市| 泽库县| 凌源市| 石阡县| 铁岭县| 湘西| 保山市| 余庆县| 阳泉市| 黔西县| 濉溪县| 宜君县| 胶南市| 将乐县| 卢氏县| 黄大仙区| 横山县| 深州市| 邮箱| 梁平县| 长宁县| 西平县| 甘洛县| 肥城市| 河源市| 和田县| 镇江市| 日土县| 江都市| 台州市| 云和县| 夏河县| 德保县| 卫辉市|