16種常用的數(shù)據(jù)分析方法-相關(guān)分析
相關(guān)性分析研究現(xiàn)象之間是否存在某種依存關(guān)系,對具體有依存關(guān)系的現(xiàn)象探討相關(guān)方向及相關(guān)程度。
相關(guān)分析是一種簡單易行的測量定量數(shù)據(jù)之間的關(guān)系情況的分析方法??梢苑治霭ㄗ兞块g的關(guān)系情況以及關(guān)系強(qiáng)弱程度等。
如:身高和體重的相關(guān)性;降水量與河流水位的相關(guān)性;工作壓力與心理健康的相關(guān)性等。
相關(guān)性種類
客觀事物之間的相關(guān)性,大致可歸納為兩大類:
一、函數(shù)關(guān)系
函數(shù)關(guān)系是兩個變量的取值存在一個函數(shù)來唯一描述。
比如銷售額與銷售量之間的關(guān)系,可用函數(shù)y=px(y表示銷售額,p表示單價,x表示銷售量)來表示。所以,銷售量和銷售額存在函數(shù)關(guān)系。
這一類關(guān)系,不是我們關(guān)注的重點。
二、統(tǒng)計關(guān)系
統(tǒng)計關(guān)系,指兩事物之間的非一一對應(yīng)關(guān)系,即當(dāng)變量x取一定值時,另一個變量y雖然不唯一確定,但按某種規(guī)律在一定的范圍內(nèi)發(fā)生變化。
比如:子女身高與父母身高、廣告費(fèi)用與銷售額的關(guān)系,是無法用一個函數(shù)關(guān)系唯一確定其取值的,但這些變量之間確實存在一定的關(guān)系。大多數(shù)情況下,父母身高越高,子女的身高也就越高;廣告費(fèi)用花得越多,其銷售額也相對越多。
這種關(guān)系,就叫做統(tǒng)計關(guān)系。
?
按照相關(guān)表現(xiàn)形式,又可分為不同的相關(guān)類型,詳見下圖:
?
相關(guān)性描述方式
描述兩個變量是否有相關(guān)性,常見的方式有3種:
1.相關(guān)圖(典型的如散點圖和列聯(lián)表等等)
2.相關(guān)系數(shù)
3.統(tǒng)計顯著性
用可視化的方式來呈現(xiàn)各種相關(guān)性,常用散點圖,如下圖:
?
相關(guān)性分析步驟
Step1:相關(guān)分析前,首先通過散點圖了解變量間大致的關(guān)系情況。
如果變量之間不存在相互關(guān)系,那么在散點圖上就會表現(xiàn)為隨機(jī)分布的離散的點,如果存在某種相關(guān)性,那么大部分的數(shù)據(jù)點就會相對密集并以某種趨勢呈現(xiàn)。
如上圖,展現(xiàn)了平時成績與能力評分之間的關(guān)系情況:X增大時,Y會明顯的增大,說明X和Y之間有著正向相關(guān)關(guān)系。
Step2:計算相關(guān)系數(shù)
散點圖能夠展現(xiàn)變量之間的關(guān)系情況,但不精確。還需要通過相關(guān)分析得到相關(guān)系數(shù),以數(shù)值的方式精準(zhǔn)反映相關(guān)程度。
相關(guān)系數(shù)常見有三類,分別是:
Pearson相關(guān)系數(shù)、
Spearman等級相關(guān)系數(shù)
Kendall相關(guān)系數(shù)。
最常使用的是Pearson相關(guān)系數(shù);當(dāng)數(shù)據(jù)不滿足正態(tài)性時,則使用Spearman相關(guān)系數(shù),Kendall相關(guān)系數(shù)用于判斷數(shù)據(jù)一致性,比如裁判打分。
?
相關(guān)性分析案例
數(shù)據(jù)集說明
某公司員工的基本情況,數(shù)據(jù)集含3列,分別為:性別、年齡、工資,
分析主題:希望了解員工年齡和工資水平之間的關(guān)系(企業(yè)人事部門的讀者可關(guān)心一下)。
相關(guān)性可視化
如圖,用散點圖先觀察2個變的關(guān)系。
散點圖顯示2個變量似乎存在一定的相關(guān)性,為了得到更準(zhǔn)確的結(jié)論,接下來要行為更準(zhǔn)確的相關(guān)分析驗證,讓分析結(jié)果更清晰。
相關(guān)系數(shù)計算-SPSS分析過程
1.菜單操作:分析——相關(guān)——雙變量
?
2.結(jié)果解讀
原假設(shè):工資與年齡間不存在相關(guān)關(guān)系
計算結(jié)果sig=0.002,即原假設(shè)不成立?,F(xiàn)實意義為年齡與工資水平有著極顯著的相關(guān)關(guān)系,也就是說隨著年齡的增加,工資會逐漸下降。
?