平均趨勢和離散趨勢
一、案例介紹
某人調(diào)查了15名女大學(xué)生的腰圍(cm),其測定值為:71.0,73.5,81.0,72.5,76.5,75.5,76.0,69.0,76.5,72.5,79.5,74.0,66.0,69.0,73.0,想要得到這15名大學(xué)生腰圍的集中趨勢的指標(biāo)和離散趨勢的指標(biāo)以及分布的形狀。
二、問題分析
集中趨勢是指一組數(shù)據(jù)向某一中心值靠攏的程度,他反應(yīng)了一組數(shù)據(jù)向某一中心值靠攏的程度,它反映了一組數(shù)據(jù)中心點位置的所在,其中常見的表示集中趨勢的變量有中位數(shù)以及平均數(shù)等。離散趨勢指標(biāo)一般描述遠離其中心值的趨勢,常見的表示離散程度的指標(biāo)有方差或者標(biāo)準(zhǔn)差、變異系數(shù)等。分布的形狀一般反映數(shù)據(jù)分布的偏態(tài)(偏度)與峰態(tài)(峰度)想要得到這15名大學(xué)生腰圍的集中趨勢的指標(biāo)、離散趨勢的指標(biāo)以及分布的形狀,可以進行公式計算,或者利用軟件快速得到。接下來我們一一進行描述。
三、公式計算
1、集中趨勢指標(biāo)計算
表示一組數(shù)據(jù)集中趨勢的指標(biāo)有很多,我們這里對均值、中位數(shù)進行描述。
均值
均值,他是一組數(shù)據(jù)相加后除以數(shù)據(jù)個數(shù)得到的結(jié)果,均值是集中趨勢的最主要測度值,它主要適用于定量數(shù)據(jù)而不適用于定類數(shù)據(jù)。其計算公式如下:
所以案例的均值為:73.7
中位數(shù)
中位數(shù)是一組數(shù)據(jù)排序后處于中間位置上的變量值,想要得到15名大學(xué)生腰圍的中位數(shù),就需要先將數(shù)據(jù)排序,找到中間位置上的數(shù)值,經(jīng)排序后中位數(shù)為73.5。
2、離散趨勢指標(biāo)計算
對集中趨勢的指標(biāo)計算后,我們對表示離散趨勢的指標(biāo)進行計算,常見的指標(biāo)一般有最大值,最小值,四分位差,方差,標(biāo)準(zhǔn)差,變異系數(shù)。
最大值
最大值一般就是指一組數(shù)據(jù)中最大的值。這里為81.0。由于只有15個數(shù)據(jù),所以結(jié)論比較直觀,如果分析的數(shù)據(jù)過多一般可能需要借助數(shù)據(jù)分析工具進行查看更方便。
最小值
最小值一般就是指一組數(shù)據(jù)中最大的值。這里為66.0。由于只有15個數(shù)據(jù),所以結(jié)論比較直觀,如果分析的數(shù)據(jù)過多一般可能需要借助數(shù)據(jù)分析工具進行查看更方便。
四分位差
四分位差也稱四分間距(IQR),一般是指上四分位數(shù)和下四分位數(shù)之差,四分位數(shù)一般反映了中間50%的數(shù)據(jù)的離散程度,數(shù)值越小說明中間數(shù)據(jù)越集中,反之,數(shù)值越大說明數(shù)據(jù)越分散,四分位差在一定程度上說明了中位數(shù)對一組數(shù)據(jù)的代表程度,一般適用于定量變量。四分位數(shù)是將一組數(shù)據(jù)由小到大排序后,用3個點將全部數(shù)據(jù)分為4等份,與這3個點位置上相對應(yīng)的數(shù)值稱為四分位數(shù),分別記為Q1、Q2、Q3。分別為71和76.5,所以四分位差為5.5。
方差
方差是各變量值與平均數(shù)離差平方的平均數(shù),方差能夠很好的反映數(shù)據(jù)的離散程度,也是應(yīng)用最廣的離散測度值。其計算公式如下:
所以案例的方差為:
標(biāo)準(zhǔn)差
標(biāo)準(zhǔn)差就是就是方差的平方根值,所以案例中的標(biāo)準(zhǔn)差為4.012。
變異系數(shù)
變異系數(shù)也叫離散系數(shù),它是一組數(shù)據(jù)的標(biāo)準(zhǔn)差與其相應(yīng)的平均數(shù)之比,變異系數(shù)是測度數(shù)據(jù)離散程度的統(tǒng)計量,主要用于比較不同樣本數(shù)據(jù)的離散程度,變異系數(shù)大,說明離散程度大,變異系數(shù)小,說明數(shù)據(jù)的離散程度也小。其計算公式如下:
3、分布的形狀
雖然集中趨勢和離散程度是數(shù)據(jù)分布的兩個重要特征,但要全面了解數(shù)據(jù)分布的特點,還需要知道數(shù)據(jù)分布的形狀是否對稱,偏斜程度等等,其中偏度和峰度就是對數(shù)據(jù)分布形狀的測度。
偏度
偏度也稱偏態(tài)它是對數(shù)據(jù)分布對稱性的測度,偏度可以描述數(shù)據(jù)的分布情況,具體如下:
偏態(tài)系數(shù)的計算方法有很多,通常采用的公式如下:
案例的偏度如下:
峰度
峰度是對數(shù)據(jù)分布平峰或者尖峰程度的測度,測度峰態(tài)的統(tǒng)計量是峰態(tài)系數(shù),當(dāng)峰度大于0則為尖峰分布,當(dāng)峰度小于0此時為扁平分布,其通常采用的計算公式如下:
案例的峰度如下:
最后峰度為-0.089。
四、軟件操作及結(jié)果解讀
本案例只有15個數(shù)據(jù),所以利用公式計算比較容易,如果一組數(shù)據(jù)有很多個,則不容易利用公式進行計算,這時,我們可以借助數(shù)據(jù)分析工具,快速準(zhǔn)確的得到結(jié)果。
1. 軟件操作
首先進行上傳數(shù)據(jù),數(shù)據(jù)格式如下:
一列為一個分析項,為一個指標(biāo)。上傳數(shù)據(jù)后點擊【通用方法】→【描述分析】然后進行分析:
2. 結(jié)果解讀
結(jié)果如下:
結(jié)果分為基礎(chǔ)指標(biāo)和深入指標(biāo),基礎(chǔ)指標(biāo)如下:
深入指標(biāo)如下:
可以發(fā)現(xiàn)分析工具得到的數(shù)據(jù)和計算的數(shù)據(jù)都一致,但是利用分析工具得到的數(shù)值更方便更迅速。
可以發(fā)現(xiàn)該組數(shù)據(jù)的平均腰圍為73.7cm,并且方差為16.1,標(biāo)準(zhǔn)差為4.012,其中峰度為-0.089說明數(shù)據(jù)為扁平分布,偏度為-0.053說明數(shù)據(jù)為中等偏態(tài)分布。
五、知識小貼士
1、排序題如何分析?
排序題一般是計算平均排名值,通過排名大小進行對比和分析。直接使用描述分析即可,同時排序題也是‘定量’數(shù)據(jù),可使用方差分析或t檢驗等對比排名的差異情況。特別提示,需要注意數(shù)字代表的意義,比如數(shù)字越小代表排名越好,還是數(shù)字越大代表排名越好。如果數(shù)字大小代表的排名好壞與從預(yù)期不符,建議可使用數(shù)據(jù)處理里面的數(shù)據(jù)編碼進行反向處理后再分析即可。
2、如何計算眾數(shù)?
眾數(shù)是指出現(xiàn)頻率最高的項,建議使用頻數(shù)分析查看即可。有可能出現(xiàn)頻數(shù)出現(xiàn)最高的項有多個,此時眾數(shù)就有多個。眾數(shù)的實際應(yīng)用意義較少,建議用戶可結(jié)合數(shù)據(jù)類型情況,使用百分比,或者平均值或者中位數(shù)等,而不使用眾數(shù)。