描述性分析
課程首發(fā)于微信公眾號——211統(tǒng)計課堂,歡迎大家關(guān)注 如需要加入SCI,CSCD論文、課題等科研數(shù)據(jù)統(tǒng)計分析交流群,請加小編微信:“Stat211”,小編拉您進群 描述性分析是數(shù)據(jù)分析的第一步,是了解和認識數(shù)據(jù)基本特征和結(jié)構(gòu)的方法,只有在完成了描述性統(tǒng)計分析,充分的了解和認識數(shù)據(jù)特征后,才能更好地開展后續(xù)更復(fù)雜的數(shù)據(jù)分析。因此,描述性分析是開展數(shù)據(jù)分析過程中最基礎(chǔ)且必不可少的一環(huán)。 ? ?對數(shù)據(jù)進行描述性分析主要考察的類別包括: ? 描述性統(tǒng)計分析的類別 ?① 集中趨勢分析? 集中趨勢是指一組數(shù)據(jù)向某一個中心值靠攏的傾向,集中趨勢統(tǒng)計量是反映一組數(shù)據(jù)一般水平的“代表值”或“中心值”的統(tǒng)計量。 常見的集中趨勢統(tǒng)計量包括平均值、中位數(shù)和眾數(shù)。 擴展閱讀:集中趨勢統(tǒng)計量在3種軟件中的計算 ?②?離散程度分析? 離散程度是指一組數(shù)據(jù),遠離其中心的程度,離散程度統(tǒng)計量一般與集中趨勢統(tǒng)計量結(jié)合起來描述數(shù)據(jù)的整體情況。 判斷數(shù)據(jù)離散程度的統(tǒng)計量主要包括:極差、四分位數(shù)、百分位數(shù)、四分位距、標準差、方差和變異系數(shù)。 擴展閱讀:離散程度統(tǒng)計量在3種軟件中的計算 ?③?數(shù)據(jù)分布形態(tài)分析? 數(shù)據(jù)分布形態(tài)主要指數(shù)據(jù)分布分布是否對稱,偏斜度如何,分布陡峭程度等??坍嫹植夹螒B(tài)的統(tǒng)計量主要有偏度系數(shù)和峰度系數(shù)。
?④?頻率分析和交叉表分析? 頻率分析主要研究變量中不同類別的頻數(shù)、百分比、有效百分比和累計百分比等統(tǒng)計量。 擴展閱讀:樣本分布特征的頻率分析 交叉表分析是觀察兩個變量間的交叉頻數(shù)分布,為了后續(xù)進一步分析兩變量之間是否存在相互影響的關(guān)系。 擴展閱讀:變量之間的關(guān)系之交叉分析與卡方檢驗 ?⑤ 圖表分析? 圖表分析是利用圖表觀察數(shù)據(jù)的分布形態(tài)。在SPSS中開展描述統(tǒng)計分析時,可以順帶輸出一些基本的圖表。常用的圖表包括:條形圖、餅圖、直方圖、箱圖、Q-Q圖等等。 描述性統(tǒng)計分析也包括以圖的方式呈現(xiàn)數(shù)據(jù)的結(jié)構(gòu)和特征。在圖形?->?圖表構(gòu)建器菜單選項中,我們可以輸出豐富的圖形。 ?SPSS中的描述性統(tǒng)計分析工具 ?在SPSS軟件中開展描述性統(tǒng)計分析的菜單比較豐富,在分析?->?描述統(tǒng)計菜單選項中,頻率、描述、探索、交叉表子菜單都能輸出描述性統(tǒng)計量。
?頻率菜單中能輸出的統(tǒng)計量和圖表如下圖所示:
頻率分析不僅可以輸出統(tǒng)計指標,還可以直接輸出相應(yīng)的統(tǒng)計圖,如用于分類變量的餅圖和條形圖,用于連續(xù)變量的直方圖。 描述和探索菜單中能輸出的統(tǒng)計量和圖表如下圖所示:
? 描述菜單主要用于進行一般性的統(tǒng)計描述,相對于頻率分析而言,它能輸出的統(tǒng)計量較少,但使用頻率卻更高。從上圖中的統(tǒng)計選項卡可以看出,該菜單適用于對服從正態(tài)分布的連續(xù)變量進行描述。 探索菜單是用于對分布狀況不清的連續(xù)資料進行探索性分析,它能輸出很多描述性統(tǒng)計量,包括:平均值、中位數(shù)、方差、標準差、最大值、最小值、全距、四分位距、偏度、峰度等。同時還能輸出直方圖、莖葉圖、箱線圖、Q_Q圖等統(tǒng)計圖,是描述統(tǒng)計菜單中最強大的一個描述過程。 交叉表菜單的對話框如下圖所示:
交叉表對兩個或多個分類變量進行聯(lián)合描述,可以產(chǎn)生二維或n維列聯(lián)表,并計算相應(yīng)的行/列/合計百分比、行列匯總指標等。 上述這4種菜單所能輸出的統(tǒng)計量都是固定的選項,如果你想要更靈活的選擇輸出統(tǒng)計量,可以選擇定制表功能,它不僅可以開展頻率分析、交叉分析和分組匯總分析,還可以自定義輸出的統(tǒng)計表格類型,以及需要輸出的統(tǒng)計量。
?在菜單分析?->?表?->?定制表中,我們可以將數(shù)據(jù)拖入制表畫布,對制表變量的統(tǒng)計指標、匯總方式等進行設(shè)定。在摘要統(tǒng)計復(fù)選框中有上百種統(tǒng)計量可供選擇,我們可以按需設(shè)定。 值得注意的是,對于不同類型的變量,常用的描述性統(tǒng)計分析方法和參數(shù)不同。 對于數(shù)值型變量,常用的描述性統(tǒng)計分析方法包括集中趨勢分析、離散程度分析和數(shù)據(jù)分布形態(tài)分析等。對于分類變量,常用的描述性統(tǒng)計分析方法包括頻數(shù)分析和交叉列聯(lián)表分析。 大家在對數(shù)據(jù)進行描述性分析并選擇輸出統(tǒng)計量時,需要注意數(shù)據(jù)的類型,并輸出對應(yīng)的統(tǒng)計量和統(tǒng)計圖表。 ?描述性統(tǒng)計分析結(jié)果展示 ?描述統(tǒng)計的結(jié)果需要以三線表的形式進行呈現(xiàn)。學(xué)術(shù)論文中,涉及到的表格一般都需要以三線表的形式呈現(xiàn)。 輸出或制作三線表的方法主要有三種: 方法一:直接使用SPSS輸出三線表,使用SPSS的【分析】>【定制表】功能輸出描述統(tǒng)計的結(jié)果,然后結(jié)合定制的三線表樣式文件直接輸出三線表。 方法二:將SPSS的輸出結(jié)果,復(fù)制到Excel中進行內(nèi)容刪減和表格結(jié)構(gòu)調(diào)整,調(diào)整完成后,再復(fù)制到Word中進行邊框調(diào)整。 方法三:直接在Word中制作好三線表的表頭和表結(jié)構(gòu),將SPSS的輸出結(jié)果復(fù)制或者手工輸入到三線表中。手工謄抄數(shù)據(jù)時,很可能把數(shù)據(jù)弄錯,注意核查。 通常,SPSS直接輸出的圖表很難完全滿足大家的需求,多少需要進行一些格式的微調(diào)。我一般都會選擇方法二對圖表進行進一步的優(yōu)化。 比如下圖是一個最常見的統(tǒng)計表格,為了避免表格過長,我將它分成了左右兩邊并列排列。這種操作必須借助Excel和Word手動完成。
下面的這個描述統(tǒng)計表格也額外添加了被接受變量、變量含義等列,使整個表格內(nèi)容更完整易讀。
?描述統(tǒng)計和三線表這部分的內(nèi)容十分豐富,但操作步驟繁多瑣碎,很難通過文字的形式表達清楚,但通過視頻演示卻能十分直觀快速的讓大家學(xué)會這些操作。