「SPSSAU|數(shù)據(jù)分析」:效度案例分析
案例說明
調(diào)查不同人群對于創(chuàng)業(yè)方面的想法,其中認為也許影響“創(chuàng)業(yè)可能性”分為“科技發(fā)展”,“社會資源”和“教育水平”共3個維度,其三個維度下的11個分析項都是量表題,以及創(chuàng)業(yè)可能性也是由2個量表題構(gòu)成,案例數(shù)據(jù)中還包括基本個體特征比如性別、年齡等,數(shù)據(jù)樣本為200個。此案例主要分析目的是研究測量題項設計是否合理,使用SPSSAU效度分析進行。首先對效度類型進行說明。
效度類型
效度分析在研究中非常常見,其用于分析‘測量項是否真實有效的測量自己希望測量的變量’,效度分析的研究方式有多種,通常包括內(nèi)容效度,結(jié)構(gòu)效度(SPSSAU探索性因子分析法)、聚合效度(SPSSAU驗證性因子分析法)和區(qū)分效度??梢娤卤砀瘢?/p>
內(nèi)容效度是指使用文字敘述形式對問卷的合理性、科學性進行說明,比如問卷中測量量表題有著嚴謹?shù)膮⒖家罁?jù),一般來說采用現(xiàn)有成熟的量表則說明內(nèi)容效度較好。比如測量‘美麗’這個變量,用了三個量表題,分別是‘看起來很年輕’,‘看上去五官端正’,‘看上去心情很好’,這3個測量題是有著參考依據(jù),也或者專家認為此3項確實可以測量‘美麗’這個關(guān)鍵變量,那么就說明具有內(nèi)容效度。
結(jié)構(gòu)效度通常使用探索性因子分析(EFA)進行驗證,即通過探索性因子分析對題項進行分析,如果輸出結(jié)果顯示題項與變量對應關(guān)系基本與預期一致,則說明結(jié)構(gòu)效度良好。即在收集好數(shù)據(jù)后,讓軟件運行下,軟件會運行出來‘變量’與‘測量項’之間的對應關(guān)系情況,而自己也有著‘變量’與‘測量項’之間的對應關(guān)系,如果說二者基本吻合,那么說明自己想的,與軟件出來的結(jié)果基本一致,那么就說明結(jié)構(gòu)上數(shù)據(jù)具有有效性,即具有結(jié)構(gòu)效度。此種測量方式最為普遍,在實際研究中最常使用。當然很可能結(jié)果為‘變量’與‘測量項’之間的對應關(guān)系情況,與自己預期不一致,此時需要自行分析,通常是刪除掉對應關(guān)系出錯的‘測量項’,最終讓余下的‘測量項’與‘變量’的對應關(guān)系,與預期保持一致。
聚合效度強調(diào)本應該在同一因子下面的測量項,確實在同一因子下面。聚合效度是使用AVE開根號然后再與相關(guān)分析結(jié)果進行對比,除此之外還可以使用HTMT異質(zhì)-單質(zhì)比率法測量聚合效度,在SPSSAU中均有提供。
區(qū)分效度強調(diào)本不應該在同一因子的測量項,確實不在同一因子下面。區(qū)分效度的具體測量方式是使用AVE值和相關(guān)分析結(jié)果對比等。
此案例分析使用結(jié)構(gòu)效度首先判斷測量項的對應關(guān)系,由于案例中有自變量與因變量,所以分析時將自變量和因變量分開進行分析因為本身自變量和因變量之間可能有關(guān)系,一般分開做。
效度難點(對應關(guān)系)
一般情況下,如果11項與3個因子之間的對應關(guān)系情況,與專業(yè)知識情況不符合,比如第一項被劃分到了第一個因子下面,此時則說明可能Q1這項應該被刪除處理,其出現(xiàn)了‘張冠李戴’現(xiàn)象。因而在進行分析時很可能會對部分不合理項進行刪除處理。除此之外,也有可能會出現(xiàn)‘糾纏不清’現(xiàn)象。
“張冠李戴”
一般情況下,如果11項與3個因子之間的對應關(guān)系情況,與專業(yè)知識情況不符合,比如Q1被劃分到了第一個因子下面,此時則說明可能Q1這項應該被刪除處理,其出現(xiàn)了‘張冠李戴’現(xiàn)象。出現(xiàn)“張冠李戴”的情況就需要進行刪除處理,由于本案例沒有出現(xiàn)“張冠李戴”的情況所以不用處理。
“糾纏不清”
除了“張冠李戴”現(xiàn)象,有時候會出現(xiàn)‘糾纏不清’現(xiàn)象,比如Q1可歸屬為因子1 ,同時也可歸屬到因子2,這種情況較為正常(稱作‘糾纏不清’),需要結(jié)合實際情況處理即可,可將該項刪除,也可不刪除,由于本案例的自變量效度分析沒有出現(xiàn)“糾纏不清”的情況,所以也不需要考慮。
對因變量進行分析與查看發(fā)現(xiàn)也不存在“張冠李戴”與“糾纏不清”的情況,所以均不需要處理。因子分析是一個多次重復的過程,比如刪除某個或多個題項后,則需要重新再次分析進行對比選擇等。最終目的在于:因子與分析項對應關(guān)系,與專業(yè)知識情況基本吻合。
結(jié)構(gòu)效度分析
效度一般分析過程如下:
首先設置維度個數(shù)為5個數(shù),并且接著把‘共同度’值較低(一般小于0.4或0.5)移除掉,‘共同度值’低意味著‘測量項’的信息沒有被提取出來,說明根本不適合對‘測量項’進行測量;接著移除掉‘張冠李戴’的項,似情況而定,一般一次移除盡量少的‘測量項’;重復第2步和第3步操作,直到最終‘測量項’與‘變量’之間的對應關(guān)系情況與預期符合。由于模型沒有“張冠李戴”情況所以不需要處理,首先設置維度如下(SPSSAU問卷研究中的效度):
由于案例中分為自變量和因變量,所以分析時將自變量和因變量分開進行分析因為本身自變量和因變量之間可能有關(guān)系一般分開做。
1.自變量
使用KMO 和 Bartlett 檢驗進行效度驗證,從上表可以看出:KMO值為0.809,KMO值大于0.8,研究數(shù)據(jù)非常適合提取信息(從側(cè)面反應出效度很好)。
效度研究用于分析研究項是否合理,有意義,效度分析使用因子分析這種數(shù)據(jù)分析方法進行研究,分別通過KMO值,共同度,方差解釋率值,因子載荷系數(shù)值等指標進行綜合分析,以驗證出數(shù)據(jù)的效度水平情況。KMO值用于判斷信息提取的適合程度,共同度值用于排除不合理研究項,方差解釋率值用于說明信息提取水平,因子載荷系數(shù)用于衡量因子(維度)和題項對應關(guān)系,從上表可知:所有研究項對應的共同度值均高于0.4,說明研究項信息可以被有效的提取。另外,KMO值為0.809,大于0.6,數(shù)據(jù)可以被有效提取信息。另外,3個因子的方差解釋率值分別是25.041%,23.627%,21.097%,旋轉(zhuǎn)后累積方差解釋率為69.765%>50%。意味著研究項的信息量可以有效的提取出來。最后,請結(jié)合因子載荷系數(shù),去確認因子(維度)和研究項對應關(guān)系,是否與預期相符,如果相符則說明具有效度,反之則需要重新進行調(diào)整。因子載荷系數(shù)絕對值大于0.4時即說明選項和因子有對應關(guān)系。
2.因變量
使用KMO 和 Bartlett 檢驗進行效度驗證,從上表可以看出:研究項僅為2項,因而KMO值無論如何均為0.5,不能根據(jù)KMO值測量效度。
效度研究用于分析研究項是否合理,有意義,效度分析使用因子分析這種數(shù)據(jù)分析方法進行研究,分別通過KMO值,共同度,方差解釋率值,因子載荷系數(shù)值等指標進行綜合分析,以驗證出數(shù)據(jù)的效度水平情況。KMO值用于判斷信息提取的適合程度,共同度值用于排除不合理研究項,方差解釋率值用于說明信息提取水平,因子載荷系數(shù)用于衡量因子(維度)和題項對應關(guān)系,從上表可知:所有研究項對應的共同度值均高于0.4,說明研究項信息可以被有效的提取。另外,當前僅2個研究項,因而KMO值為0.5。另外,1個因子的方差解釋率值分別是75.056%,旋轉(zhuǎn)后累積方差解釋率為75.056%>50%。意味著研究項的信息量可以有效的提取出來。最后,請結(jié)合因子載荷系數(shù),去確認因子(維度)和研究項對應關(guān)系,是否與預期相符,如果相符則說明具有效度,反之則需要重新進行調(diào)整。因子載荷系數(shù)絕對值大于0.4時即說明選項和因子有對應關(guān)系。
其它
上述對于結(jié)構(gòu)效度分析發(fā)現(xiàn)效度良好,如果想要深入分析,可以繼續(xù)進行聚合效度和區(qū)分效度的分析,接下來我們對測量項進行聚合效度和區(qū)分效度的查看(可不做,此處只做案例參考)與進一步處理。
1.深入分析
(1)聚合效度
利用SPSSAU問卷研究中的驗證性因子分析,將分析項拖拽到右側(cè)分析框中,將一個維度的量表題拖拽到一個Factor中,點擊開始分析:
聚合效度一般查看驗證性因子分析的AVE和CR指標結(jié)果如下:
本次針對共4個因子,以及13個分析項進行驗證性因子分析(CFA)分析。從上表可知,共4個因子對應的AVE值全部均大于0.5,且CR值全部均高于0.7,意味著本次分析數(shù)據(jù)具有良好的聚合(收斂)效度。
(2)區(qū)分效度
針對區(qū)分效度進行分析,針對Factor1,其AVE平方根值為0.770,大于因子間相關(guān)系數(shù)絕對值的最大值0.441,意味著其具有良好的區(qū)分效度。針對Factor2,其AVE平方根值為0.800,大于因子間相關(guān)系數(shù)絕對值的最大值0.441,意味著其具有良好的區(qū)分效度。針對Factor3,其AVE平方根值為0.728,大于因子間相關(guān)系數(shù)絕對值的最大值0.336,意味著其具有良好的區(qū)分效度。針對Factor4,其AVE平方根值為0.791,大于因子間相關(guān)系數(shù)絕對值的最大值0.232,意味著其具有良好的區(qū)分效度。
2.進一步處理
將自變量與因變量分別分析總結(jié)后,根據(jù)對應關(guān)系將變量進行命名,由于都是量表題大部分使用平均值法,其它分析項如果不是量表題想要合成一個維度可以使用因子得分等。
由于問卷中多個量表表示一個問題所以將量表合成一個維度進行分析:
例如“我意識到科技發(fā)展對于創(chuàng)業(yè)的好處”、“我認為科技發(fā)展使得創(chuàng)業(yè)更加容易”、“我認為網(wǎng)絡創(chuàng)業(yè)在中國會成為一種趨勢”以及“將來我可能會以科技行業(yè)作為創(chuàng)業(yè)起點”,四個量表題可以表示“科技發(fā)展”利用SPSSAU數(shù)據(jù)處理中的生成變量就可以完成,如圖所示:
“我認為社會關(guān)系對于創(chuàng)業(yè)是非常重要”、“擁有好的社會關(guān)系可以幫助創(chuàng)業(yè)人成就一番事業(yè)” 以及“沒有好的社會關(guān)系會影響創(chuàng)業(yè)活動的成功”,三個量表題可以表示“社會資源”如圖所示:
其它變量也是如此。最后可以命名為“科技發(fā)展”、“社會資源”、“教育水平”以及“創(chuàng)業(yè)可能性”四個大維度,對于分析調(diào)整后的分析項也可以進行信度分析,一般步驟是進行效度分析后進行信度分析,原因在于效度分析可能會涉及刪除分析項等。
總結(jié)
研究該問卷中測量題項設計是否合理,使用SPSSAU效度分析進行。首先對效度類型進行說明其中包括內(nèi)容效度,結(jié)構(gòu)效度、聚合效度和區(qū)分效度。案例分析主要使用結(jié)構(gòu)效度進行分析,首先對效度難點進行說明,由于案例中有自變量與因變量,所以分析時將自變量和因變量分開進行分析,對于結(jié)構(gòu)效度結(jié)果進行分析說明,分析后對分析項進行深入分析(包括聚合效度和區(qū)分效度)以及進一步處理,此次分析結(jié)束。