11.12探索性因素分析--學(xué)習(xí)筆記
一、目的和描述
?
因素分析:統(tǒng)計(jì)技巧—將某事物多個(gè)觀測(cè)變量縮減成描述事物的少數(shù)不可觀測(cè)變量(潛變量、潛在因素);一種降維的技術(shù)
??? 探索性因素分析(EFA):簡(jiǎn)化數(shù)據(jù)
驗(yàn)證性因素分析(CFA) :數(shù)據(jù)是否真的測(cè)到了這些因素;是否驗(yàn)證已有理論。
?
回答問題:
能否提取少數(shù)有意義的維度或潛在因素,尋求并確定原始數(shù)據(jù)背后潛在結(jié)構(gòu)
具體來(lái)說:1、眾多原始數(shù)據(jù)中是否能提取少數(shù)潛在因素;2、數(shù)據(jù)驅(qū)動(dòng)方式幫助理論構(gòu)建(確定測(cè)量的心理特質(zhì)的維度和結(jié)構(gòu))
?
?
二、模型、假設(shè)及基本步驟
?
模型:將觀測(cè)到的數(shù)據(jù)表示稱幾個(gè)潛在因素的線性組合(具體公式p132、133)
?
全分量模型:對(duì)n個(gè)觀測(cè)變量用n個(gè)新的潛在因素線性來(lái)表示。
??? 實(shí)際中,常只取少數(shù)幾個(gè)對(duì)觀測(cè)變量方差貢獻(xiàn)最大的因素(把方差貢獻(xiàn)較小的因素看作特素因子項(xiàng))
??? 標(biāo)準(zhǔn):基于整體變異
??? 目的:簡(jiǎn)化數(shù)據(jù)結(jié)構(gòu),找出少數(shù)幾個(gè)潛在因素后對(duì)觀測(cè)變量加以分類
?
公共因素模型:所有觀測(cè)變量中的每個(gè)觀測(cè)變量均可表示為m個(gè)公共因素和1個(gè)特殊因素的線性組合。
??? 公共因素解釋觀測(cè)變量之間的相關(guān),特殊因素用于解釋觀測(cè)變量除去公共因素影響后剩下的部分方差。
??? 標(biāo)準(zhǔn):基于共同的變異
??? 找到能代表原始變量的潛在結(jié)構(gòu)或維度,尋找潛在因素與觀測(cè)變量的關(guān)系
?
具體選擇:
如果除了共同成分解釋外,剩余方差比例很小,則可以使用全分量模型中的主成分分析
實(shí)際上,當(dāng)變量很多(大于30)或者大多數(shù)變量共同都超過0.6時(shí),使用兩種模型差別不大。
?
步驟:
因素分析主要目的時(shí)從觀測(cè)變量相關(guān)矩陣R中解出因素在和矩陣A。
具體:1、因素抽取,所得到的因素載荷矩陣成為初始因素載荷矩陣
2、因素旋轉(zhuǎn),所得到的因素載荷矩陣成為旋轉(zhuǎn)因素載荷矩陣
?
基本概念
?
因素載荷:因素分析模型中各公共因素和觀測(cè)變量的加權(quán)系數(shù)(通常將公共因素的系數(shù)稱為因素載荷ajm)。它是潛在因素對(duì)觀測(cè)變量影響程度的估計(jì)。因素載荷絕對(duì)值越大,說明在組成該觀測(cè)變量的諸多因素中,該因素作用越大。
?
共同度:指公共因素方差在觀測(cè)變量總方差中所占的比例,即用公共因素代替觀測(cè)變量后,每個(gè)變量信息被保留的程度,h方表示。
(觀測(cè)變量總方差=公共因素方差+特殊因素方差+誤差方差。
特殊、誤差的方差是模型未抽取的部分方差,特殊因素方差一般指每個(gè)觀測(cè)變量特有的部分;誤差值隨機(jī)誤差)
理解:1、在心理測(cè)量中,共同度反映檢測(cè)題目測(cè)到所要測(cè)量行為屬性的程度
2、評(píng)價(jià)區(qū)分度的指標(biāo)(某題目構(gòu)成因素的共同度大,則該題測(cè)被試個(gè)體差異強(qiáng),改題目區(qū)分度好)
?
特征根(λ):反映某公共因素對(duì)各觀測(cè)變量的影響程度,也反映該公共因素的重要性。
?
貢獻(xiàn)率:指各因素的特征根在總的公共因素方差(或總特征根)中所占的比例。(每個(gè)變量方差被標(biāo)準(zhǔn)化,則總方差為變量個(gè)數(shù)n,貢獻(xiàn)率=λ/n)
?
前提假設(shè):
理論假設(shè):變量中確實(shí)存在某種潛在結(jié)構(gòu)
統(tǒng)計(jì)假設(shè):觀測(cè)變量間有較強(qiáng)的相關(guān)關(guān)系(如果相關(guān)小,則不可能共享公共因素)
Spss的統(tǒng)計(jì)量:
1、變量間相關(guān)矩陣:所有或大部分小于0.3,則不適合
2、反映像相關(guān)矩陣:非對(duì)角線絕對(duì)值較小,對(duì)角線上MAS值較大(0.5),則適合
3、KMO測(cè)度和Bartlett球形檢驗(yàn)
?? KMO:比較觀測(cè)變量間的簡(jiǎn)單相關(guān)系數(shù)和偏相關(guān)系數(shù)的相對(duì)大小,值0-1(偏相關(guān)遠(yuǎn)小于簡(jiǎn)單相關(guān)時(shí)KMO接近1)。一般來(lái)說:0.5一下不能接受,0.5-0.6很差;0.6-0.7差;0.7-0.8一般;0.8-0.9好,0.9-1非常好
?? Bartlett球形檢驗(yàn):需要拒絕零假設(shè)(整個(gè)相關(guān)矩陣為單位陣),才適用
?
基本步驟:(p136)
?
?
三、分析前的準(zhǔn)備
?
明確目的
1、數(shù)據(jù)總結(jié):得到數(shù)據(jù)的潛在結(jié)構(gòu),從而用更少的變量來(lái)解釋和理解原始數(shù)據(jù)
2、數(shù)據(jù)簡(jiǎn)化:進(jìn)一步采用因素分(因子得分)代替原始變量對(duì)原始數(shù)據(jù)進(jìn)行描述
(也可以對(duì)被試進(jìn)行因素分析,將其分成不同組別,采用潛在類別分析,或Q類型的因素分析)
設(shè)計(jì)分析
1、確定針對(duì)變量還是個(gè)案(對(duì)變量的:R分析;對(duì)個(gè)案的:Q分析)
2、計(jì)算原始數(shù)據(jù)的相關(guān)看是否滿足探索性因素分析的條件(計(jì)算相關(guān)、協(xié)方差矩陣)
3、根據(jù)變量數(shù)目、特征等確定分析方法(代表每個(gè)因素的變量數(shù)目應(yīng)當(dāng)大于等于5,最少3)
4、確定樣本量是否足夠得到穩(wěn)定結(jié)果
檢驗(yàn)假設(shè)
概念性與統(tǒng)計(jì)性的假設(shè)檢驗(yàn)(p138)
?
?
四、因素抽取和旋轉(zhuǎn)
?
全分量模型:
一般采取主成分分析法
?
公共因素模型
1、主軸因素法(SPSS中PAF命令)
2、最小二乘法
3、極大似然法(樣本量大時(shí),精度更高)
4、映像分析法(SPSS中image命令)(映像:一個(gè)變量的映像指它可以在一定領(lǐng)域中被其他變量確定的部分,多重回歸求得,其余部分為反映像)
5、α因素分析法(SPSS中α命令)
6、最大相關(guān)法7、形心心素法8、參照析因迭代法9、復(fù)相關(guān)平方法
?
公共因素?cái)?shù)目的確定
1、先驗(yàn)標(biāo)準(zhǔn):根據(jù)已有的理論
2、特征根準(zhǔn)則:特征根大于等于1的主成分作為初始因素(最普遍)
3、碎石檢驗(yàn)準(zhǔn)則:按照因素被提取的順序,畫出因素的特征根隨因素個(gè)數(shù)變化的散點(diǎn)圖。找到圖中斜率明顯不同的點(diǎn),該點(diǎn)及之前的因素為抽取因素(SPSS中SAS實(shí)現(xiàn))
4、因素累積解釋方差的比例標(biāo)準(zhǔn):保證所有的累積因素解釋的方差比例達(dá)到一定程度,確保探索性因素分析結(jié)果有顯著意義。(累積60%以上一般)
實(shí)際中,要結(jié)合多個(gè)標(biāo)準(zhǔn)進(jìn)行判斷
?
因素旋轉(zhuǎn)
為旋轉(zhuǎn)時(shí),基于因素所解釋的方差比例來(lái)抽取因素,第一個(gè)因素解釋的變異最多,越往后解釋的越少。
旋轉(zhuǎn)的目的:通過改變坐標(biāo)軸的位置,重新分配各因素解釋的方差的比例,使因素結(jié)構(gòu)簡(jiǎn)單并易于解釋。旋轉(zhuǎn)不改變模型對(duì)數(shù)據(jù)的擬合也不改變每個(gè)變量的共同度。
1、正交旋轉(zhuǎn):(默認(rèn)因素間不存在相關(guān)
1)、四次方最大法
2)、方差最大法
3)、等量最大法
2、斜交旋轉(zhuǎn):(沒有因素見相互獨(dú)立的限制,因素間夾角任意)
常見oblimin以及promax
?
解釋因素
首先估計(jì)最初因素載荷矩陣;其次因素旋轉(zhuǎn);最后重新定義和解釋因素
斜交旋轉(zhuǎn)后一般得到
因素模式矩陣:載荷表示每個(gè)變量對(duì)因素的唯一貢獻(xiàn)
因素結(jié)構(gòu)矩陣:包含唯一貢獻(xiàn)和因素之間的相關(guān)
(通常會(huì)報(bào)告因素結(jié)構(gòu)矩陣;正交旋轉(zhuǎn)下兩者一致;
如果報(bào)告因素模式矩陣還要報(bào)告變量間的相關(guān))
如果遇到交叉載荷:課旋轉(zhuǎn)因素得到簡(jiǎn)單結(jié)構(gòu)因素載荷,或者接刪除。
當(dāng)變量只在某一個(gè)因素上有高載荷時(shí),結(jié)構(gòu)最優(yōu)。同時(shí)共同度0.5以上才能接受。
?
?
五、應(yīng)用
?
效度檢驗(yàn)
1、使用驗(yàn)證性因素分析的方法評(píng)估結(jié)果的可重復(fù)性(交叉驗(yàn)證)
2、評(píng)估因素結(jié)構(gòu)的穩(wěn)定性(樣本量大,分兩半,都因素分析,比較得到的因素載荷)
3、對(duì)刪除異常值前后的樣本進(jìn)行探索性因素分析,比較結(jié)果的一致性(穩(wěn)定-結(jié)果較好的泛化性)
?
處理結(jié)果
探索性因素分析結(jié)果被處理后,可以應(yīng)用于其他的統(tǒng)計(jì)分析,方式:
1、針對(duì)每個(gè)因素選擇有代表性的變量進(jìn)行后續(xù)研究
2、合成維度分
選出最能代表某個(gè)因素的變量,然后對(duì)這些變量值求平均值或加權(quán),使用這個(gè)維度分代表潛在因素
3、計(jì)算因素得分(缺陷:其他研究中很難重復(fù))
將得到的因素作為因變量做回歸分析,對(duì)樣本進(jìn)行分類和評(píng)價(jià)。即對(duì)因素進(jìn)行測(cè)度,給出因素對(duì)應(yīng)的每個(gè)樣本的個(gè)案的值,這些值稱為因素得分,又叫因子分
因素分與合成維度分的區(qū)別:
因素分基于某個(gè)因素上有載荷的所有變量計(jì)算的,而維度分可能只選取部分變量
因素分計(jì)算考慮了每個(gè)變量的因素載荷,而維度分可能只是平均數(shù)沒有加權(quán)
?
?
六、注意的問題
1、樣本量:小于50不適合,一般至少變量數(shù)的5倍(甚至更高)
2、缺失值:如果刪除被試—樣本量是否足夠;是否會(huì)造成有偏估計(jì)結(jié)果
?????????? 如果回歸等方式插補(bǔ)—是否會(huì)造成模型過擬合,相關(guān)偏高
3、抽取因素?cái)?shù)充分性:抽取過多,擬合高,方差解釋比例大,但也越復(fù)雜
?????????? (如果某因素只有一個(gè)變量載荷,沒有必要存在)
4、因素的重要性及內(nèi)部一致性的問題
1)因素重要性由旋轉(zhuǎn)后,每個(gè)因素解釋方差或協(xié)方差的比例來(lái)衡量。
2)因素內(nèi)部一致性:用因素分多重相關(guān)的平方來(lái)確定。
多重相關(guān)系數(shù):某個(gè)因素分與其他因素分你之間的線性線管程度的指標(biāo)。0-1之間。
較高(大于0.7),因素內(nèi)部一致性越強(qiáng),因素越穩(wěn)定。
大于1則說明分析結(jié)果要重新考慮
3)、因素解釋的問題:因素載荷超過0.32的變量才考慮作為解釋因素的變量。
超過0.71的載荷特別好,0.63也很好0.55較好,0.45一般。
5、局限性
1、選擇因素的取舍上的雙重困境;2數(shù)據(jù)分布沒有嚴(yán)格要求但會(huì)影響結(jié)果的準(zhǔn)確性