手把手教你用SPSSAU做傾向得分匹配PSM
目錄
1.案例背景與分析策略 2
1.1 案例背景介紹 2
1.2 明確目的與分析策略 2
2.協(xié)變量選擇與基線分析 3
2.1 匹配前連續(xù)型特征項(xiàng)差異檢驗(yàn) 3
2.2 匹配前分類型特征項(xiàng)差異檢驗(yàn) 4
2.3 特征項(xiàng)選擇 5
3.傾向得分匹配 5
3.1 匹配算法選擇 5
3.2 SPSSAU具體操作 5
4.傾向評(píng)分匹配結(jié)果解讀 6
4.1 匹配概況 6
4.2 均衡性評(píng)價(jià) 7
5.效果分析 10
6.總結(jié) 11
傾向得分匹配(PSM),是一種模仿RCT隨機(jī)對(duì)照試驗(yàn)隨機(jī)化分組,提高組間均衡性,進(jìn)而達(dá)到降低混雜因素影響目的一種數(shù)據(jù)處理策略。PSM在計(jì)量研究,臨床醫(yī)學(xué)等領(lǐng)域有著廣泛的應(yīng)用。
1.案例背景與分析策略
1.1 案例背景介紹
某企業(yè)想評(píng)價(jià)專項(xiàng)培訓(xùn)的效果,現(xiàn)收集到78位員工的個(gè)人及工作成績(jī)信息,包括性別、年齡、教育年、初始工作成績(jī)與當(dāng)前工作成績(jī)、工作經(jīng)驗(yàn)、工作時(shí)間、職位類別、是否參加培訓(xùn)等數(shù)據(jù)。
數(shù)據(jù)上傳SPSSAU后,在 “我的數(shù)據(jù)”中查看瀏覽原始數(shù)據(jù),前5行數(shù)據(jù)如下:
圖1 “我的數(shù)據(jù)”查看瀏覽數(shù)據(jù)集
1.2 明確目的與分析策略
已經(jīng)參加過(guò)培訓(xùn)的有17人,其余61人沒有參加過(guò)培訓(xùn)。研究培訓(xùn)的效果,我們似乎可以直接比較兩組員工的工作成績(jī)有無(wú)差異。
考慮到性別、年齡、工作經(jīng)驗(yàn)、參加工作時(shí)間等本身會(huì)影響工作成績(jī),當(dāng)兩組人群不在一個(gè)起跑線起跑時(shí),如果貿(mào)然直接對(duì)比當(dāng)前工作成績(jī)的差異,可能受到其他因素的干擾。
因此,我們應(yīng)該尋找一批和參加培訓(xùn)員工基本情況類似,各關(guān)鍵指標(biāo)特征接近的、未參加過(guò)培訓(xùn)的員工組成對(duì)照/控制組,然后進(jìn)行組間差異的對(duì)比,從而判斷培訓(xùn)效果。
傾向評(píng)分匹配,正是這樣一種可以匹配對(duì)照,讓處理組和對(duì)照組達(dá)到均衡的數(shù)據(jù)處理手段。SPSSAU在“計(jì)量經(jīng)濟(jì)研究”欄目下提供了【傾向得分匹配】功能。
完成匹配后,以當(dāng)前工作成績(jī)數(shù)據(jù)作為結(jié)果變量,是否培訓(xùn)為分組數(shù)據(jù)來(lái)探討培訓(xùn)效果。
2.協(xié)變量選擇與基線分析
傾向評(píng)分匹配PSM,首先需要構(gòu)造PS評(píng)分概率數(shù)據(jù),然后利用PS數(shù)據(jù)按某種匹配算法從所有待選的對(duì)照樣本中選擇合適對(duì)象完成匹配過(guò)程。
SPSSAU默認(rèn)采用logistic回歸模型構(gòu)造PS數(shù)據(jù),而用戶則需要指定哪些數(shù)據(jù)作為協(xié)變量參與logistic回歸計(jì)算PS值。
協(xié)變量的選擇不是隨意的,具體選擇依據(jù)目前有多種觀點(diǎn)。一般來(lái)說(shuō),協(xié)變量會(huì)影響結(jié)果變量,而且在干預(yù)組、對(duì)照組上也存在差異。當(dāng)然專業(yè)知識(shí)、既往研究結(jié)論也可作為參考。
SPSSAU中協(xié)變量表述為特征項(xiàng),本案例后面對(duì)協(xié)變量的描述統(tǒng)一采用特征項(xiàng)。
2.1 匹配前連續(xù)型特征項(xiàng)差異檢驗(yàn)
已收集的特征項(xiàng)中,年齡、教育年、初始工作成績(jī)、工作經(jīng)驗(yàn)、工作時(shí)間,這5個(gè)為連續(xù)型數(shù)據(jù)。我們先考察培訓(xùn)組、未培訓(xùn)組在這些數(shù)據(jù)上是否基線無(wú)差異。
在SPSSAU“通用方法”欄目中執(zhí)行【t檢驗(yàn)】。結(jié)果如下:
圖2 匹配前連續(xù)型數(shù)據(jù)t檢驗(yàn)
由上表結(jié)果可知,兩組員工在初始工作成績(jī)、工作經(jīng)驗(yàn)上存在統(tǒng)計(jì)學(xué)差異(均P值<0.05)。而在年齡、教育年、工作時(shí)間上無(wú)差異。
2.2 匹配前分類型特征項(xiàng)差異檢驗(yàn)
同理,對(duì)性別、職位類別兩個(gè)分類數(shù)據(jù),做交叉表卡方檢驗(yàn),以考察匹配前兩組員工在二者的分布差異。
在SPSSAU“通用方法”欄目中執(zhí)行【交叉/卡方】。結(jié)果如下:
圖3 匹配前分類型數(shù)據(jù)交叉表卡方檢驗(yàn)
由上表結(jié)果可知,兩組員工在職位類別的分布上存在統(tǒng)計(jì)學(xué)差異(P值<0.05),而性別分布上無(wú)差異。
2.3 特征項(xiàng)/協(xié)變量選擇
綜合基線分析、專業(yè)認(rèn)知、既往研究結(jié)論,本案例擬將初始工作成績(jī)、工作經(jīng)驗(yàn)、職位類別共3個(gè)指標(biāo)認(rèn)定為本次PSM的特征項(xiàng)(協(xié)變量)。
以此3個(gè)特征項(xiàng),通過(guò)logistic回歸構(gòu)造PS數(shù)據(jù),從而實(shí)現(xiàn)匹配。
3.傾向得分匹配
3.1 匹配算法選擇
傾向評(píng)分匹配算法有很多種,較常用的是最近鄰匹配。SPSSAU提供了兩種匹配算法,分別是最近鄰匹配和半徑匹配。前者是指PS值距離最近的進(jìn)行匹配,后者需先指定卡鉗值,在卡鉗值范圍內(nèi)進(jìn)行匹配。
原則上兩種算法的匹配結(jié)論大致一樣,可以根據(jù)匹配均衡性來(lái)選擇,本例選擇半徑匹配??ㄣQ值采用多次遍歷的形式,最終確定為0.05。具體理由文末有總結(jié)說(shuō)明。
3.2 SPSSAU具體操作
在SPSSAU“計(jì)量經(jīng)濟(jì)研究”欄目下選擇【傾向得分匹配】,首先將“是否培訓(xùn)”拖拽至【研究變量】框內(nèi),它將作為logistic回歸的二結(jié)局因變量,特別注意水平編碼,要求是1表示處理組,0表示對(duì)照組。
“初始成績(jī)”、“工作經(jīng)驗(yàn)”、“職位類別”拖拽至【特征項(xiàng)】框。
圖4 SPSSAU傾向評(píng)分匹配具體操作
同時(shí),本例建議將結(jié)果變量“當(dāng)前成績(jī)”拖拽至【結(jié)果變量】框。此操作展現(xiàn)了SPSSAU的特有優(yōu)勢(shì),可以幫我們一步到位,既實(shí)現(xiàn)匹配,同時(shí)也完成匹配后數(shù)據(jù)的效果分析。
匹配算法選擇半徑匹配,卡鉗值0.05。為方便理解,采用不放回策略。同時(shí)勾選【保存信息】,即要求輸出匹配指示數(shù)據(jù)。具體操作見圖4,最后點(diǎn)擊“開始分析”即可。
4.傾向評(píng)分匹配結(jié)果解讀
4.1 匹配概況
參加培訓(xùn)員工17人,因此需要匹配個(gè)數(shù)為17。采用卡鉗值0.05的半徑匹配后,匹配成功16人,SPSSAU此時(shí)進(jìn)行的是1:1匹配,因此匹配后的數(shù)據(jù)總?cè)藬?shù)為32人。
通俗講,匹配算法從未參加培訓(xùn)的61人中尋找到16人一一匹配給參加過(guò)培訓(xùn)的員工。
圖5 PSM匹配概括
4.2 均衡性評(píng)價(jià)
匹配后,一定要進(jìn)行均衡性、或平衡性評(píng)價(jià),滿足均衡條件后才表示匹配成功,如果均衡性不達(dá)標(biāo),應(yīng)當(dāng)返回重新進(jìn)行匹配,直到滿意為止。
在SPSSAU中,至少可以完成四項(xiàng)平衡性評(píng)價(jià),本案例選擇其中三項(xiàng)進(jìn)行重點(diǎn)解讀。
首先來(lái)看第一項(xiàng):標(biāo)準(zhǔn)化偏差變化條形圖
圖6標(biāo)準(zhǔn)化偏差變化條形圖
一般匹配后“標(biāo)準(zhǔn)化偏差”絕對(duì)值小于20%,則匹配效果較好。本例中,初始成績(jī)、工作經(jīng)驗(yàn)、職位類別匹配前的標(biāo)準(zhǔn)化偏差均在55%以上,匹配后,標(biāo)準(zhǔn)化偏差均低于20%,表明匹配后兩組人群在這三個(gè)特征項(xiàng)上達(dá)到均衡。
第二項(xiàng):核密度圖
SPSSAU【傾向評(píng)分匹配】并未直接提供該圖形,需要我們自己根據(jù)另存到原始數(shù)據(jù)中的匹配指示變量進(jìn)行繪制。
新增的匹配指示變量中,Weight變量大于0,即匹配成功次數(shù)大于0,表明該樣本為匹配成功的有效樣本。
在SPSSAU的“可視化”欄目下,選擇【核密度圖】,打開【篩選樣本】,輸入條件:Weight > 0 ,這樣做從數(shù)據(jù)集中篩選出匹配成功的32人數(shù)據(jù),用于繪圖。
圖7 核密度前篩選匹配成功樣本
“是否培訓(xùn)”拖拽至【定類X】框,其他特征項(xiàng)或其他變量可拖入【定類Y】框。
限于篇幅,本案例只展示“初始成績(jī)”特征的匹配后核密度圖。由圖可見,匹配后兩組密度曲線十分相似,能滿足均衡要求。
圖8 匹配后初始工作成績(jī)核密度圖
第三項(xiàng):匹配后基線分析
匹配前我們已經(jīng)討論過(guò)基線比較,匹配后也可以繼續(xù)做基線分析,以判斷匹配后兩組數(shù)據(jù)在各特征項(xiàng)上有無(wú)差異。
連續(xù)型特征項(xiàng)用t檢驗(yàn),類別性特征項(xiàng)用卡方檢驗(yàn),我們直接看結(jié)果(t檢驗(yàn)、卡方檢驗(yàn)匯總后):
圖9 匹配后特征項(xiàng)基線分析
如上表所示,匹配后,兩組人群在初始成績(jī)、工作經(jīng)驗(yàn)、職位類別上差異無(wú)統(tǒng)計(jì)學(xué)意義(均P值>0.05)。即,匹配后基線特征由有差異趨于一致、均衡。
綜合以上三項(xiàng)結(jié)果,本例認(rèn)為匹配后培訓(xùn)組、未培訓(xùn)組兩組在特征上達(dá)到均衡,匹配效果良好。
5.效果分析
我們已經(jīng)為17人的培訓(xùn)組,匹配到了一批特征類似,基線一致的對(duì)照(未培訓(xùn)組)。
本例的分析目的是考察培訓(xùn)的效果,結(jié)果變量“當(dāng)前工作成績(jī)”為連續(xù)型數(shù)據(jù),因此執(zhí)行t檢驗(yàn)即可評(píng)價(jià)培訓(xùn)的效果。
但是我們并不需要去單獨(dú)做t檢驗(yàn),因?yàn)镾PSSAU在【傾向評(píng)分匹配】中包含了這一項(xiàng)重要工作。我們此前將當(dāng)前成績(jī)移入【結(jié)果變量】框,就是為了直截了當(dāng)獲得該項(xiàng)結(jié)果。
在SPSSAU中,這項(xiàng)工作稱之為ATT效應(yīng)分析。本例的結(jié)果:
圖10 匹配后ATT效應(yīng)分析
“Unmatched匹配前”第1行數(shù)據(jù)是指在匹配之前,兩組的當(dāng)前工作成績(jī)有統(tǒng)計(jì)學(xué)差異。
“ATT效應(yīng)”第2行數(shù)據(jù)是指在匹配之后,兩組的當(dāng)前工作成績(jī)存在顯著差異(P值<0.05)。
說(shuō)明在控制了干擾因素后,我們認(rèn)為培訓(xùn)是有效果的。
6.總結(jié)
本例采用半徑匹配算法,卡鉗值多少合適呢?原則上并沒有嚴(yán)格的規(guī)定或標(biāo)準(zhǔn)。
可以通過(guò)多次遍歷的形式,比如第一次執(zhí)行卡鉗值0.3,然后評(píng)估匹配后平衡性及樣本損失是否滿足要求;如果不平衡,則返回調(diào)低卡鉗值到0.1(或其他值)再進(jìn)行同樣操作,若仍不平衡,繼續(xù)返回拉低卡鉗值,比如0.05,或0.02,直至組間滿足平衡要求,而且樣本損失也在可接受水平。本例最終設(shè)定卡鉗值為0.05。
最近鄰算法在沒有卡鉗值限定時(shí),處理組樣本通常會(huì)全部匹配成功,讀者可以自行實(shí)踐。