最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

傾向得分匹配分析流程

2023-03-02 10:41 作者:SPSSAU官方賬號(hào)  | 我要投稿

傾向得分匹配分析流程如下圖

一、案例介紹與分析

當(dāng)前有一個(gè)公司,想要研究“是否培訓(xùn)”對(duì)于“當(dāng)前工資”的影響。在公司內(nèi)部,共收集到78個(gè)員工的相關(guān)信息,其中有17名員工接受過(guò)培訓(xùn),61名員工未接受培訓(xùn)。最簡(jiǎn)單的分析方法可以使用t檢驗(yàn)或者方差分析研究培訓(xùn)與未培訓(xùn)員工之間的工資差異。

但是當(dāng)前工資會(huì)受到多個(gè)方面的影響,比如“初始工資”、“工作經(jīng)驗(yàn)”、“崗位”都會(huì)影響員工的當(dāng)前工資。因此,傾向得分匹配PSM正是為了減少這種干擾。PSM可以找到相似的兩類人,他們的基本特征(比如初始工資、工作經(jīng)驗(yàn)、崗位)都基本一致,唯一區(qū)別在于“是否培訓(xùn)”,這樣可以減少干擾因素帶來(lái)的分析偏差。

二、匹配理論說(shuō)明

傾向得分匹配模型是由Rosenbaum和Rubin在1983年提出的,首次運(yùn)用在生物醫(yī)藥領(lǐng)域,后來(lái)被廣泛運(yùn)用在藥物治療、計(jì)量研究、政策實(shí)施評(píng)價(jià)等領(lǐng)域。傾向得分匹配模型主要用來(lái)解決非處理因素的偏差。基本原理是:根據(jù)處理組(接受培訓(xùn))的特征,找出與處理組特征盡可能類似的控制組(未接受培訓(xùn))進(jìn)行匹配,從而消除非處理因素(比如初始工資、工作經(jīng)驗(yàn)、崗位)的干擾。

傾向得分匹配算法步驟如下:

1)計(jì)算傾向得分Pscore

構(gòu)建一個(gè)是否接受培訓(xùn)的二分類變量作為因變量,以干擾因素(比如初始工資、工作經(jīng)驗(yàn)、崗位等)作為自變量X進(jìn)行二元logit回歸模型構(gòu)建,然后根據(jù)logit模型計(jì)算傾向得分Pscore值。Pscore值代表了干擾因素的整體水平情況,Pscore值越接近,說(shuō)明兩個(gè)研究對(duì)象(員工)的特征(初始工資等)越接近,第二步進(jìn)行match匹配時(shí),直接針對(duì)Pscore值進(jìn)行。

2)進(jìn)行匹配

根據(jù)計(jì)算的傾向得分Pscore值進(jìn)行處理組(接受培訓(xùn))和控制組(未接受培訓(xùn))的樣本進(jìn)行匹配。SPSSAU會(huì)默認(rèn)對(duì)樣本進(jìn)行編號(hào)(id),進(jìn)行匹配時(shí),針對(duì)研究因素Y= 1(處理組——接受培訓(xùn))的樣本,去找對(duì)應(yīng)Y=0(控制組——未接受培訓(xùn))的匹配對(duì)象。

3PSM效果分析

匹配完成后,需要對(duì)匹配效果進(jìn)行分析,包括分析PSM匹配基本信息、匹配后標(biāo)準(zhǔn)差偏差的變化、平行趨勢(shì)檢驗(yàn)、共同支撐檢驗(yàn)等,后續(xù)將進(jìn)行重點(diǎn)說(shuō)明。

三、匹配操作

SPSSAU進(jìn)行傾向得分匹配操作如下:將“是否培訓(xùn)”放到研究變量分析框中; “初始工資、工作經(jīng)驗(yàn)、崗位”這三個(gè)干擾因素放到特征項(xiàng)分析框中;“當(dāng)前工資”放在結(jié)果變量分析框中。同時(shí)勾選【保存信息】按鈕,SPSSAU會(huì)默認(rèn)輸出id、matchid、weight、Pscore四項(xiàng)信息,id和matchid用于展示員工之間的匹配關(guān)系;weight用于標(biāo)識(shí)匹配成功的次數(shù);Pscore為二元logit回歸模型估計(jì)值。

SPSSAU操作如下圖:

進(jìn)行匹配時(shí),SPSSAU需要選擇匹配方法和抽樣方法。

1)匹配方法選擇

?SPSSAU提供“最近臨法”(默認(rèn))和“半徑匹配法”?!白罱R法”指找到PScore最接近的意思,“半徑匹配”找到PScore在可接受范圍(閥值,卡鉗值)內(nèi),閥值越小匹配越精確。本案例選擇半徑匹配法(0.05)進(jìn)行匹配,如下圖:

2)抽樣方法選擇

SPSSAU提供“放回抽樣”默認(rèn)和“不放回抽樣”兩種抽樣方式。放回抽樣是指某個(gè)樣本會(huì)被重復(fù)匹配多次,不放回抽樣是指樣本最多被匹配1次就截止了。放回抽樣的算法運(yùn)行效率較低,當(dāng)數(shù)據(jù)量非常大時(shí)可能不合適,本例數(shù)據(jù)較少,用兩種抽樣方法都可以,選擇使用不放回抽樣進(jìn)行匹配,如下圖:

以上操作完成之后,點(diǎn)擊【開(kāi)始分析】按鈕,SPSSAU即輸出匹配結(jié)果,接下來(lái)進(jìn)行匹配效果分析。

四、匹配效果分析

傾向得分匹配效果分析包括分析匹配基本信息、匹配后標(biāo)準(zhǔn)化偏差、PSM平行假設(shè)檢驗(yàn)、共同支撐檢驗(yàn)三個(gè)方面。接下來(lái),將逐個(gè)進(jìn)行分析。

(1)匹配基本信息

SPSSAU輸出PSM基本信息匯總表如下:

從上表可知,本次匹配使用半徑匹配法并且精確匹配優(yōu)先(精確匹配是指兩個(gè)樣本的Pscore值完全相等),匹配半徑值為0.05,使用不放回抽樣的方法。需要匹配個(gè)數(shù)(接受培訓(xùn)人數(shù))為17,最終有16人匹配成功,匹配成功率94.118%。

(2)匹配后標(biāo)準(zhǔn)化偏差

標(biāo)準(zhǔn)化偏差對(duì)比圖直觀展示匹配前和匹配后標(biāo)準(zhǔn)化偏差的變化情況,如果標(biāo)準(zhǔn)化偏差變化明顯,則說(shuō)明匹配效果較好。

SPSSAU輸出標(biāo)準(zhǔn)化偏差變化對(duì)比如下:

從上圖來(lái)看,在匹配后,標(biāo)準(zhǔn)化偏差均小于20%,說(shuō)明匹配之后,“初始工資”、“工作經(jīng)驗(yàn)”、“崗位”這3項(xiàng)干擾因素,處理組與控制組特征基本保持一致。說(shuō)明匹配效果較好。

(3)PSM平行假設(shè)檢驗(yàn)

傾向得分匹配模型的一個(gè)假設(shè)是平行假設(shè),即參與匹配的員工必須要各個(gè)維度上與處理組員工相似,這樣才能保證估計(jì)結(jié)果的可靠性。

SPSSAU輸出PSM平行假設(shè)檢驗(yàn)如下表:

從上表可以得到:在匹配前,處理組和控制組(是否培訓(xùn)的兩類員工),他們的特征項(xiàng)包括“初始工資”、“工作時(shí)間”、“崗位”均有顯著性差異(p值均小于0.05),說(shuō)明這3個(gè)特征項(xiàng)均屬于干擾因素。

匹配后,處理組和控制組的3個(gè)特征項(xiàng)之間沒(méi)有呈現(xiàn)出顯著性差異(p值均大于0.05),說(shuō)明經(jīng)過(guò)匹配,處理組與控制組在這3個(gè)特征項(xiàng)上具有一致性。

針對(duì)標(biāo)準(zhǔn)化偏差來(lái)看,匹配后,特征項(xiàng)的標(biāo)準(zhǔn)化偏差全部低于20%,說(shuō)明經(jīng)過(guò)匹配處理組與控制組的3個(gè)特征項(xiàng)基本一致。

標(biāo)準(zhǔn)化偏差減少幅度用于衡量標(biāo)準(zhǔn)化偏差的減少幅度情況,如果該值大于0,說(shuō)明匹配效果好,該值小于0,說(shuō)明匹配效果不好。該值越大越好,沒(méi)有固定標(biāo)準(zhǔn)。從上表來(lái)看,3個(gè)特征項(xiàng)的標(biāo)準(zhǔn)化偏差減少幅度均大于0,說(shuō)明匹配效果好。

綜上所述,在匹配前,處理組和控制組的3個(gè)特征項(xiàng)均存在顯著性差異,但經(jīng)過(guò)匹配后,處理組與控制組在3個(gè)特征項(xiàng)上無(wú)顯著性差異,具有一致性。所以PSM模型通過(guò)平行假設(shè)檢驗(yàn)。

(4)共同支撐檢驗(yàn)

傾向得分匹配的另一個(gè)假設(shè)就是共同支撐假設(shè),即處理組與控制組是否具有相同的傾向得分值。共同支撐檢驗(yàn)可以通過(guò)SPSSAU的核密度圖進(jìn)行檢驗(yàn),檢驗(yàn)原理在于對(duì)比匹配前與匹配后的傾向得分值的分布情況。

①針對(duì)匹配前的Pscore值繪制核密度圖,將“是否培訓(xùn)”放入X分析框中,“初始工資”和“工作經(jīng)驗(yàn)”放入Y分析框中(核密度圖Y只針對(duì)定量數(shù)據(jù),故不分析崗位),SPSSAU操作如下:

得到匹配前初始工資與工作經(jīng)驗(yàn)的核密度圖如下:

從匹配前核密度圖來(lái)看,處理組與控制組的Pscore值分布存在很大差異。如果忽略這種差異的存在(不進(jìn)行匹配,直接進(jìn)行差異分析),很可能導(dǎo)致研究結(jié)論偏誤。同時(shí)看到處理組和控制組存在重疊部分,表明處理組和控制組具備了使用傾向得分匹配模型的條件。

②針對(duì)匹配后Pscore值繪制核密度圖,篩選出匹配次數(shù)weight>0(不放回抽樣也可以選擇weight=1)的數(shù)據(jù)后在進(jìn)行核密度圖繪制。SPSSAU操作如下:

再次進(jìn)行分析,得到匹配后核密度圖如下:

從匹配后的核密度圖看,經(jīng)過(guò)匹配,處理組和控制組之間出現(xiàn)了顯著的靠近與覆蓋,存在較大的共同取值區(qū)間,表明兩組樣本在各方面特征已經(jīng)非常接近,匹配效果較好,即說(shuō)明通過(guò)共同支撐檢驗(yàn)。

綜上所述,本次傾向得分匹配效果較好,接下來(lái)進(jìn)行研究結(jié)論分析,本案例的目的在于研究“是否培訓(xùn)”是否會(huì)對(duì)“當(dāng)前工資”產(chǎn)生顯著影響。

五、得出結(jié)論

經(jīng)過(guò)匹配后,研究“是否培訓(xùn)”是否會(huì)對(duì)“當(dāng)前工資”產(chǎn)生顯著影響可以使用t檢驗(yàn)進(jìn)行分析,但是SPSSAU在傾向得分匹配中可以做到“一步到位”,無(wú)需單獨(dú)進(jìn)行t檢驗(yàn),在此前將“當(dāng)前工資”放入【結(jié)果變量】中,就是為了直接獲得分析結(jié)果。

SPSSAU輸出結(jié)果為ATT效應(yīng)分析,結(jié)果如下表:

ATT效應(yīng)分析的目的在于分析匹配后結(jié)果變量在處理組和控制組之間是否有顯著性差異。在本例中,即分析匹配后“是否培訓(xùn)”的兩類人“當(dāng)前工資”是否有顯著差異?!癠nmatched匹配前”即第1行數(shù)據(jù)是指在匹配之前,“研究變量”與“結(jié)果變量”之間是否存在著差異性,其意義較小;主要看第二行數(shù)據(jù)ATT效應(yīng)。

從上表可以看出,在匹配前,是否培訓(xùn)與當(dāng)前工資之間呈現(xiàn)性差異(p<0.05)。以及在匹配之后,ATT效應(yīng)值呈現(xiàn)出顯著性(p<0.05) ,即說(shuō)明進(jìn)行PSM分析后顯示是否培訓(xùn)與當(dāng)前工資之間呈現(xiàn)出顯著性差異,ATT效應(yīng)值為17554.412,即意味著是否培訓(xùn)與當(dāng)前工資起到正向作用。

傾向得分匹配分析流程的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
常熟市| 莲花县| 伊川县| 呼和浩特市| 河源市| 烟台市| 扬州市| 饶河县| 微博| 小金县| 商城县| 肥东县| 凉城县| 夏河县| 台江县| 福清市| 阿拉善右旗| 鹤峰县| 通辽市| 若尔盖县| 上犹县| 陆川县| 象山县| 永仁县| 乐清市| 新建县| 民乐县| 马鞍山市| 寿光市| 青海省| 岗巴县| 分宜县| 阿图什市| 茌平县| 宜宾县| 秀山| 宝应县| 昆山市| 郧西县| 宜川县| 汉沽区|