最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

「SPSSAU|數(shù)據(jù)分析」:傾向得分匹配案例分析

2022-07-07 11:05 作者:SPSSAU官方賬號(hào)  | 我要投稿

傾向得分匹配,在醫(yī)學(xué)研究及計(jì)量經(jīng)濟(jì)領(lǐng)域都有廣泛應(yīng)用,其目的在于減少數(shù)據(jù)偏差和混雜因素的干擾。很多統(tǒng)計(jì)軟件都支持PSM,如SPSS和stata。SPSSAU最新版本也提供了傾向得分匹配。下面我們就一起來(lái)了解下,究竟什么是傾向得分匹配?以及如何分析?

PSM解決的是選擇偏差問(wèn)題(即控制混雜因素),傾向得分配比就是利用傾向評(píng)分值,從對(duì)照組中為處理做中的每個(gè)個(gè)體尋找一個(gè)或多個(gè)背景特征相同或相似的個(gè)體作為對(duì)照。這樣就最大程度降低了其他混雜因素的干擾。

比如,想研究‘讀研究生’對(duì)于收入的影響。一種簡(jiǎn)單的做法是直接對(duì)比‘讀過(guò)’和‘沒(méi)有讀過(guò)’這兩類群體的收入差異,但這種做法并不科學(xué)。因?yàn)檫€可能存在其他變量影響著研究結(jié)果,如性別,年齡,父母學(xué)歷,父母是否做教育工作等因素都會(huì)干擾到研究。

因此,PSM正是為了減少這種干擾。PSM可實(shí)現(xiàn)找到類似的兩類人,他們的基本特征都基本一致,主要區(qū)別在于‘是否讀過(guò)’研究生。這樣可減少干擾因素差異帶來(lái)的數(shù)據(jù)偏差和混雜干擾。

案例背景

當(dāng)前有一項(xiàng)‘讀研對(duì)于收入影響’的研究,共收集1000個(gè)研究對(duì)象(樣本)。其中有的研究對(duì)象‘讀研究生’,有的研究對(duì)象‘沒(méi)有讀研究生’,希望研究是否讀過(guò)研究生,對(duì)于年收入的影響情況。其他變量還包括父母學(xué)歷,父母是否從事教育相關(guān)職業(yè)等。

操作步驟

選擇【計(jì)量經(jīng)濟(jì)研究】--【傾向得分匹配】。

【研究變量】:放入主要研究變量。本例中為“是否讀研”

【特征項(xiàng)】:放入其他可能影響結(jié)果的變量。本例中為“父親學(xué)歷”、“母親學(xué)歷”、“父親是否從事教育”、“母親是否從事教育”。

依次將變量放入,點(diǎn)擊開始分析。

  • SPSSAU默認(rèn)使用最鄰近匹配法,進(jìn)行匹配。抽選方法可以選擇不放回抽樣和放回抽樣兩種。

  • 勾選[保存信息],可自動(dòng)保存匹配得分、匹配關(guān)系、匹配成功次數(shù)及匹配ID。

結(jié)果解讀

1 基本信息匯總

從上表可知:本次PSM分析使用最鄰近匹配方式,并且精確匹配優(yōu)先的算法,且使用放回抽樣方法??偣泊ヅ漤?xiàng)(‘讀過(guò)研究生’的樣本數(shù)量)為233個(gè),全部都實(shí)現(xiàn)精確匹配成功,匹配成功率為100%。

此表格僅列出算法的過(guò)程信息等,具體匹配效果應(yīng)以下表格即PSM平行假設(shè)檢驗(yàn)表格為準(zhǔn)。

2 平行假設(shè)檢驗(yàn)

從上表可知:在匹配前,實(shí)驗(yàn)組和控制組(是否讀研兩類群體),他們的父母特征,包括父親是否從事教育,父親學(xué)歷和母親學(xué)歷均有著顯著性差異(p 值 <0.05),也即說(shuō)明是否讀研兩類群體,他們的父母背景特征確實(shí)有著不一致性,父母背景特征屬于干擾因素。

在匹配之后,‘父親是否從事教育’,‘母親是否從事教育’,‘父親學(xué)歷’和‘母親學(xué)歷’這4項(xiàng)干擾因素,在實(shí)驗(yàn)組和控制組兩組間并沒(méi)有呈現(xiàn)出顯著性(p 值>0.05),即說(shuō)明匹配之后,實(shí)驗(yàn)組和控制組在父母背景特征上具有一致性。

同時(shí)針對(duì)標(biāo)準(zhǔn)化偏差值來(lái)看,在匹配之后,該值全部均為0,小于20%,即說(shuō)明匹配之后,‘父親是否從事教育’,‘母親是否從事教育’,‘父親學(xué)歷’和‘母親學(xué)歷’這4項(xiàng)上,實(shí)驗(yàn)組和控制組的特征基本一致。(PS:本案例數(shù)據(jù)較好,因此匹配后標(biāo)準(zhǔn)化偏差完全為0%,實(shí)際研究中可能較少出現(xiàn)此類現(xiàn)象)

針對(duì)‘標(biāo)準(zhǔn)化偏差減少幅度’來(lái)看,該值為100%,也即說(shuō)明PSM匹配后,實(shí)驗(yàn)組和控制組的個(gè)體特征差異性,得到了非常明顯的改善。匹配前,實(shí)驗(yàn)組和控制組在干擾因素之間的平均值差異明顯,但匹配之后,實(shí)驗(yàn)組和控制組在干擾因素之間的平均值差異不明顯。

綜合上述說(shuō)明可知:此次PSM有著良好的效果,PSM匹配后數(shù)據(jù)可用于進(jìn)一步科學(xué)研究使用。

SPSSAU系統(tǒng)返回的weight信息數(shù)據(jù),weight為0表示匹配成功次數(shù)為0,weight大于0說(shuō)明肯定匹配成功(至少匹配成功1次),因此后續(xù)研究時(shí),先篩選出weight大于0,然后再進(jìn)行分析。比如本研究‘是否讀研究生’對(duì)于‘年收入’的差異,因此可先篩選出weight大于0的數(shù)據(jù),然后再進(jìn)行t檢驗(yàn)分析,對(duì)比‘是否讀研究生’兩類群體‘年收入’的差異性。

3 標(biāo)準(zhǔn)化偏差變化對(duì)比圖表

通過(guò)標(biāo)準(zhǔn)化偏差的變化情況,可以了解到每個(gè)干擾因素修正前后的變化情況。

如果標(biāo)準(zhǔn)化偏差變化明顯,則說(shuō)明匹配效果較好。由于圖中處理后的標(biāo)準(zhǔn)化偏差均為0.00%,說(shuō)明匹配會(huì)讓實(shí)驗(yàn)組和對(duì)照組數(shù)據(jù)時(shí)干擾因素特征的不一致得到明顯的改善,意味著匹配效果良好。

其他說(shuō)明

(1)匹配之后如何進(jìn)行后續(xù)研究?

選中‘保存信息’后,SPSSAU系統(tǒng)返回的weight信息數(shù)據(jù),weight為0表示匹配成功次數(shù)為0,weight大于0說(shuō)明肯定匹配成功(至少匹配成功1次),因此后續(xù)研究時(shí),先篩選出weight大于0,然后再進(jìn)行分析。

(2)匹配效果不好怎么辦?

PSM平行假設(shè)檢驗(yàn)用于判斷匹配效果,而且匹配效果是綜合各項(xiàng)指標(biāo)判斷。如果各項(xiàng)指標(biāo)均‘很差’,可以考慮以下幾種做法,分別是:修改匹配方式,修改半徑匹配的閥值,修改抽樣方式,以及更換干擾因素項(xiàng)等,多次嘗試對(duì)比找出最優(yōu)結(jié)果即可。同時(shí),PSM匹配并無(wú)完美的匹配效果,通常綜合各項(xiàng)指標(biāo)分析,在可接受范圍內(nèi)即可。

「SPSSAU|數(shù)據(jù)分析」:傾向得分匹配案例分析的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
天津市| 商丘市| 手游| 湘潭市| 岳阳市| 陇南市| 永昌县| 诏安县| 南昌市| 马边| 米林县| 鄂州市| 潼南县| 瑞金市| 南涧| 若羌县| 扶沟县| 胶州市| 维西| 宁海县| 禄丰县| 融水| 汝州市| 普定县| 喀喇沁旗| 简阳市| 任丘市| 永顺县| 上虞市| 江川县| 金华市| 崇明县| 新蔡县| 赤峰市| 泌阳县| 大余县| 崇州市| 酒泉市| 遂宁市| 哈尔滨市| 虞城县|