最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

拓端tecdat|R語言結(jié)構(gòu)方程SEM中的power analysis 效能檢驗(yàn)分析

2021-08-05 10:55 作者:拓端tecdat  | 我要投稿

原文鏈接:http://tecdat.cn/?p=23085?

原文出處:拓端數(shù)據(jù)部落公眾號

簡介

本文對結(jié)構(gòu)方程模型進(jìn)行效能分析。

本文從一些簡單的例子開始。其余部分提供了一些關(guān)于統(tǒng)計背景的說明,各種效應(yīng)大小的定義,以及本包所含函數(shù)的詳細(xì)描述。

背景介紹

數(shù)學(xué)模型的統(tǒng)計評價通常是通過考慮測試統(tǒng)計量來進(jìn)行的,測試統(tǒng)計量表示觀察數(shù)據(jù)和擬合模型的數(shù)據(jù)之間的差異。在SEM中,大小為N的樣本的相關(guān)測試統(tǒng)計量由T = F?(N - 1)給出。F?表示所選差異函數(shù)(如最大似然)的最小化樣本值,從而表明模型與樣本數(shù)據(jù)的不匹配。因此,T允許對模型正確的無效假設(shè)(H0)進(jìn)行似然比檢驗(yàn)。如果假設(shè)的模型在總體中成立,可以證明T在漸進(jìn)上遵循中心χ 2(df)分布,df=.5-p(p+1)-q自由度,其中p是表現(xiàn)變量的數(shù)量,q表示自由參數(shù)的數(shù)量。這就是為什么T經(jīng)常被稱為 "卡方模型檢驗(yàn)統(tǒng)計量"。

給出一個卡方檢驗(yàn)統(tǒng)計量的觀察值,可以進(jìn)行一個無效假設(shè)的顯著性檢驗(yàn)。通常的檢驗(yàn)過程如下。給定一個特定的α-誤差水平(通常是α=0.05),從漸近中心χ 2(df)分布中得到一個臨界卡方值。如果卡方檢驗(yàn)統(tǒng)計量的觀察值超過臨界值,則拒絕模型符合數(shù)據(jù)的無效假設(shè)。否則,H0被保留。發(fā)現(xiàn)觀察統(tǒng)計量超過臨界值(意味著上尾概率低于指定的α水平),就會導(dǎo)致統(tǒng)計學(xué)上的判斷,即假設(shè)和實(shí)際人口協(xié)方差矩陣之間的差異太大,不能僅僅歸因于抽樣誤差。因此,具有統(tǒng)計學(xué)意義的卡方檢驗(yàn)統(tǒng)計數(shù)字提供了反對假設(shè)模型有效性的證據(jù)。

當(dāng)使用這個框架測試統(tǒng)計假設(shè)時,會出現(xiàn)兩種類型的錯誤。不正確地拒絕一個真正的H0(一個正確的模型)的α錯誤(或I型錯誤)和不正確地保留一個錯誤的H0(一個錯誤的模型)的β錯誤(或II型錯誤)。

如果H0為假,則卡方檢驗(yàn)統(tǒng)計量不再是中心χ 2(df)分布,而是可以證明遵循非中心χ 2(df,λ)分布,具有非中心性參數(shù)λ和期望值df + λ(MacCallum, Browne, & Sugawara, 1996)。非中心性參數(shù)λ將非中心χ 2(df,λ)分布的期望值移到相應(yīng)中心分布的右邊。在確定了與中心χ 2(df)分布的期望α概率相關(guān)的臨界值之后,可以通過構(gòu)建具有一定非中心性參數(shù)λ的相應(yīng)非中心χ 2(df,λ)分布并獲得該分布向右的面積(即。相應(yīng)地,統(tǒng)計效能是非中心χ 2(df,λ)分布在臨界值右邊的面積(即積分)。一般情況如圖1所示。

圖1描述了中心(實(shí)線)χ 2(df)和非中心(虛線)χ 2(df,λ)分布,df=200,λ=100。中心分布χ 2(df)在臨界值右側(cè)的面積反映了α誤差。實(shí)線表示臨界值為234,對應(yīng)于α=0.05。虛線表示從折衷效能分析中得到的臨界值為244,與α=0.018有關(guān)。臨界值左邊的χ 2(df,λ)分布區(qū)域是β-錯誤概率(臨界值234和244的β=0.006和β=0.018)。統(tǒng)計效能定義為1-β,即臨界值右邊的非中心χ 2(df,λ)分布下的面積。

衡量標(biāo)準(zhǔn)

為了定義H0和H1模型之間的差異,可以使用任何基于非中心性的效果測量。

F0

F0是最大似然擬合函數(shù)的總體最小值,定義為

其中Σ是p總體協(xié)方差矩陣,Σ?是p模型隱含的協(xié)方差矩陣,p是觀測變量的數(shù)量。如果模型是正確的,Σ?=Σ,F(xiàn)0=0。否則,F(xiàn)0>0,數(shù)值越大,表示模型與數(shù)據(jù)的差異越大(不匹配)。?

RMSEA

近似根均方誤差(RMSEA;Browne & Cudeck, 1992;Steiger & Lind, 1980)通過模型的自由度來衡量F0。

使RMSEA以零為界,較低的值表示較好的擬合。隱含的F0是:?

用RMSEA來定義一個效應(yīng)需要說明自由度。

Mc

Mc(McDonald,1989)是F0在0-1區(qū)間上的變換,數(shù)值越大表示越適合。

GFI

擬合指數(shù)(GFI;J?reskog & S?rbom, 1984;Steiger, 1990)在0-1的區(qū)間內(nèi)對F0進(jìn)行標(biāo)度,數(shù)值越高表示擬合度越好。?

由于GFI取決于觀察變量的數(shù)量(p),在用GFI定義效能時需要提供這個數(shù)字。

AGFI

調(diào)整后的擬合指數(shù)(AGFI;J?reskog & S?rbom,1984;Steiger,1990)對GFI進(jìn)行了修改,包括對自由參數(shù)數(shù)量的懲罰,由模型的自由度來衡量。

用AGFI來說明效果,需要同時說明觀察變量的數(shù)量(p)和模型的自由度(df)。

不基于非中心性的方法

不基于非中心性的擬合指數(shù)與F0沒有直接的關(guān)系,因此不太適合于效能分析。但是,如果通過H0和H1協(xié)方差矩陣來定義效應(yīng),至少可以計算出度量。

SRMR

標(biāo)準(zhǔn)化根-均方殘差(SRMR)是對(標(biāo)準(zhǔn)化)模型和總體協(xié)方差矩陣之間平均(平方)差值的衡量,因此它的范圍是0到1,數(shù)值越小表示擬合度越高。設(shè)E0為模型隱含與人群協(xié)方差矩陣之間的差值,E0=Σ-Σ?,vech表示矢量化變換,Q為維度為.5p(p+1)的對角矩陣,包含觀測變量i和j的標(biāo)準(zhǔn)差的乘積的逆值,那么,SRMR可以定義為

殘差矩陣E0與F0的關(guān)系很復(fù)雜,取決于模型隱含的協(xié)方差矩陣,所以SRMR不太適合用F0來定義效應(yīng)(基于ML估計)。

CFI

比較擬合指數(shù)(CFI)是一個增量指數(shù),表示假設(shè)模型(F0H)相對于空模型(F0N)的不合適比例減少,空模型被定義為一個將所有協(xié)方差約束為零的模型。在總體中,CFI的范圍是0到1,數(shù)值越高表示越適合。

雖然從CFI獲得F0很簡單,但這需要知道F0N,而這是很難先驗(yàn)確定的。

Power Analysis效能分析

進(jìn)行效能分析時,一般需要說明要檢測的效應(yīng)的量度和大小,并提供模型的自由度。根據(jù)效能分析的類型,還需要進(jìn)一步的論據(jù)。本節(jié)假設(shè)效應(yīng)是以上述方法之一來指定的,如何借助模型隱含的和總體協(xié)方差矩陣來定義效應(yīng)。

A-Priori:確定所需的N,給定α、β、效應(yīng)和df

先驗(yàn)效能分析的目的是在給定的α誤差下,確定檢測一個效應(yīng)所需的樣本量。在結(jié)構(gòu)方程模型的語言中,先驗(yàn)?zāi)芰Ψ治鰡柕氖牵?#34;我需要多少個觀測值才能達(dá)到效果?如果我的模型實(shí)際上是錯誤的(在所選效應(yīng)定義的范圍內(nèi)),我需要多少個觀測值才能以X%的概率(力量)來證偽我的模型?

進(jìn)行先驗(yàn)的效能分析需要指定α誤差、所需的效能(或者,等同于可接受的β誤差)、效應(yīng)的類型和大小以及模型df。根據(jù)所選擇的效應(yīng)大小指標(biāo),可能還需要定義觀察變量的數(shù)量。?

假設(shè),我們想要檢測一個模型(涉及df=100個自由度)的錯誤說明所需的樣本量,在α誤差為0.05的情況下,效能為80%,其中失擬量對應(yīng)于RMSEA=0.05。將結(jié)果存儲在一個名為ap1的列表中。?

  1. effect = .05, effect.measure = 'RMSEA',

  2. alpha = .05, power = .80, df = 100


在ap1上調(diào)用總結(jié)方法,輸出結(jié)果和相關(guān)的中心和非中心卡方分布圖?


這表明N=164產(chǎn)生了大約80%的效能來檢測指定的效果。輸出結(jié)果進(jìn)一步顯示了臨界Chi-Square,非中心性參數(shù)(NCP),以及錯誤概率之間的比率(隱含Alpha/Beta比率)。在這個例子中,阿爾法和貝塔之間的比率是0.25,表明犯Beta錯誤的可能性是犯Alpha錯誤的四倍。這顯然是所選輸入?yún)?shù)的結(jié)果,因?yàn)?.80的效能(1-β)意味著0.20的β誤差,是所選0.05的α誤差的四倍。?

  1. effect = .05, effect.measure = 'RMSEA',

  2. alpha = .05, power = .80


現(xiàn)在我們也得到了RMSEA=0.05的GFI和AGFI等效值,假設(shè)df=100,p=20。當(dāng)然也可以不指定所需的效能,而是指定可接受的β誤差。例如,調(diào)用?

  1. effect.measure = 'RMSEA',

  2. alpha = .05, beta = .20, df = 100, p = 20

?

給出了與上述相同的輸出。如果你對一定范圍內(nèi)的樣本量的效能變化感興趣,要求提供效能圖是很有用的,下面會詳細(xì)說明。
?

事后分析Post-hoc:給定α、N、效應(yīng)和df,確定達(dá)到的效能

事后效能分析的目的是確定在給定的樣本量下,在一定的α誤差下檢測特定效應(yīng)的實(shí)際達(dá)到的效能。用結(jié)構(gòu)方程模型的語言來說,事后效能分析問的是:"在我手頭的樣本中,有多大?在我手頭的樣本中,如果我的模型確實(shí)是錯誤的(至少在所選效應(yīng)定義的范圍內(nèi)),那么偽造我的模型的概率(力量)有多大?進(jìn)行事后效能分析需要明確阿爾法誤差、樣本量、效應(yīng)的類型和大小以及模型df。同樣,根據(jù)所選擇的效應(yīng)大小指標(biāo),可能還需要定義觀察變量的數(shù)量。假設(shè),我們希望在樣本量為N=1000的情況下達(dá)到的效能能夠檢測到模型(涉及df=100自由度)的錯誤,α誤差為0.05,其中錯誤擬合量對應(yīng)于RMSEA=0.05。我們將結(jié)果存儲在一個名為ph1的列表中。

  1. posthoc(effect = .05, effect.measure = 'RMSEA',

  2. alpha = .05, N = 1000


在ph1上調(diào)用總結(jié)方法,顯示效能非常高(效能>.9999)。相關(guān)的誤差概率是以更高的精度提供的。具體來說,β誤差為β=2.903302e-17,轉(zhuǎn)化為2.9-10-17=0.000000000000000029。在實(shí)踐中,在這些條件下,一個RMSEA>=.05(或F0>=0.25或Mc<=.882)的模型很不錯。隱含的α/β比率是1.722177e+15,表明犯α錯誤的可能性是犯β錯誤的2萬億(1015)倍。如果你對一系列不同程度的效果(例如,對于RMSEA從0.01到0.15)的效能變化感興趣,要求提供效能圖是很有用的,下面會詳細(xì)說明。

折衷效能分析:給定α/β比率、N、效應(yīng)和df,確定α和β

折衷效能分析的目的是在給定的效應(yīng)、一定的樣本量以及期望的α和β比率的情況下,確定α和β(以及相關(guān)的卡方檢驗(yàn)統(tǒng)計量的臨界值)(Moshagen & Erdfelder, 2016)。用結(jié)構(gòu)方程模型的語言來說,折衷分析問的是:"在我手頭的樣本中,應(yīng)該如何處理?在我手頭的樣本中,我應(yīng)該如何選擇卡方模型檢驗(yàn)的臨界值,來決定我的模型是與完全擬合的假設(shè)相一致時獲得相應(yīng)的α和β誤差?

假設(shè),我們想確定臨界卡方和相關(guān)的α和β誤差,使它們相等(即比率為1)。我們的模型涉及100個df,我們的樣本量為N=1000,我們將不可接受的不合適H1模型定義為RMSEA至少為0.08的模型。將結(jié)果存儲在一個名為cp1的列表中。

  1. compromise(effect = .08, effect.measure = 'RMSEA',

  2. N = 1000, df = 100)


結(jié)果顯示,選擇臨界Chi-Square=312與平衡錯誤概率有關(guān),α=1.2e-23和β=1.2e-23。按照要求,這兩個錯誤概率都一樣大。如果出于某種原因,你希望錯誤概率不同(例如,因?yàn)槟阏J(rèn)為錯誤地接受一個不正確的模型比錯誤地拒絕一個正確的模型要差100倍),你可以改變abratio參數(shù)。例如,要求α誤差是β誤差的100倍,可以通過設(shè)置 abratio = 100 來實(shí)現(xiàn)。?

  1. compromise(effect = .08, effect.measure = 'RMSEA',

  2. abratio = 100, N = 1000, df = 100)


Power Plots效能圖

效能圖顯示了隱含的效能與其他一些變量的關(guān)系。你可以繪制在不同樣本量范圍內(nèi)檢測某一效應(yīng)的實(shí)現(xiàn)效能?;蛘撸憧梢栽诮o定的N下繪制達(dá)到的效能,以檢測不同效應(yīng)大小的范圍。

確定給定效應(yīng)的效能是N的函數(shù)

創(chuàng)建了一個圖,顯示了在一定的樣本量范圍內(nèi)檢測一個給定的效應(yīng)的達(dá)到的效能。然而,由于很難指定給定效應(yīng)的診斷樣本量,我們需要提供所需的效能范圍。例如,假設(shè)我們對檢測RMSEA=.05的效應(yīng)的效能如何隨N的變化而變化感興趣,我們對從.05到.99的效能感興趣(注意效能不能小于α)??梢酝ㄟ^設(shè)置參數(shù)power.min = .05和power.max = .99來實(shí)現(xiàn)。此外,與任何先驗(yàn)的效能分析一樣,需要定義效應(yīng)的類型和大小、df和α誤差。

powerPlot

這表明,當(dāng)N>250時,一個相關(guān)的RMSEA=0.05的模型被拒絕的效能非常大,而當(dāng)N<100時,效能就很小。

在給定的N下,確定效能與效應(yīng)大小的函數(shù)關(guān)系

創(chuàng)建了一個圖,顯示在給定的樣本量下,在效應(yīng)大小范圍內(nèi)達(dá)到的效能。例如,假設(shè)我們對N=500時的效能如何隨效應(yīng)大小的變化而變化感興趣,對應(yīng)的RMSEA范圍是0.001到0.10。此外,與任何事后效能分析一樣,需要定義樣本量、df和α誤差。

PlotEffect

這表明,在N=500的情況下,一個相關(guān)的RMSEA>0.04的模型被檢測到的效能非常大,而RMSEA<0.03的效能則相當(dāng)小。

參考文獻(xiàn)

? Browne, M. W., & Cudeck, R. (1992). Alternative ways of assessing model fit. Sociological Methods & Research, 21, 230–258.

? J?reskog, K. G., & S?rbom, D. (1984). LISREL VI user’s guide (3rd ed.). Mooresville: Scientific Software.

最受歡迎的見解

1.Matlab馬爾可夫鏈蒙特卡羅法(MCMC)估計隨機(jī)波動率(SV,Stochastic Volatility) 模型

2.基于R語言的疾病制圖中自適應(yīng)核密度估計的閾值選擇方法

3.WinBUGS對多元隨機(jī)波動率模型:貝葉斯估計與模型比較

4.R語言回歸中的hosmer-lemeshow擬合優(yōu)度檢驗(yàn)

5.matlab實(shí)現(xiàn)MCMC的馬爾可夫切換ARMA – GARCH模型估計

6.R語言區(qū)間數(shù)據(jù)回歸分析

7.R語言WALD檢驗(yàn) VS 似然比檢驗(yàn)

8.python用線性回歸預(yù)測股票價格

9.R語言如何在生存分析與Cox回歸中計算IDI,NRI指標(biāo)


拓端tecdat|R語言結(jié)構(gòu)方程SEM中的power analysis 效能檢驗(yàn)分析的評論 (共 條)

分享到微博請遵守國家法律
唐海县| 万宁市| 胶南市| 滦平县| 彰武县| 综艺| 曲靖市| 葫芦岛市| 馆陶县| 中江县| 惠东县| 张家界市| 嫩江县| 涞水县| 定日县| 泸溪县| 海安县| 洛南县| 宜春市| 灵丘县| 黔江区| 凌源市| 大渡口区| 交口县| 合川市| 奇台县| 桂阳县| 嘉义市| 玉环县| 渭南市| 南昌市| 锦屏县| 山西省| 临澧县| 许昌市| 喜德县| 财经| 延吉市| 三原县| 阜城县| 磴口县|