最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

拓端tecdat|R語言生態(tài)學(xué)模擬對廣義線性混合模型GLMM進(jìn)行功率(功效、效能、效力)分析

2022-01-29 14:01 作者:拓端tecdat  | 我要投稿

原文鏈接:http://tecdat.cn/?p=24861?

原文出處:拓端數(shù)據(jù)部落公眾號

概括

  1. r 語言允許用戶計算 lme 4 包中廣義線性混合模型的功效。功率計算基于蒙特卡羅模擬。

  2. 它包括用于 (i) 對給定模型和設(shè)計進(jìn)行功效分析的工具;(ii) 計算功效曲線以評估功效和樣本量之間的權(quán)衡。

  3. 本文提供了一個教程,使用具有混合效果的計數(shù)數(shù)據(jù)的簡單示例(具有代表環(huán)境監(jiān)測數(shù)據(jù)的結(jié)構(gòu))。

介紹

假設(shè)檢驗的功效定義為假設(shè)原假設(shè)為假,檢驗拒絕原假設(shè)的概率。換句話說,如果一個效應(yīng)是真實的,那么分析判斷該效應(yīng)具有統(tǒng)計顯著性的概率是多少?

如果一項研究的功效不足,資源可能被浪費,真正的效果可能被遺漏。另一方面,一項大型研究的花費可能過大,因此其費用也會超過必要的范圍。因此,在收集數(shù)據(jù)之前進(jìn)行功效分析是一個很好的做法,以確保樣本具有適當(dāng)?shù)囊?guī)模來回答正在考慮的任何研究問題。

廣義線性混合模型 (GLMM) 在生態(tài)學(xué)中很重要,它允許分析計數(shù)和比例以及連續(xù)數(shù)據(jù),并控制空間非獨立性.

蒙特卡羅模擬是一種靈活且準(zhǔn)確的方法,適用于現(xiàn)實的生態(tài)研究設(shè)計。在某些情況下,我們可以使用解析公式來計算功效,但這些通常是近似值或需要特殊形式的設(shè)計?。仿真是一種適用于各種模型和方法的單一方法。即使公式可用于特定模型和設(shè)計,定位和應(yīng)用適當(dāng)?shù)墓揭部赡芊浅@щy,因此首選仿真。

對于對 r 不夠熟悉的研究人員,設(shè)置模擬實驗可能太復(fù)雜了。在本文中,我們介紹了一個工具來自動化這個過程。

r 包

有一系列的 r 包目前可用于混合模型的功效分析 。然而,沒有一個可以同時處理非正態(tài)因變量和廣泛的固定和隨機效應(yīng)規(guī)范。

圖1

r 旨在與任何可以與 lme 4 中的 lmer 或 glmer 配合的線性混合模型 (LMM) 或 GLMM 一起使用。這允許具有不同固定和隨機效應(yīng)規(guī)范的各種模型。還支持在 r 中使用 lm 和 glm 的線性模型和廣義線性模型,以允許沒有隨機效應(yīng)的模型。

r 中的功效分析從適合 lme 4 的模型開始。

在 r 中,通過重復(fù)以下三個步驟來計算功效:(i) 使用提供的模型模擬因變量的新值;(ii) 將模型重新擬合為模擬因變量;(iii) 對模擬擬合應(yīng)用統(tǒng)計檢驗。在此設(shè)置中,已知存在測試效果,因此每個陽性測試都是真正的陽性,每個陰性測試都是 II 類錯誤??梢愿鶕?jù)步驟 3 的成功和失敗次數(shù)計算測試的功效。

教程

本教程使用包含的數(shù)據(jù)集。該數(shù)據(jù)集代表環(huán)境監(jiān)測數(shù)據(jù),在連續(xù)固定效應(yīng)變量x?(例如研究年份)的10 個水平上測量三個組?g?(例如研究地點)的因變量?z?(例如鳥類豐度?)。還有一個連續(xù)因變量?y?,在本教程中沒有使用。

擬合模型

我們首先將 lme 4 中的一個非常簡單的泊松混合效應(yīng)模型擬合到數(shù)據(jù)集。在這種情況下,我們有一個隨機截距模型,其中每個組 (?g??) 都有自己的截距,但這些組共享一個共同的趨勢。

  1. glm

  2. summary

本教程重點介紹關(guān)于x?趨勢的推斷?。在這種情況下,x?的估計效應(yīng)大小為?-0.11,使用默認(rèn)z檢驗在 0.01 水平上顯著?。

請注意,我們特意使用了一個非常簡單的模型來使本文易于理解。例如,適當(dāng)?shù)姆治鰰嗟慕M,并會考慮過度分散等問題。。

簡單的功率分析

假設(shè)我們想重復(fù)這項研究。如果效果是真實的,我們是否有足夠的功效來期待積極的結(jié)果?

指定效應(yīng)量

在開始功效分析之前,重要的是要考慮您感興趣的效果大小類型。功效通常隨效果大小而增加,較大的效果更容易檢測。回顧性“觀察功效”計算,其中目標(biāo)效應(yīng)大小來自數(shù)據(jù),給出誤導(dǎo)性結(jié)果.

對于此示例,我們將考慮檢測 -0.05 斜率的功效??梢允褂?lme 4 函數(shù)擬合 glmer 模型中的固定效應(yīng)。然后可以更改固定效應(yīng)的大小。變量x?的固定效應(yīng)的大小?可以從 -0.11 更改為 -0.05,如下所示:



  1. fixe<‐ ‐0.05

在本教程中,我們只更改變量x?的固定斜率?。但是,我們也可以更改隨機效應(yīng)參數(shù)或殘差方差(適用于合適的模型)。

運行功效分析

一旦指定了模型和效應(yīng)大小,在 r 中進(jìn)行功效分析就非常容易了。由于這些計算基于蒙特卡羅模擬,因此您的結(jié)果可能略有不同。如果你想得到和教程一樣的結(jié)果,你可以使用 set.seed(123)。

  1. power


鑒于此特定設(shè)置,拒絕x?中零趨勢的零假設(shè)的?能力約為 33%。這幾乎總是被認(rèn)為是不夠的;傳統(tǒng)上,80% 的功率被認(rèn)為是足夠的.

在實踐中,??z檢驗可能不適合這樣一個小例子。參數(shù)引導(dǎo)測試?可能是最終分析的首選。但是,更快的?z?-test 更適合學(xué)習(xí)使用該包以及在功效分析期間進(jìn)行初始探索性工作。

增加樣本量

在第一個示例中,估計功率很低。小型試點研究通常沒有足夠的功效來檢測微小的影響,但更大的研究可能會。

試點研究對x 的?10 個值進(jìn)行了觀察,?例如代表研究第 1 年到第 10 年。在此步驟中,我們將計算將其增加到 20 年的影響。

  1. modl2 <‐ extend

  2. power(modl2)


沿參數(shù)指定要擴展的變量,n 指定要替換它的級別。擴展模型 2 現(xiàn)在將具有?從 1 到 20 的x?值,與以前一樣分為三組,總共 60 行(與模型 1 中的 30 行相比)。

通過觀察x 的?20 個值?,我們將有足夠的能力來檢測大小為 -0.05 的效應(yīng)。

各種樣本量的功效分析

當(dāng)數(shù)據(jù)收集成本高昂時,用戶可能只想收集達(dá)到一定統(tǒng)計能力所需的數(shù)據(jù)量。 功效曲線 函數(shù)可用于探索樣本大小和功效之間的權(quán)衡。

確定所需的最小樣本量

在前面的示例中,當(dāng)對變量x 的20 個值進(jìn)行觀察時,我們發(fā)現(xiàn)了非常高的?功效?。我們能否減少這個數(shù)字,同時保持我們的功效高于通常的 80% 閾值?

  1. poerCure


  2. print

  3. plot

請注意,我們已將此結(jié)果保存到變量 pc2 以匹配模型 2 中的編號。由于模型 1 沒有足夠的功率,我們沒有通過 powerCurve 運行它。繪制的輸出如圖所示。?我們可以看到,檢測x?趨勢的?能力隨著采樣大小的增加而增加。這里的結(jié)果基于將模型擬合到 10 個不同的自動選擇的子集。最小的子集僅使用前 3 年(即 9 個觀測值),最大的子集使用所有 20 個假設(shè)研究年份(即 60 行數(shù)據(jù))。該分析表明,該研究必須運行 16 年才能有≥80% 的功效來檢測指定大小的影響。

圖2

檢測大小為 -0.05 的固定效應(yīng)的功效 (±95% CI),使用 powerCurve 函數(shù)在一系列樣本大小上計算。變量x?的不同值的數(shù)量?從 3 (?n???= 9) 到 20 (?n???= 60) 不等。

改變組的數(shù)量和大小

增加觀察到的x?值的數(shù)量可能不可行?。例如,如果?x?是研究年份,我們可能不愿意等待更長時間的結(jié)果。在這種情況下,增加研究地點的數(shù)量或每個地點的測量數(shù)量可能是更好的選擇。這兩項分析從我們的原始模型 1 開始,該模型已有 10 年的研究時間。

添加更多組

我們可以像為x?添加額外值一樣?為g?添加額外級別?。例如,如果變量?g?代表我們的研究站點,我們可以將站點數(shù)量從 3 增加到 15。

  1. extend(n=15)

  2. plot(pc3)

與上一個示例的主要變化是我們將變量g?傳遞?給了沿參數(shù)。該分析的輸出如圖 1 所示。要達(dá)到 80% 的功率,我們至少需要 11 個站點。

圖 3

檢測大小為 -0.05 的固定效應(yīng)的功效 (±95% CI),使用 powerCurve 在一系列樣本大小上計算。因子g?的級別數(shù)?從 3 (?n???= 30) 到 15 (?n???= 150) 不等。

增加組內(nèi)的大小

我們可以用內(nèi)參數(shù)替換擴展和 powerCurve 的沿參數(shù)以增加組內(nèi)的樣本大小。每個組在x?和?g 的?每個水平上只有一個觀察值?。我們可以將其擴展到每個站點每年 5 次觀測,如下所示:

  1. extend( n=5)


  2. plot(p4)

請注意 powerCurve 的breaks 參數(shù)。為x?和?g 的?每個組合提供一到五個觀察結(jié)果?。圖表明每年每個站點 4 次觀測會給我們 80% 的效力。

圖 4

檢測大小為 -0.05 的固定效應(yīng)的功效 (±95% CI),使用 powerCurve 函數(shù)在一系列樣本大小上計算。x?和?g 的?每個組合的觀察數(shù)?從 1 (?n???= 30) 到 5 (?n???= 150) 不等。

最受歡迎的見解

1.Matlab馬爾可夫鏈蒙特卡羅法(MCMC)估計隨機波動率(SV,Stochastic Volatility) 模型

2.基于R語言的疾病制圖中自適應(yīng)核密度估計的閾值選擇方法

3.WinBUGS對多元隨機波動率模型:貝葉斯估計與模型比較

4.R語言回歸中的hosmer-lemeshow擬合優(yōu)度檢驗

5.matlab實現(xiàn)MCMC的馬爾可夫切換ARMA – GARCH模型估計

6.R語言區(qū)間數(shù)據(jù)回歸分析

7.R語言WALD檢驗 VS 似然比檢驗

8.python用線性回歸預(yù)測股票價格

9.R語言如何在生存分析與Cox回歸中計算IDI,NRI指標(biāo)


拓端tecdat|R語言生態(tài)學(xué)模擬對廣義線性混合模型GLMM進(jìn)行功率(功效、效能、效力)分析的評論 (共 條)

分享到微博請遵守國家法律
白河县| 南宫市| 江都市| 七台河市| 防城港市| 佛山市| 永仁县| 隆林| 荔波县| 时尚| 巴南区| 绥阳县| 栾城县| 宾川县| 赤峰市| 榆林市| 平定县| 会东县| 德江县| 昭觉县| 新津县| 自治县| 田东县| 晴隆县| 凌云县| 武冈市| 梁山县| 凤台县| 丰城市| 平潭县| 正蓝旗| 湘潭市| 绍兴县| 天津市| 洛阳市| 鄂尔多斯市| 云和县| 山阴县| 中方县| 阿鲁科尔沁旗| 卫辉市|