最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

R語言零膨脹泊松回歸ZERO-INFLATED POISSON(ZIP)模型分析露營釣魚數(shù)據(jù)實例估計IRR和

2022-06-15 16:00 作者:拓端tecdat  | 我要投稿

原文鏈接:http://tecdat.cn/?p=26915?

原文出處:拓端數(shù)據(jù)部落公眾號

零膨脹泊松回歸用于對超過零計數(shù)的計數(shù)數(shù)據(jù)進行建模。此外,理論表明,多余的零點是通過與計數(shù)值不同的過程生成的,并且可以獨立地對多余的零點進行建模。因此,??zip?模型有兩個部分,泊松計數(shù)模型和用于預測多余零點的 logit 模型。

零膨脹泊松回歸示例

示例?。州立野生動物生物學家想要模擬州立公園的漁民捕獲了多少魚。游客會被問到他們逗留了多長時間,團隊中有多少人,團隊中是否有兒童以及捕獲了多少魚。一些游客不釣魚,但沒有關于一個人是否釣魚的數(shù)據(jù)。一些釣魚的游客沒有釣到任何魚,因此數(shù)據(jù)中存在多余的零,因為人們沒有釣魚。

數(shù)據(jù)說明

我們有 250 個去公園的團體的數(shù)據(jù)。每個小組都被詢問他們捕獲了多少魚(count),小組中有多少孩子(child),小組中有多少人(persons),以及他們是否帶露營者到公園(camper)。

讓我們看一下數(shù)據(jù)。


  1. summary(zib)

  1. ## 直方圖的X軸為對數(shù)10標

  2. ggplot(znb, aes(ount))

您可能會考慮的分析方法

以下是您可能遇到的一些分析方法的列表。列出的一些方法是相當合理的,而另一些方法要么失寵,要么有局限性。

  • 零膨脹泊松回歸。

  • 零膨脹負二項式回歸——負二項式回歸在分散數(shù)據(jù)時表現(xiàn)更好,即方差遠大于平均值。

  • 普通計數(shù)模型 。

  • OLS 回歸——您可以嘗試使用 OLS 回歸分析這些數(shù)據(jù)。然而,計數(shù)數(shù)據(jù)是高度非正態(tài)的,并且不能通過 OLS 回歸很好地估計。

零膨脹泊松回歸

summary(m1)

輸出看起來非常像 R 中兩個 OLS 回歸的輸出。在模型調(diào)用下方,您會發(fā)現(xiàn)一個輸出塊,其中包含每個變量的泊松回歸系數(shù)以及標準誤差、z 分數(shù)和 p 值系數(shù)。接下來是對應于通貨膨脹模型的第二個塊。這包括用于預測多余零點的 logit 系數(shù)及其標準誤差、z 分數(shù)和 p 值。

模型的計數(shù)和膨脹部分中的所有預測變量都具有統(tǒng)計顯著性。該模型對數(shù)據(jù)的擬合顯著優(yōu)于空模型,即僅截距模型。為了證明情況確實如此,我們可以使用對數(shù)似然差異的卡方檢驗將當前模型與沒有預測變量的空模型進行比較。

mnl <- update(m1, . ~ 1)

由于我們在完整模型中有三個預測變量,因此卡方檢驗的自由度為 3。這會產(chǎn)生較高的顯著 p 值;因此,我們的整體模型具有統(tǒng)計學意義。

請注意,上面的模型輸出并沒有以任何方式表明我們的零膨脹模型是否是對標準泊松回歸的改進。我們可以通過運行相應的標準 Poisson 模型然后對這兩個模型進行 Vuong 檢驗來確定這一點。

vuong(p, m)

Vuong 檢驗將零膨脹模型與普通泊松回歸模型進行比較。在這個例子中,我們可以看到我們的檢驗統(tǒng)計量是顯著的,表明零膨脹模型優(yōu)于標準泊松模型。

我們可以使用自舉獲得參數(shù)和指數(shù)參數(shù)的置信區(qū)間。對于泊松模型,這些將是事件風險比,對于零通脹模型,優(yōu)勢比。此外,對于最終結果,可能希望增加重復次數(shù)以幫助確保結果穩(wěn)定。

dt(coef(m1, "count"))

dpt(coef(m1, "zero"))


  1. res <- boot(znb, f, R = 1200, pralel = "snow", ncus = 4)

  2. ## 輸出結果

  3. res

結果是交替的參數(shù)估計和標準誤差。也就是說,第一行具有我們模型的第一個參數(shù)估計值。第二個具有第一個參數(shù)的標準誤差。第三列包含自舉的標準誤差。

現(xiàn)在我們可以得到所有參數(shù)的置信區(qū)間。我們從原始比例開始,使用百分位數(shù)和偏差調(diào)整的 CI。我們還將這些結果與基于標準誤差的置信區(qū)間進行比較。

  1. ## 帶百分位數(shù)和偏差調(diào)整的CI的基本參數(shù)估計值



  2. ## 添加行名

  3. row.names(pms) <- names(coef(m))

  4. ## 輸出結果

  5. parms

  1. ## 與基于正常的近似值相比

  2. confint(m1)

bootstrap置信區(qū)間比基于正態(tài)的近似值要寬得多。使用穩(wěn)健標準誤差時,自舉 CI 與來自 Stata 的 CI 更加一致。

現(xiàn)在我們可以估計泊松模型的事件風險比 (IRR) 和邏輯(零通脹)模型的優(yōu)勢比 (OR)。

  1. ## 帶百分位數(shù)和偏差調(diào)整的CI的指數(shù)化參數(shù)估計值

  2. exps <- t(sapply(c(1, 3, 5, 7, 9), function(i) {

  3. out <- boot.ci

為了更好地理解我們的模型,我們可以計算預測變量的不同組合所捕獲的魚的預期數(shù)量。事實上,由于我們基本上使用的是分類預測,我們可以使用函數(shù)來計算所有組合的期望值來創(chuàng)建所有組合。最后我們創(chuàng)建一個圖表。


  1. ggplot(neda1, aes(x = cld, y = pat, colour = factor(pos))) +

  2. geom_point() +

  3. geom_line() +

  4. facet_wrap(~cmp)

需要考慮的事項

  • 由于?zip?同時具有計數(shù)模型和 logit 模型,因此這兩個模型中的每一個都應該具有良好的預測器。這兩個模型不一定需要使用相同的預測變量。

  • 零膨脹模型的邏輯部分可能會出現(xiàn)完美預測、分離或部分分離的問題。

  • 計數(shù)數(shù)據(jù)通常使用暴露變量來指示事件可能發(fā)生的次數(shù)。

  • 不建議將零膨脹泊松模型應用于小樣本。

最受歡迎的見解

1.R語言多元Logistic邏輯回歸 應用案例

2.面板平滑轉移回歸(PSTR)分析案例實現(xiàn)

3.matlab中的偏最小二乘回歸(PLSR)和主成分回歸(PCR)

4.R語言泊松Poisson回歸模型分析案例

5.R語言混合效應邏輯回歸Logistic模型分析肺癌

6.r語言中對LASSO回歸,Ridge嶺回歸和Elastic Net模型實現(xiàn)

7.R語言邏輯回歸、Naive Bayes貝葉斯、決策樹、隨機森林算法預測心臟病

8.python用線性回歸預測股票價格

9.R語言用邏輯回歸、決策樹和隨機森林對信貸數(shù)據(jù)集進行分類預測


R語言零膨脹泊松回歸ZERO-INFLATED POISSON(ZIP)模型分析露營釣魚數(shù)據(jù)實例估計IRR和的評論 (共 條)

分享到微博請遵守國家法律
五华县| 贵德县| 监利县| 隆化县| 梅河口市| 郁南县| 鲁山县| 集贤县| 应用必备| 巴青县| 灵山县| 固镇县| 南皮县| 曲水县| 桃江县| 汾阳市| 康马县| 平阴县| 高清| 聊城市| 阿图什市| 衡阳县| 洪泽县| 聂荣县| 哈密市| 宁都县| 和田县| 文成县| 曲靖市| 台北县| 青阳县| 枣阳市| 衡水市| 岳西县| 察隅县| 山阴县| 兴化市| 鸡西市| 唐海县| 宣城市| 沂源县|