NHANES數(shù)據(jù)庫樣本中的權(quán)重分析

哈嘍大家好,還記得我們之前出過一篇Nhanes數(shù)據(jù)庫使用教程嗎?很多小伙伴看完就有疑問了,Nhanes的數(shù)據(jù)是有權(quán)重的,不能用常規(guī)的統(tǒng)計(jì)方法進(jìn)行分析,那要怎么分析呢?今天喵學(xué)姐就來給大家講一講Nhanes數(shù)據(jù)的權(quán)重分析。
問題1:NHANES?的權(quán)重是如何產(chǎn)生的?
該調(diào)查的抽樣方式是分層抽樣。每兩年進(jìn)行一次調(diào)查。在美國選取幾個(gè)州,然后再在選取州的下面的一些縣級(jí)別,然后在縣級(jí)別中的選取一些市級(jí)別的地方,然后在選取市級(jí)別下的城鎮(zhèn)級(jí)別選取家庭為作為調(diào)查單位。
首先進(jìn)行問卷調(diào)查,美國總?cè)丝跀?shù)/參加調(diào)查問卷的人數(shù)=?wtint2yr
然后參與問卷調(diào)查的人被告知做進(jìn)一步實(shí)驗(yàn)室數(shù)據(jù)檢查和身體測量數(shù)據(jù),但是只有一部分人參與,因此產(chǎn)生了另外一個(gè)權(quán)重wtmec2yr。他們中的一些人進(jìn)行一些小眾化的測試用于調(diào)查疾病的調(diào)查,如一部分人參與飲食調(diào)查所以在文件中“dr1iff”中有個(gè)權(quán)重WTDR2D - Dietary two-day sample weight。

問題2:要不要選擇權(quán)重?
NHANES官網(wǎng)是要求在研究的時(shí)候進(jìn)行加權(quán)分析數(shù)據(jù)。因?yàn)榧訖?quán)更為真實(shí)地反映出整體的情況。當(dāng)然你也會(huì)看到一些已經(jīng)發(fā)表的文章沒有考慮權(quán)重,是因?yàn)樽髡邲]有考慮,期刊也沒有要求,但是確保研究結(jié)果的可靠性,還是建議進(jìn)行加權(quán)分析。

問題3:如何選擇權(quán)重?
數(shù)據(jù)庫的demo文件中已經(jīng)給了wtint2yr,wtmec2yr,一些人數(shù)更少的調(diào)查項(xiàng)目中有權(quán)重的會(huì)給出相應(yīng)的權(quán)重,如在飲食文件中“dr1iff”中有個(gè)權(quán)重wtdr2d
取最小調(diào)查人群即子集對(duì)應(yīng)的數(shù)據(jù)的權(quán)重
具體而言:
①如果研究對(duì)象都是調(diào)查問卷里,則采用wtint2yr
②如果研究的對(duì)象既有調(diào)查問卷的,又有測量的數(shù)據(jù),或者只有測量的數(shù)據(jù)則采用wtmec2yr
③如果研究的對(duì)象參與了更為人數(shù)少調(diào)查或測量,則采用小眾人群所對(duì)應(yīng)的權(quán)重,如wtdr2d

問題4:如何合并權(quán)重?
在研究中一般選用幾年的調(diào)查樣本進(jìn)行合并之后再進(jìn)行數(shù)據(jù)分析調(diào)查,每2年的調(diào)查數(shù)據(jù)均有相應(yīng)的權(quán)重,在合理選擇權(quán)重之后,合并幾年可以按照如下公式:

公式中weight表示合并權(quán)重,n?表示的是幾個(gè)2年循環(huán),wt1 ~n?表示每個(gè)2年循環(huán)對(duì)應(yīng)的權(quán)重。
注意特殊年份:1999-2000;2001-2002,這兩個(gè)年份分別有一個(gè)wtint2yr,wtmec2yr,但是合并起來有一個(gè)wtint4yr,wtmec4yr。選擇的年份的不同,則選用的權(quán)重不同。
情況1:如果選擇的年份中只包含1999-2000,2001-2002年中的一個(gè)年份只需要按照上述的一般情況的公式去計(jì)算
情況2:如果選擇的年份包含1999-2000,2001-2002年,兩個(gè)年份時(shí)選用整體四年對(duì)應(yīng)的權(quán)重,公式改為

理解為把1999-2000看做一個(gè)年份,然后占用份額是2?,剩下的年份占用的份額分別是1??;镜脑瓌t是和一般情況計(jì)算公式一樣。、
特殊年份:2019-2020這個(gè)年份受疫情影響。至于官方的解釋是本計(jì)劃采集2019-2022年數(shù)據(jù)做一個(gè)四年的權(quán)重,但是由于新冠疫情的影響,后續(xù)把數(shù)據(jù)2017-2020年3月份分作為3.2年為一個(gè)周期權(quán)重只給了wtmecprp。如果需要列入2017-2020年的數(shù)據(jù),可以考慮特殊處理。
總結(jié)

喵學(xué)姐認(rèn)為,NHANES?數(shù)據(jù)庫最好加權(quán)分析,選用涉及變量中最小子集的權(quán)重,特殊年份特殊處理。(若理解有誤,請及時(shí)糾正)