MIMIC數據庫提取教程-提取某種疾病下的患者人口統(tǒng)計學指標
在上一篇數據庫提取教程中,小編教大家提取了“肺栓塞”患者的實驗室指標,具體步驟可以參考MIMIC數據庫提取教程-提取某種疾病下的實驗室指標。
在本期數據庫提取教程,小編依舊以“肺栓塞”患者為例,教大家如何提取患者的人口統(tǒng)計學指標。
在mimiciv數據庫中,患者的人口統(tǒng)計學信息主要分為兩部分。
第一部分為患者的“語言”,“種族”,“婚姻狀態(tài)”這幾種信息,這些信息直接記錄在了hosp模塊的admissions表中,大家直接提取即可。
第二部分為患者的“年齡”,“身高”,“體重”這幾個信息,這幾個信息都不可以直接從表中直接提取,而是要經過計算才能獲取患者正確的指標。
本期小編就教大家如何在mimiciv數據庫中獲取患者的“年齡”,“身高”,“體重”這幾個很重要的指標。
一,獲取患者的真實年齡
mimiciv數據庫為了保護患者的隱私,并沒有直接記錄患者的真實年齡,patients表中記錄了兩個關于年齡的字段:
anchor_age:患者相對anchor_year的相對年齡。
anchor_year:計算患者年齡的基準年份。

anchor_age并不是患者的入院時的真實年齡,而是根據anchor_year做了偏移,真實年齡的計算公式是:
患者的真實年齡=anchor_age+患者的入院時間-anchor_year

上圖中的ROUND函數是將年齡轉為2位小數。
上圖小編使用到了DATETIME_DIFF函數,該函數為mimiciv官方函數,作用是求兩個時間的差,這個函數小編是安裝在mimiciv_derived模塊中,如果大家不是安裝在這個模塊中,請把函數前綴替換成自己的模塊名哈。

二,獲取患者的身高
mimiciv數據庫中患者的身高數據存放在icu模塊的chartevents表中,并且身高會使用兩種單位進行記錄,分別是英寸跟厘米,為了數值的正確,必須將單位統(tǒng)一,這里小編會將使用英寸的測量數據轉成厘米。


三,獲取患者的體重
mimiciv數據庫中患者的體重數據也存放在icu模塊的chartevents表中,患者的體重數據有兩種類型,分別是入院時測量的體重跟醫(yī)院每天的測量體重。小編這里取的是患者兩種體重的平均值。


最終提取出來的“肺栓塞”患者的人口統(tǒng)計學信息如下,小編為了大家學習的連貫性,直接把人口統(tǒng)計學指標加在了原有的指標上面。

關注公眾號“科研收錄”,后臺回復“人口統(tǒng)計學”,即可下載教程中完整的SQL腳本,如果大家在學習的過程中有遇到關于mimic數據庫的問題,請在后臺給小編留言。