MIMIC數據庫提取教程-提取某種疾病下的實驗室指標

我們在進行數據分析時,很多時候需要提取出患某種疾病的患者的實驗室指標,比如患者的血氣,血常規(guī)等指標。
小編今天以提取患“肺栓塞”患者的實驗室指標為例子,教大家如何提取mimiciv數據庫的實驗室指標。
01
提取指標
小編本次要提取的指標是患有“肺栓塞”的患者的以下實驗室指標:“血紅蛋白”,“D二聚體”,“葡萄糖”。
提取的最終結果如下:

02
操作步驟
第一步,因為mimic中的疾病數據是根據icd編碼查找的,所以我們需要先找出“肺栓塞”對應的icd編碼,從下表可以看出肺栓塞的icd編碼大部分都是以“415“開頭的

第二步,我們需要根據icd編碼從診斷表diagnoses_icd中查出患了“肺栓塞“的患者的信息,并根據患者分組,此處小編已經把所有患者都查出來了,患了“肺栓塞”的患者標志為1,沒有患這個病的標志為0

第三步,查詢實驗室指標對應的itemId,這需要從字典表d_labitems中根據指標標簽查詢,小編這里只查詢了“血紅蛋白”的itmeId,我們查詢的是血氣中的血紅蛋白,其他指標查詢方法類似

第四步,從實驗室指標表labevents查找實驗室指標的信息,并根據患者分組

03
合并結果
小編現在已經分別查詢出來了患了“肺栓塞”的病人,以及對應的實驗室指標,最后需要把這些SQL語句合并后,才能輸出在一張表格,其中使用了with子查詢,分別把診斷數據跟實驗室指標數據作為子查詢,以下是完整的SQL解釋。

為了方便大家的學習,小編已經把完整的SQL腳本整理好放在后臺,如果需要本次教程的SQL腳本,關注公眾號“科研收錄”,后臺回復“肺栓塞”即可獲取腳本。