MIMIC-IV,重癥醫(yī)學(xué)數(shù)據(jù)庫介紹和使用說明


一、MIMIC IV數(shù)據(jù)庫簡介
MIMIC數(shù)據(jù)庫就是一個可為臨床研究者提供臨床數(shù)據(jù)的利器。該數(shù)據(jù)庫于2003年在美國國立衛(wèi)生研究院的資助下,由美國麻省理工學(xué)院計算生理學(xué)實驗室、美國哈佛醫(yī)學(xué)院貝斯以色列女執(zhí)事醫(yī)療中心(Beth Israel Deaconess Medical Center,BIDMC)和飛利浦醫(yī)療公司共同建立。
研究者可根據(jù)一定的納排標(biāo)準(zhǔn)篩選感興趣患者的臨床信息,利用這些信息可進行后續(xù)的數(shù)據(jù)分析然后撰寫文章,通過數(shù)據(jù)收集與分析可作為發(fā)表sci論文的重要依據(jù)。另外,MIMIC是一個公開數(shù)據(jù)庫,所有患者的信息都經(jīng)過脫敏處理,發(fā)文不需要臨床倫理審查。
以下各類疾病都有涉及:

二、數(shù)據(jù)庫樣本量
MIMIC 數(shù)據(jù)庫目前已經(jīng)產(chǎn)生了MIMIC Ⅱ、Ⅲ、Ⅳ三個版本 MIMIC數(shù)據(jù)庫包含了BIDMC所有內(nèi)外科ICU患者的數(shù)據(jù),數(shù)據(jù)團隊為保護患者隱私,對患者信息進行去標(biāo)識化處理,向全世界的研究人員免費開放。
MIMIC Ⅲ數(shù)據(jù)庫收集了BIDMC 2001年6月至2012年10月ICU收治的53423例成年患者數(shù)據(jù)和2001年至2008年收治的7870例新生兒重癥患者數(shù)據(jù)。

MIMIC Ⅳ數(shù)據(jù)庫在MIMIC Ⅲ的基礎(chǔ)上做了一些改進,包括數(shù)據(jù)更新和部分表格重構(gòu),收集了 2008至2019年BIDMC收治的超過19萬名患者、45萬次住院記錄的臨床數(shù)據(jù)。數(shù)據(jù)庫記錄了患者的人口統(tǒng)計學(xué)信息、實驗室檢查、用藥情況、生命體征、手術(shù)操作、疾病診斷、藥物管理、隨訪生存狀態(tài)等詳細信息。

MIMIC Ⅳ數(shù)據(jù)庫主要有三類數(shù)據(jù):
第一類是從EHR中提取的臨床數(shù)據(jù),包括患者的人口統(tǒng)計學(xué)、疾病診斷、實驗室檢測、藥物治療、生命體征等。
第二類是ICU床旁監(jiān)護設(shè)備采集的波形數(shù)據(jù)、生命體征、液體管理和事件記錄,主要來自于IMDSoft MetaVision系統(tǒng)。
第三類是死亡隨訪數(shù)據(jù),通過社會保險系統(tǒng)得到患者院外死亡的日期,作為MIMIC 數(shù)據(jù)庫的組成部分,這部分數(shù)據(jù)對研究患者的預(yù)后很重要。

三、 基本字段表述
患者入院信息, 以每次入院為單位記錄, 每條記錄有一個單獨的hadm_id, hospital_expire_flag只當(dāng)次住院是否院內(nèi)死亡, 部分院內(nèi)死亡患者沒有deathtime, 可能是數(shù)據(jù)庫本身問題

subject_id 每個患者有唯一的subject_id
hadm_id 患者的每一次入院會有一個唯一的hadm_id
transfer_id 患者每一次更換病房會有一個唯一的transfer_id
stay_id 在相同類型病房內(nèi)進行轉(zhuǎn)移,則會更新一個transfer_id,但會有相同的stay_id,例如用ICU中的一個病房轉(zhuǎn)移到另一個病房,則stay_id不變,transfer_id更新。?
所有id的分配都是隨機的,與時間先后無關(guān)。
date and time
后綴為date的,分辨率最低為天;后綴為timed的字段,分辨率最低為分鐘。
charttime and storetime:分別是測量的記錄時間與儲存時間。通常以charttime為準(zhǔn) d and icd 命名為d_開頭,為編碼表。d_icd開頭,為icd編碼表。icd結(jié)尾的表,為使用icd編碼的記錄表。
四、MIMIC-IV數(shù)據(jù)表說明
Tables
分為六個模塊,Core、Hosp、ICU、ED、CXR、Note
Core
Core模塊包含患者跟蹤數(shù)據(jù)。這里描述了人口統(tǒng)計、入院信息和住院病房轉(zhuǎn)院情況
admission?患者入院信息,以每次入院為單位記錄,每條記錄有一個單獨的hadm_id
patient?患者信息
transfers?病房轉(zhuǎn)移信息
Hosp
Hosp模塊涵蓋的信息包括實驗室測量,微生物學(xué),藥物管理,和收費診斷等
d_icd_diagnoses 包含國際疾病分類(ICD)第9版和第10版的診斷代碼。icd_code一定要讀取為字符串,因為開頭為0是有意義的,若讀取為數(shù)值會有重復(fù),如01622和1622代表不同疾病。

d_icd_diagnoses表

icd_code一定要讀取為字符串,因為開頭為0是有意義的,若讀取為數(shù)值會有重復(fù)
diagnoses_icd 患者診斷信息表。seq_num代表診斷的優(yōu)先級,序號越靠前越重要,而低優(yōu)先級的排序有時并不準(zhǔn)確

drgcodes 也是與診斷相關(guān)的表,使用DiagnosisRelatedGroup(DRG)code編碼 與diagnose表中的主要診斷相對應(yīng)。

d_icd_procedures
procedures_icd 患者住院期間的手術(shù)信息,包括在ICU期間的信息。


d_labitems 實驗室檢查定義表

labevents 病人實驗室檢查的記錄
prescriptions 處方數(shù)據(jù),藥物數(shù)據(jù)

pharmacy 藥房數(shù)據(jù)表,以pharmacy_id字段與prescriptions表相關(guān)聯(lián),相當(dāng)于對prescriptions表中各處方信息的補充。此外,還有微生物培養(yǎng)、收費、訂單等表格

ICU
包含從ICU內(nèi)使用的臨床信息系統(tǒng)收集的信息。記錄在案的數(shù)據(jù)包括靜脈給藥、呼吸機設(shè)置和其他圖表項目等。每個患者每次入院可能有多次icu,每次icu對應(yīng)一個stay_id
d_items 包含ICU內(nèi)發(fā)生的所有項目的編碼,通過itemid字段與ICU模塊內(nèi)的其他表格關(guān)聯(lián)。

ICU stays 入住ICU的時間信息

chartevents Chartevents包含了一個病人可用的所有圖表數(shù)據(jù),有些lab數(shù)據(jù)與labevents表中的數(shù)據(jù)重復(fù)。

ED
急診信息,包含急診診斷,病人體征等信息。通過subject_id和hadm_id與其他模塊相連接。急診的患者如有hadm_id,則說明該患者住院治療。ed患者不一定住院,住院的患者也不一定從急診入院。
diagnosis table 診斷表為患者提供診斷列表。從急診科出院后確定診斷。
edstays table 急診科來訪的主要跟蹤表。它提供了病人進入急診科和離開急診科的時間
medrecon table 在進入急診室時,工作人員會詢問病人目前正在服用什么藥物。這個過程被稱為藥物協(xié)調(diào),醫(yī)療檢查表存儲了護理人員的調(diào)查結(jié)果
pyxis table 提供了通過pyxis系統(tǒng)配制藥物的信息。
triage table 包含病人在急診室第一次分診時生命體征信息
vitalsign table 急診室收治的病人常規(guī)的生命體征需要1-4小時。這些生命體征保存在生命體征表中
vitalsign_hl7 table 急診收治的病人可通過遙測技術(shù)進行監(jiān)測。每分鐘的生命體征都被傳送到醫(yī)院的中央服務(wù)器,這些生命體征都被記錄在這里。
CXR
X光胸片文件,源數(shù)據(jù)是dicom格式,但也提供了jpg格式的下載。包含了胸片及影像學(xué)報告。值得注意的是,存在有影像的患者沒有住院記錄的情況。
cxr-record-list 影像列表
cxr-study-list 影響報告列表
mimic-cxr-2.0.0-chexpert 使用CheXpert labeler(基于影像學(xué)報告的非人工標(biāo)注,斯坦福與麻省理工合作)標(biāo)注了14個標(biāo)簽,標(biāo)簽如下表
mimic-cxr-2.0.0-split 提供了參考的訓(xùn)練集、驗證集、測試集劃分
Note
官方還未發(fā)布 (NOT PUBLICLY AVAILABLE): 所有文本報告,出院、超聲、心電、影像等報告
五、官網(wǎng)及數(shù)據(jù)庫下載網(wǎng)址
官方介紹見 MIMIC官方網(wǎng)站 : https://mimic.mit.edu/
MIMIC-IV 數(shù)據(jù)庫下載見 MIMIC-IV發(fā)布頁: https://physionet.org/content/mimiciv/1.0/
X光胸片dicom格式數(shù)據(jù)下載見 MMIC-CXR Database: https://physionet.org/content/mimic-cxr/2.0.0/
X光胸片JPG格式數(shù)據(jù)見 MIMIC-CXR-JPG:https://physionet.org/content/mimic-cxr-jpg/2.0.0/
急診數(shù)據(jù)見 MIMIC-IV-ED :?
https://physionet.org/content/mimic-iv-ed/1.0/
參考
MIMIC-IV, a freely accessible electronic health record dataset:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC9810617/
Python 系列 – MIMIC-IV Demo 描述性統(tǒng)計:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC9810617/

臨床數(shù)據(jù)庫挖掘(MIMIC、NHANES),醫(yī)學(xué)統(tǒng)計,醫(yī)療數(shù)據(jù)分析