人工智能糖尿病風(fēng)險預(yù)測模型-基于美國疾控中心CDC25萬數(shù)據(jù)集(準(zhǔn)確率高于0.86),生物醫(yī)
糖尿病概述
糖尿病有一型和二型,是由于胰腺分泌胰島素紊亂或人體無法有效利用其產(chǎn)生的胰島素而發(fā)生的一種慢性疾病,是21世紀(jì)人類面臨的健康問題之一.糖尿病伴有彌漫性并發(fā)癥,其包括心血管病變、腎臟疾病、高血壓、中風(fēng)等、眼部疾病、下肢截肢上百種,由此增加了過早死亡的風(fēng)險.因此,糖尿病防治形勢十分嚴(yán)峻.
下右圖為糖尿病視網(wǎng)膜病變

2019年估算中國糖尿病患病率排名世界第二

中國糖尿病患者數(shù)量位居世界第一。中國是糖尿病最大藥物研發(fā)市場。越來越多年輕人也加入糖尿病市場,成為藥企搖錢樹。

下圖為中國糖尿病患病率歷史數(shù)據(jù)

糖尿病給經(jīng)濟(jì)帶來巨大負(fù)擔(dān)
糖尿病也給經(jīng)濟(jì)帶來了巨大的負(fù)擔(dān),每年診斷出的糖尿病成本約為 3270 億美元,而未確診的糖尿病和前驅(qū)糖尿病的總成本接近 4000 億美元。

糖尿病可預(yù)防
雖然糖尿病無法治愈,但減肥、健康飲食、積極運(yùn)動和接受藥物治療等策略可以減輕這種疾病對許多患者的危害。早期診斷可以改變生活方式和更有效的治療,使糖尿病風(fēng)險預(yù)測模型成為公共和公共衛(wèi)生官員的重要工具。
糖尿病致病因子多樣化
雖然有不同類型的糖尿病,但 II 型糖尿病是最常見的形式,其患病率因年齡、教育程度、收入、地點(diǎn)、種族和其他健康的社會決定因素而異。這種疾病的大部分負(fù)擔(dān)也落在社會經(jīng)濟(jì)地位較低的人身上。
本實驗就是通過建立人工智能機(jī)器學(xué)習(xí)模型,預(yù)測糖尿病概率和挖掘糖尿病重要致病因子。
糖尿病建模數(shù)據(jù)集介紹
糖尿病數(shù)據(jù)集來源美國疾控中心CDC糖尿病數(shù)據(jù)集。數(shù)據(jù)集包含25萬條數(shù)據(jù),21個變量。變量包括:實驗者綜合健康狀態(tài),性別,年齡,是否吸煙,是否心臟病,是否中風(fēng),是否高血壓,是否高膽固醇,身體鍛煉情況,蔬菜水果攝入情況,BMI指數(shù)等等。

美國疾控中心CDC糖尿病數(shù)據(jù)集一覽

模型價值和意義
通過我們建立的人工智能機(jī)器學(xué)習(xí)預(yù)測模型,可實現(xiàn)以下一些研究問題:
1.模型能準(zhǔn)確預(yù)測個人是否患有糖尿病。
2.模型能挖掘哪些風(fēng)險因素最能預(yù)測糖尿病風(fēng)險。
3.我們能使用風(fēng)險因素的一個子集來準(zhǔn)確預(yù)測一個人是否患有糖尿病。4.我們可以使用篩選幾個重要糖尿病致病特征,然后組合創(chuàng)建為一個簡短的問題,以準(zhǔn)確預(yù)測某人是否可能患有糖尿病或是否有糖尿病的高風(fēng)險。

傳統(tǒng)集成樹算法雖然比決策樹性能更優(yōu),但性能仍有改進(jìn)空間。

型采用新一代對稱樹算法,有效降低過度擬合,提高模型預(yù)測速度和預(yù)測能力。

糖尿病預(yù)測模型性能優(yōu)秀,ROC大于0.8,accuracy準(zhǔn)確率高于0.866。

美國疾控中心糖尿病數(shù)據(jù)描述性統(tǒng)計如下
通過模型得出綜合健康評級指數(shù),年齡,BMI指數(shù),高血壓,高膽固醇是影響糖尿病的5個重要因素。
部分變量數(shù)據(jù)挖掘結(jié)果:GenHlth綜合健康分?jǐn)?shù):數(shù)值越大,糖尿病風(fēng)險越大;數(shù)值越小,糖尿病風(fēng)險越小

年齡:年齡越大,糖尿病風(fēng)險越大;年齡越小,糖尿病風(fēng)險越小。

BMI指數(shù):BMI越大,糖尿病風(fēng)險越大;BMI越小,糖尿病風(fēng)險越小。左邊有少量紅色點(diǎn),每個變量有少數(shù)例外,但大趨勢不變。

高血壓:如果有高血壓,糖尿病風(fēng)險越大;如果沒有高血壓,糖尿病風(fēng)險越小。

通過對美國疾控中心CDC糖尿病建模和數(shù)據(jù)挖掘后,我們得到很多高價值信息。
模型啟示錄1血糖-控制含糖量高的食品攝入,例如白糖,奶茶,糖果,零食。
模型啟示錄2
BMI-控制體重,適當(dāng)鍛煉

模型啟示錄3-積極防控高血壓

模型啟示錄4-積極防控高膽固醇

糖尿病可防可控,從預(yù)防做起,可限制降低糖尿病患病概率,減少政府醫(yī)療開支負(fù)擔(dān)。

歡迎商務(wù)合作
如果您們對糖尿病模型項目感興趣,歡迎各大醫(yī)療機(jī)構(gòu),科研機(jī)構(gòu),生物醫(yī)藥企業(yè)聯(lián)系。

人工智能讓生活更美好!

更多相關(guān)知識可點(diǎn)擊視頻了解

版權(quán)聲明:文章來自公眾號(python生物信息學(xué)),未經(jīng)許可,不得抄襲。遵循CC 4.0 BY-SA版權(quán)協(xié)議,轉(zhuǎn)載請附上原文出處鏈接及本聲明。