人工智能糖尿病預(yù)測(cè)模型-美國(guó)疾控中心CDC25萬(wàn)數(shù)據(jù)集,生物醫(yī)藥企業(yè)科研_論文作業(yè)_專利

糖尿病概述
糖尿病有一型和二型,是由于胰腺分泌胰島素紊亂或人體無(wú)法有效利用其產(chǎn)生的胰島素而發(fā)生的一種慢性疾病,是21世紀(jì)人類面臨的健康問(wèn)題之一.糖尿病伴有彌漫性并發(fā)癥,其包括心血管病變、腎臟疾病、高血壓、中風(fēng)等、眼部疾病、下肢截肢上百種,由此增加了過(guò)早死亡的風(fēng)險(xiǎn).因此,糖尿病防治形勢(shì)十分嚴(yán)峻.
下右圖為糖尿病視網(wǎng)膜病變

2019年估算中國(guó)糖尿病患病率排名世界第二

中國(guó)糖尿病患者數(shù)量位居世界第一。中國(guó)是糖尿病最大藥物研發(fā)市場(chǎng)。越來(lái)越多年輕人也加入糖尿病市場(chǎng),成為藥企搖錢樹(shù)。

下圖為中國(guó)糖尿病患病率歷史數(shù)據(jù)

糖尿病給經(jīng)濟(jì)帶來(lái)巨大負(fù)擔(dān)
糖尿病也給經(jīng)濟(jì)帶來(lái)了巨大的負(fù)擔(dān),每年診斷出的糖尿病成本約為 3270 億美元,而未確診的糖尿病和前驅(qū)糖尿病的總成本接近 4000 億美元。

糖尿病可預(yù)防
雖然糖尿病無(wú)法治愈,但減肥、健康飲食、積極運(yùn)動(dòng)和接受藥物治療等策略可以減輕這種疾病對(duì)許多患者的危害。早期診斷可以改變生活方式和更有效的治療,使糖尿病風(fēng)險(xiǎn)預(yù)測(cè)模型成為公共和公共衛(wèi)生官員的重要工具。
糖尿病致病因子多樣化
雖然有不同類型的糖尿病,但 II 型糖尿病是最常見(jiàn)的形式,其患病率因年齡、教育程度、收入、地點(diǎn)、種族和其他健康的社會(huì)決定因素而異。這種疾病的大部分負(fù)擔(dān)也落在社會(huì)經(jīng)濟(jì)地位較低的人身上。
本實(shí)驗(yàn)就是通過(guò)建立人工智能機(jī)器學(xué)習(xí)模型,預(yù)測(cè)糖尿病概率和挖掘糖尿病重要致病因子。
糖尿病建模數(shù)據(jù)集介紹
糖尿病數(shù)據(jù)集來(lái)源美國(guó)疾控中心CDC糖尿病數(shù)據(jù)集。數(shù)據(jù)集包含25萬(wàn)條數(shù)據(jù),21個(gè)變量。變量包括:實(shí)驗(yàn)者綜合健康狀態(tài),性別,年齡,是否吸煙,是否心臟病,是否中風(fēng),是否高血壓,是否高膽固醇,身體鍛煉情況,蔬菜水果攝入情況,BMI指數(shù)等等

美國(guó)疾控中心CDC糖尿病數(shù)據(jù)集一覽

模型價(jià)值和意義
通過(guò)我們建立的人工智能機(jī)器學(xué)習(xí)預(yù)測(cè)模型,可實(shí)現(xiàn)以下一些研究問(wèn)題:
1.模型能準(zhǔn)確預(yù)測(cè)個(gè)人是否患有糖尿病。
2.模型能挖掘哪些風(fēng)險(xiǎn)因素最能預(yù)測(cè)糖尿病風(fēng)險(xiǎn)。
3.我們能使用風(fēng)險(xiǎn)因素的一個(gè)子集來(lái)準(zhǔn)確預(yù)測(cè)一個(gè)人是否患有糖尿病。
4.我們可以使用篩選幾個(gè)重要糖尿病致病特征,然后組合創(chuàng)建為一個(gè)簡(jiǎn)短的問(wèn)題,以準(zhǔn)確預(yù)測(cè)某人是否可能患有糖尿病或是否有糖尿病的高風(fēng)險(xiǎn)。

傳統(tǒng)集成樹(shù)算法雖然比決策樹(shù)性能更優(yōu),但性能仍有改進(jìn)空間。

型采用新一代對(duì)稱樹(shù)算法,有效降低過(guò)度擬合,提高模型預(yù)測(cè)速度和預(yù)測(cè)能力。

糖尿病預(yù)測(cè)模型性能優(yōu)秀,ROC大于0.8,accuracy準(zhǔn)確率高于0.866。

美國(guó)疾控中心糖尿病數(shù)據(jù)描述性統(tǒng)計(jì)如下
通過(guò)模型得出綜合健康評(píng)級(jí)指數(shù),年齡,BMI指數(shù),高血壓,高膽固醇是影響糖尿病的5個(gè)重要因素。
部分變量數(shù)據(jù)挖掘結(jié)果:GenHlth綜合健康分?jǐn)?shù):數(shù)值越大,糖尿病風(fēng)險(xiǎn)越大;數(shù)值越小,糖尿病風(fēng)險(xiǎn)越小

年齡:年齡越大,糖尿病風(fēng)險(xiǎn)越大;年齡越小,糖尿病風(fēng)險(xiǎn)越小。

BMI指數(shù):BMI越大,糖尿病風(fēng)險(xiǎn)越大;BMI越小,糖尿病風(fēng)險(xiǎn)越小。左邊有少量紅色點(diǎn),每個(gè)變量有少數(shù)例外,但大趨勢(shì)不變。

高血壓:如果有高血壓,糖尿病風(fēng)險(xiǎn)越大;如果沒(méi)有高血壓,糖尿病風(fēng)險(xiǎn)越小。

通過(guò)對(duì)美國(guó)疾控中心CDC糖尿病建模和數(shù)據(jù)挖掘后,我們得到很多高價(jià)值信息。
模型啟示錄1
血糖-控制含糖量高的食品攝入,例如白糖,奶茶,糖果,零食。

模型啟示錄2
BMI-控制體重,適當(dāng)鍛煉

模型啟示錄3-積極防控高血壓

模型啟示錄4-積極防控高膽固醇

糖尿病可防可控,從預(yù)防做起,可限制降低糖尿病患病概率,減少政府醫(yī)療開(kāi)支負(fù)擔(dān)。

歡迎商務(wù)合作
如果您們對(duì)糖尿病模型項(xiàng)目感興趣,歡迎各大醫(yī)療機(jī)構(gòu),科研機(jī)構(gòu),生物醫(yī)藥企業(yè)聯(lián)系。

人工智能讓生活更美好!


版權(quán)聲明:文章來(lái)自公眾號(hào)(python生物信息學(xué)),未經(jīng)許可,不得抄襲。遵循CC 4.0 BY-SA版權(quán)協(xié)議,轉(zhuǎn)載請(qǐng)附上原文出處鏈接及本聲明。