Diabetes糖尿病數(shù)據(jù)分析和挖掘_企業(yè)調(diào)研_論文科研_畢業(yè)設(shè)計
作者Toby老師,來自公眾號(python生物信息學),糖尿病數(shù)據(jù)分析和挖掘_企業(yè)調(diào)研_論文科研_畢業(yè)設(shè)計
大家好,我是Toby老師,曾擔任國內(nèi)最大醫(yī)藥數(shù)據(jù)中心數(shù)據(jù)挖掘負責人。10年以上數(shù)據(jù)科學經(jīng)驗,和中科院,重科院,重慶中藥研究所,重慶兒科醫(yī)院教授有長期項目合作?,F(xiàn)在成立了重慶未來之智信息技術(shù)咨詢服務(wù)有限公司。我們公司的宗旨是用人工智能,數(shù)據(jù)科學挖掘疾病致病因子,提供疾病家庭預(yù)防和干預(yù)措施降低疾病患病率。人工智能讓生活更美好!

糖尿病概述
糖尿病醫(yī)學描述:糖尿病是一組因胰島素絕對或相對分泌不足和(或)胰島素利用障礙,引起的碳水化合物、蛋白質(zhì)、脂肪代謝紊亂性疾病。以高血糖為主要標志。
糖尿病有一型和二型,是由于胰腺分泌胰島素紊亂或人體無法有效利用其產(chǎn)生的胰島素而發(fā)生的一種慢性疾病,是21世紀人類面臨的健康問題之一.糖尿病伴有彌漫性并發(fā)癥,其包括心血管病變、腎臟疾病、高血壓、中風等、眼部疾病、下肢截肢上百種,由此增加了過早死亡的風險.因此,糖尿病防治形勢十分嚴峻。
糖尿病最早記錄可追述到古埃及。

中國黃帝內(nèi)經(jīng)也有類似糖尿病消渴癥狀的描述。

17世紀英國醫(yī)生托馬斯.威利斯記錄了尿甜如蜜,這也是糖尿病的一個癥狀。

1889年,醫(yī)學家發(fā)現(xiàn),狗被切除胰腺后,患上了糖尿病。因此推斷糖尿病和胰腺有關(guān)系。

1921年,加拿大醫(yī)生班廷和生理學家貝斯特成功提取出了胰島素,并證實了胰島素可以降低血糖。大家為了紀念班廷醫(yī)生,把他生日11月14日定為世界糖尿病日。

糖尿病主要分為四類:1型糖尿病2型糖尿病,妊娠期糖尿病,特殊類型糖尿病。

1型糖尿病是由于胰島β細胞破壞、胰島素絕對不足引起的一種糖尿病。

1型糖尿病患者占比小于5%。多于兒童和青少年起病,1型糖尿病患占比80-90%。1型糖尿病患者一般在20歲前發(fā)病。

2023年,1型糖尿病患者15萬人左右。1型糖尿病患者大多無癥狀。

糖尿病臨床癥狀主要體現(xiàn)為三多一少,即多飲,多食,多尿,體重減輕。細胞不能正常攝入葡萄糖,就會給大腦發(fā)出饑餓信號,增加飲食。但增加飲食后,葡萄糖仍然不能進入細胞,身體通過消耗自身脂肪來給細胞供應(yīng)葡萄糖,因此出現(xiàn)消瘦。

糖尿病對全身危害較多,主要分類兩類,對心血管破壞和細菌感染。

糖尿病會引起血管變窄,硬化或堵塞。長期供血不足,肝,腦,腎,眼睛都會發(fā)生病變。

糖尿病導(dǎo)致血管變硬。如果血管破裂出血后就會發(fā)生腦淤血,眼底出血等等。如果心腦血管堵塞就會發(fā)生心梗和腦梗。


下圖是糖尿病視網(wǎng)膜病變和正常視力對比。

糖尿病引起感染包括皮膚感染,肺炎,泌尿系統(tǒng)感染。

全球糖尿病聯(lián)盟公布數(shù)據(jù)顯示2017年全球糖尿病患者4.26億,2045年預(yù)計達到6.29億。

2017年統(tǒng)計數(shù)據(jù)中,中國20-79歲糖尿病患者1.14億,為全球最大糖尿病藥品市場。

如果安裝患病率統(tǒng)計,2019年估算中國糖尿病患病率排名世界第二 。

中國糖尿病患者數(shù)量為1.2億,位居世界第一。中國是糖尿病最大藥物研發(fā)市場。越來越多年輕人屬于糖尿病后備軍,未來也將加入糖尿病市場,成為藥企搖錢樹。

下圖為中國糖尿病患病率歷史數(shù)據(jù),我們看到從1980年到2010年,糖尿病患病率從不到1%增加到11.6%。

糖尿病發(fā)病率高,但診治人數(shù)只有30%-40%左右,家庭生活方式干預(yù)更加不足。

糖尿病檢查包括
體格檢查
空腹血糖檢測
隨機血糖檢測
口服葡萄糖耐量試驗(金標準)
尿糖檢測
糖化血紅蛋白檢測
糖尿病給經(jīng)濟帶來巨大負擔
糖尿病也給經(jīng)濟帶來了巨大的負擔,每年診斷出的糖尿病成本約為 3270 億美元,而未確診的糖尿病和前驅(qū)糖尿病的總成本接近 4000 億美元。

糖尿病可預(yù)防
雖然糖尿病無法治愈,但減肥、健康飲食、積極運動和接受藥物治療等策略可以減輕這種疾病對許多患者的危害。早期診斷可以改變生活方式和更有效的治療,使糖尿病風險預(yù)測模型成為公共和公共衛(wèi)生官員的重要工具。
糖尿病致病因子多樣化
雖然有不同類型的糖尿病,但 II 型糖尿病是最常見的形式,其患病率因年齡、教育程度、收入、地點、種族和其他健康的社會決定因素而異。這種疾病的大部分負擔也落在社會經(jīng)濟地位較低的人身上。
我們目的就是通過建立人工智能機器學習模型,預(yù)測糖尿病概率和挖掘糖尿病重要致病因子。
糖尿病痛點
糖尿病科研有個痛點,就是臨床醫(yī)生經(jīng)驗很難用數(shù)據(jù)科學量化實驗來輔助證明。而數(shù)據(jù)挖掘的結(jié)論也并非全部可信,需要和臨床經(jīng)驗豐富醫(yī)生交叉驗證。
Toby老師從2011年就開始關(guān)注糖尿病問題。在這10年多時間,收集了上百個糖尿病數(shù)據(jù)集,包括不同國家糖尿病患者數(shù)據(jù)集,孕婦糖尿病數(shù)據(jù)集,糖尿病并發(fā)癥數(shù)據(jù)集-糖尿病腎病數(shù)據(jù)集,糖尿病并發(fā)癥數(shù)據(jù)集-糖尿病視網(wǎng)膜病變數(shù)據(jù)集,糖尿病遺傳史數(shù)據(jù)集。Toby老師建立了幾十個糖尿病預(yù)測模型,包括最先進深度學習算法。
通過對上GB大樣本臨床患者數(shù)據(jù)挖掘,發(fā)現(xiàn)糖尿病致病因子,并和臨床經(jīng)驗結(jié)合解釋數(shù)據(jù)挖掘結(jié)果合理性,為家庭疾病預(yù)防做出貢獻。
我們的數(shù)據(jù)挖掘整合了多個糖尿病數(shù)據(jù)庫,在國內(nèi)也屬于罕見,Toby老師提供了非常震撼的數(shù)據(jù)挖掘結(jié)果,大家可以點擊收藏此文和分享給其他朋友,讓更多朋友受益。
我們收集糖尿病相關(guān)變量數(shù)百個,全方位覆蓋糖尿病相關(guān)風險點,主要包括
1.患者基礎(chǔ)信息變量
年齡
性別
教育水平
收入水平
懷孕
血壓
BMI指數(shù)
是否吸煙
最近30天是否有體育鍛煉
水果攝入情況
蔬菜攝入情況
飲酒量
綜合健康評級指數(shù)
心理健康分數(shù),包括壓力、抑郁和情緒問題
身體健康分數(shù),在過去30天里有多少天處于身體疾病和受傷
走路或爬樓梯是否有嚴重困難


2.患者疾病史變量
高血壓
高膽固醇
肺炎
腎炎
視網(wǎng)膜病變
中風
心臟病
是否免疫抑制
慢性阻塞性肺病
其他疾病
心血管疾病
哮喘
糖尿病家族史
糖尿病遺傳系數(shù)
新冠病毒感染情況
插管


3.患者治療相關(guān)變量
醫(yī)療開支情況
醫(yī)療保險情況
是否進過重癥監(jiān)護室
所在醫(yī)院的醫(yī)療單位等級
在過去的一年內(nèi),有沒有一次你需要看醫(yī)生,但因為費用問題而不能看

4.糖尿病相關(guān)實驗變量
口服耐糖量測試
胰島素釋放實驗
血常規(guī)實驗
尿常規(guī)實驗

5.血尿常規(guī)檢測相關(guān)變量
血糖
尿液白蛋白檢查
尿白蛋白肌酐比
腎小球濾過率(GFR)
天門冬氨酸氨基轉(zhuǎn)換酶
丙氨酸氨基轉(zhuǎn)換酶
堿性磷酸酶
r-谷氨?;D(zhuǎn)換酶
總蛋白
白蛋白
球蛋白
白球比例
甘油三酯
總膽固醇
高密度脂蛋白膽固醇
低密度脂蛋白膽固醇
尿素
肌酐
尿酸
乙肝表面抗原
乙肝表面抗體
乙肝e抗原
乙肝e抗體
乙肝核心抗體
白細胞計數(shù)
紅細胞計數(shù)
血紅蛋白
紅細胞壓積
紅細胞平均體積
紅細胞平均血紅蛋白量
紅細胞平均血紅蛋白濃度
紅細胞體積分布寬度
血小板計數(shù)
血小板平均體積
血小板體積分布寬度
血小板比積
中性粒細胞%
淋巴細胞%
單核細胞%
嗜酸細胞%
嗜堿細胞%





模型價值和意義
通過我們建立的人工智能機器學習預(yù)測模型,可實現(xiàn)以下一些研究問題:
1.模型能準確預(yù)測個人是否患有糖尿病。
2.模型能挖掘哪些風險因素最能預(yù)測糖尿病風險。
3.我們能使用風險因素的一個子集來準確預(yù)測一個人是否患有糖尿病。
4.我們可以使用篩選幾個重要糖尿病致病特征,然后組合創(chuàng)建為一個簡短的問題,以準確預(yù)測某人是否可能患有糖尿病或是否有糖尿病的高風險。
5.我們通過建立AI圖像識別模型,及時發(fā)現(xiàn)糖尿病視網(wǎng)膜病變患者。。

我們的模型具有良好區(qū)分能力,可準確預(yù)測患者糖尿病概率。

我們糖尿病預(yù)測模型可以預(yù)測單個就診者糖尿病概率,也可批量預(yù)料成千上萬名就診者糖尿病概率。

計算機建模后可自動對數(shù)萬糖尿病視網(wǎng)膜病變的識別。

我們還能對所有變量做相關(guān)性分析,挖掘互相關(guān)聯(lián)的變量。比如高血壓和腎病是否有高相關(guān)性?
歡迎商務(wù)合作
如果您們對糖尿病科研,糖尿病數(shù)據(jù)分析,糖尿病人工智能預(yù)測模型項目感興趣,歡迎各大醫(yī)療機構(gòu),科研機構(gòu),生物醫(yī)藥企業(yè)聯(lián)系。

更多內(nèi)容請點擊下面視頻


版權(quán)聲明:文章來自公眾號(python生物信息學),未經(jīng)許可,不得抄襲。遵循CC 4.0 BY-SA版權(quán)協(xié)議,轉(zhuǎn)載請附上原文出處鏈接及本聲明。