【數(shù)據(jù)分享】糖尿病患者研究數(shù)據(jù)集
原文鏈接:http://tecdat.cn/?p=23848
原文出處:拓端數(shù)據(jù)部落公眾號(hào)
數(shù)據(jù)簡(jiǎn)介
該數(shù)據(jù)集最初來(lái)自國(guó)家糖尿病/消化/腎臟疾病研究所。數(shù)據(jù)集的目標(biāo)是基于數(shù)據(jù)集中包含的某些診斷測(cè)量來(lái)診斷性的預(yù)測(cè) 患者是否患有糖尿病。從較大的數(shù)據(jù)庫(kù)中選擇這些實(shí)例有幾個(gè)約束條件。尤其是,這里的所有患者都是印第安至少21歲的女性。數(shù)據(jù)集由多個(gè)醫(yī)學(xué)預(yù)測(cè)變量和一個(gè)目標(biāo)變量組成Outcome。預(yù)測(cè)變量包括患者的懷孕次數(shù)、BMI、胰島素水平、年齡等。(查看文末了解獲取方式)
數(shù)據(jù)詳情
數(shù)據(jù)格式
csv
字段
懷孕次數(shù)
葡萄糖?
血壓 (mm Hg)?
皮層厚度 (mm)?
胰島素 2小時(shí)血清胰島素(mu U / ml
體重指數(shù) (體重/身高)^2
糖尿病譜系功能?
年齡 (歲)?
類標(biāo)變量 (0或1)
大小
23.3kb
樣本量
768
數(shù)據(jù)瀏覽
以前5行數(shù)據(jù)為例,我們來(lái)預(yù)覽一下:
變量探索:
數(shù)據(jù)獲取
在下面公眾號(hào)后臺(tái)回復(fù)“糖尿病患者數(shù)據(jù)”,可獲取完整數(shù)據(jù)。
點(diǎn)擊標(biāo)題查閱相關(guān)文章
PYTHON用決策樹分類預(yù)測(cè)糖尿病和可視化實(shí)例
左右滑動(dòng)查看更多
01
02
03
04
點(diǎn)擊標(biāo)題查閱往期內(nèi)容
Python決策樹、隨機(jī)森林、樸素貝葉斯、KNN(K-最近鄰居)分類分析銀行拉新活動(dòng)挖掘潛在貸款客戶
R語(yǔ)言邏輯回歸(Logistic Regression)、回歸決策樹、隨機(jī)森林信用卡違約分析信貸數(shù)據(jù)集
R語(yǔ)言對(duì)用電負(fù)荷時(shí)間序列數(shù)據(jù)進(jìn)行K-medoids聚類建模和GAM回歸
R語(yǔ)言進(jìn)行支持向量機(jī)回歸SVR和網(wǎng)格搜索超參數(shù)優(yōu)化
R語(yǔ)言貝葉斯MCMC:GLM邏輯回歸、Rstan線性回歸、Metropolis Hastings與Gibbs采樣算法實(shí)例
在R語(yǔ)言中實(shí)現(xiàn)Logistic邏輯回歸
R語(yǔ)言邏輯回歸、Naive Bayes貝葉斯、決策樹、隨機(jī)森林算法預(yù)測(cè)心臟病
R語(yǔ)言用Rcpp加速M(fèi)etropolis-Hastings抽樣估計(jì)貝葉斯邏輯回歸模型的參數(shù)
R語(yǔ)言邏輯回歸logistic模型分析泰坦尼克titanic數(shù)據(jù)集預(yù)測(cè)生還情況
R語(yǔ)言用lme4多層次(混合效應(yīng))廣義線性模型(GLM),邏輯回歸分析教育留級(jí)調(diào)查數(shù)據(jù)
R語(yǔ)言隨機(jī)森林RandomForest、邏輯回歸Logisitc預(yù)測(cè)心臟病數(shù)據(jù)和可視化分析
R語(yǔ)言基于Bagging分類的邏輯回歸(Logistic Regression)、決策樹、森林分析心臟病患者
R語(yǔ)言邏輯回歸(Logistic回歸)模型分類預(yù)測(cè)病人冠心病風(fēng)險(xiǎn)
欲獲取全文文件,請(qǐng)點(diǎn)擊左下角“閱讀原文”。