2023深圳杯東三省A題全保姆教程 城市居民身體健康分析
A題 影響城市居民身體健康的因素分析
A題城市居民身體健康分析主要是一道問卷分析類題目,整體分析難度不高,基本按照B站視頻思路去做就可以,難點主要是數(shù)據的整理及清洗以及特征構造,這塊我也差不多做好了,后面會持續(xù)更新文章,需要的小伙伴可以收藏一下。
背景:
以心腦血管疾病、糖尿病、惡性腫瘤以及慢性阻塞性肺病為代表的慢性非傳染性疾?。ㄒ韵潞喎Q慢性病)已經成為影響我國居民身體健康的重要問題。隨著人們生活方式的改變,慢性病的患病率持續(xù)攀升。眾所周知,健康狀況與年齡、飲食習慣、身體活動情況、職業(yè)等都有密切的關系。如何通過合理地安排膳食、適量的身體運動、踐行健康的生活方式,從而達到促進身體健康的目的,這是全社會普遍關注的問題。附件A1是某市衛(wèi)生健康研究部門對部分居民所做的“慢性非傳染性疾病及其相關影響因素流行病學”調查問卷表,附件A2是相應的調查數(shù)據結果,附件A3是中國營養(yǎng)學會最新修訂的《中國居民膳食指南》中為平衡居民膳食提出的八條準則。
請你們團隊研究解決下面問題:
問題1?
參考附件A3,分析附件A2中居民的飲食習慣的合理性,并說明存在的主要問題。
思路:搭建一個指標體系,用于衡量居民的飲食習慣的合理性,根據附件A3整理出指標體系,然后對每一項指標繪制圖表進行描述性分析,說明居民的飲食習慣與附件3《中國居民膳食指南》的差距。
這里的難度是整理數(shù)據,分析難度并不大

問題2 分析居民的生活習慣和飲食習慣是否與年齡、性別、婚姻狀況、文化程度、職業(yè)等因素相關。
思路
解法1:相關性分析,首先可以整理出生活習慣指標與飲食習慣指標的相關變量,然后逐個對年齡、性別、婚姻狀況、文化程度、職業(yè)等因素進行關聯(lián)分析,然后對前面關聯(lián)分析后的結果進行整合,獲取其相關系數(shù)的均值,進而確定整體是否與以上因素存在相關關系,以及個體上,哪些變量相關性低,或者不呈現(xiàn)相關性。
解法2:邏輯回歸,首先可以整理出生活習慣指標與飲食習慣指標的相關變量,這些變量作為X,然后以此對年齡、性別、婚姻狀況、文化程度、職業(yè)等人口因素做為Y,例如以性別作為Y舉例,先分析其F檢驗是否呈現(xiàn)顯著性,如過存在顯著性,那么說明整體上是存在影響關系的,接著查看每一項的標準化回歸系數(shù),核對個體上的顯著性關系;
解法3:機器學習+模型解釋(shap模型),同方法2,先核對指標,然后通過機器學習建模分類或回歸模型,把模型輸入shap模型之類,這樣可以從非線性的角度確定各個指標對人口因素(Y)的影響
問題3 根據附件A2中的數(shù)據,深入分析常見慢性?。ㄈ绺哐獕?、糖尿病等)與吸煙、飲酒、飲食習慣、生活習慣、工作性質、運動等因素的關系以及相關程度。
思路這道題同問題2一樣,唯一的不同是把Y變了,這里的Y為(0:沒有患病,1:有高血壓或糖尿?。缓笤賹@些變量進行整理即可,建議問題2可以采用解法3,然后套入與問題2一樣的解法,這樣問題3解題難度就降低了,想要炫技的話可以采用不同的機器學習來對比。
問題4 依據附件A2中居民的具體情況,對居民進行合理分類,并針對各類人群提出有利于身體健康的膳食、運動等方面的合理建議。
思路 這道題的關鍵核心是分類的方向,從題意來看很多類型的分類,例如對于有無患?。ǜ哐獕夯蛱悄虿。⒁嗷蚋鶕丝谔卣鞣诸?,例如少年、青年、中年、老年,或者肥胖群體,再或者飲食習慣等等,所以事實上這道題有很多的做法,但是萬變不離其中,再做完分類后,針對各類人群提出有利于身體健康的膳食、運動等方面的合理建議這個做法是都是一樣的分析步驟,這個分析可以直接復制第一問的分析,只是這個時候是按人群來劃分了
完整解題代碼可點擊此處獲取
【騰訊文檔】2023深圳杯東三省A題全保姆教程
https://docs.qq.com/doc/DYVhNR1JPY3JwbFNT