2023年華中杯C題詳細思路

2023年五一假期期間,數(shù)學建模競賽就有四場,各種比賽各種需求應接不暇。因此,對于本次淺析有不足的地方歡迎大家指出。為了更好的幫助大家華中杯參賽,下面帶來,C題詳細版思路。由于C題的難度,注定選題人數(shù)將不可計數(shù),因此對于每一問求解已經不再是最關鍵的步驟。如何創(chuàng)新,增加 得分點才是,在接下來的思路中,我也將我認為的創(chuàng)新點得分點進行解釋。
預計1號14點之前,可以完成成品論文的寫作。
C 題 空氣質量預測與預警
主模型:預測
數(shù)據預處理 + 指標選取
以空氣污染為背景,設問。其預警等級劃分為四級應急響應持續(xù) 時間均為24的倍數(shù),即按天進行計算,大大減少計算難度。下面,我們首先進行數(shù)據預處理階段。
對于題目給出的數(shù)據,我們第一步就是進行數(shù)據預處理。數(shù)據預處理無非就是數(shù)據清洗(主要就是缺失值、噪聲數(shù)據、異常值、不一致性等問題。常用的方法有刪除、填補、平滑、修正等。)給出的數(shù)據,很明顯存在不少的缺失值,對于這個人問題缺失值的處理,我認為直接剔除不太好,因為時間序列都是連續(xù)的。因此,可以選擇插值進行填充,或者其他處理方法均可。

問題一,根據附件 1 和附件 2,對數(shù)據進行分析和處理,篩選出與 PM2.5 濃度變化有 關的因素,并說明篩選出的因素對 PM2.5 濃度影響的程度。
對于問題一,需要我們數(shù)據預處理 + 指標選取。指標的選取,需要就是選取與 PM2.5 濃度變化有 關的因素。對于這一問,我們可以進行關聯(lián)分析,主要方法如下所示。

至于,篩選出因素對 PM2.5 濃度影響的程度,我們就可以根據相關系數(shù)進行排序即可。
相關性分析的話,我還是比較推薦person相關系數(shù)

問題一注釋:對于問題一,大部分人應該都是直接進行相關性分析,因此,問題一得分點就是數(shù)據預處理的好壞,以及相關性分析的文字描述,這兩個點做好可以在眾多論文中脫穎而出?;蛘哂衅渌南嚓P性分析方法,只要合理,獨特也是非常推薦的。
問題二:自行劃分訓練集和測試集,根據附件 1 和附件 2,基于問題一構建 PM2.5 濃 度多步預測模型,分別使用均方根誤差(RMSE)對 3 步、 5 步、 7 步、 12 步預測效果進 行評估,其結果請用表 1 格式在正文中具體給出,并對測試集及其預測結果進行可視化。 同時,用該模型預測附件 3 所給定時間的 PM2.5 濃度,其結果請用表 2 格式在正文中具 體給出。
問題二,涉及到預測模型的選擇,大家可以參考下圖。

稍后我也會給出一些比較合適的預測模型。對于問題二提及的均方根誤差(RMSE),如下所示,是一種用于衡量預測值與實際值之間差異的統(tǒng)計量,通常用于評估回歸模型的預測能力。切記,通常來講對于預測模型,隨著預測步長的增加,RMSE是是越來越大,即預測步數(shù)越大,精度越小。所以,一旦結果趨勢不對,很可能是數(shù)據或者模型出錯了。

大概是一個這樣的結果趨勢,結果不對,為了展示隨機捏造了四個結構。
問題二注釋:問題二最大的區(qū)別應該就是預測模型的選擇上,大部分人很可能直接選取一個模型。這里我有個好建議,就是我們可以使用加權平均預測。即使用多個模型,進行預測。最后的結果進行加權處理,對于加權的權重求解,我們可以建立優(yōu)化模型進行求解。
問題三:構建 AQI 多步預測模型,使用均方根誤差(RMSE)對建模效果進行評估, 并對測試集及其預測結果進行可視化。同時,用該模型預測附件 3 所給定時間的 AQI,并 給出每天空氣質量的預警等級,其結果請用表 3 和表 4 格式在正文中具體給出。
問題三,構建AQI 多步預測模型,直接多步預測、遞歸多步預測、直接-遞歸混合預測、多輸出預測等。尤其需要注意,問題三的預測主題不在是問題二的主題,因此,對于問題三預測模型的選擇。我們依舊可以選擇沿用問題二的模型。但是預測的指標必須進行重新篩選,選擇出與AQI相關聯(lián)的指標才可以。切記切記!不要直接用問題二的指標。應該是把問題一的問題主語換成AQI 再進行求解,就可以。
問題三注釋:最簡單的點就是預警等級的賦予上,很多人可能直接進行人工賦予。這里我們最好建立一個模型,數(shù)據處理模型即可,即對不同AQI下,對應的時間進行預警等級劃分。這樣問題三就會看起來特別的完備。
其中預測結果進行可視化。可以認為是對結果的另類展示,我們可以進行繪圖或者制表的展示即可。