R語言廣義加性混合模型(GAMM)分析長沙氣象因子、空氣污染、PM2.5濃度、顯著性檢驗(yàn)、逐
全文鏈接:https://tecdat.cn/?p=32981
原文出處:拓端數(shù)據(jù)部落公眾號
氣候變化和空氣污染對現(xiàn)代社會產(chǎn)生了越來越大的影響。在這種背景下,研究氣象和空氣污染之間的關(guān)系以及其對PM2.5濃度的影響變得非常重要。為了更好地理解和解釋這些關(guān)系,廣義加性混合模型(GAMM)成為一種強(qiáng)大的工具。
長沙作為湖南省的省會城市,其氣象條件和空氣質(zhì)量一直備受關(guān)注。通過分析長沙地區(qū)的氣象數(shù)據(jù)、空氣污染指標(biāo)和PM2.5濃度,可以更加全面地了解該地區(qū)的空氣質(zhì)量狀況,并揭示氣象因素對其變化的影響。
本研究旨在使用R語言中的廣義加性混合模型(GAMM)方法,幫助客戶來探索長沙地區(qū)氣象因素與空氣污染之間的關(guān)系,并進(jìn)一步研究它們對PM2.5濃度變化的影響。我們將采集長沙地區(qū)的逐日氣象數(shù)據(jù)、空氣污染指標(biāo)以及PM2.5濃度數(shù)據(jù),應(yīng)用GAMM模型進(jìn)行分析。
在分析過程中,我們將考慮多種氣象因素,如溫度、濕度、風(fēng)速等,并結(jié)合空氣污染指標(biāo),如PM10、SO2、NO2等,來建立相應(yīng)的GAMM模型。通過顯著性檢驗(yàn),我們將評估各個因素對PM2.5濃度的影響程度,并進(jìn)一步進(jìn)行逐日變化的可視化分析,以呈現(xiàn)其動態(tài)變化規(guī)律。
查看數(shù)據(jù)


讀取數(shù)據(jù)
airquality=read.csv("長沙氣象站逐日氣象+空氣污染 數(shù)據(jù).csv") ? ?Region=read.csv("長沙市年各個站點(diǎn)的PM2.5 每日濃度.csv",skip=1)


Table 2. Significance tests of PM2.5levels for different season, region, daytime and day of week. 對不同季節(jié)、地區(qū)、白天和周日的PM2.5水平進(jìn)行顯著性檢驗(yàn)。
這段內(nèi)容提到了對不同季節(jié)、地區(qū)、白天和周日的PM2.5水平進(jìn)行顯著性檢驗(yàn)。顯著性檢驗(yàn)是一種統(tǒng)計方法,用于確定兩個或多個樣本之間是否存在顯著差異。
在這個情境中,研究人員可能希望了解不同季節(jié)、地區(qū)、白天和周日的PM2.5水平是否存在顯著差異。PM2.5是指空氣中直徑小于或等于2.5微米的顆粒物,它對人體健康和環(huán)境質(zhì)量有重要影響。
為了進(jìn)行顯著性檢驗(yàn),研究人員可能會收集來自不同季節(jié)、地區(qū)、白天和周日的PM2.5水平數(shù)據(jù),并使用統(tǒng)計方法來比較這些數(shù)據(jù)。常用的顯著性檢驗(yàn)方法包括t檢驗(yàn)、方差分析和卡方檢驗(yàn)等。
通過進(jìn)行顯著性檢驗(yàn),研究人員可以確定不同季節(jié)、地區(qū)、白天和周日的PM2.5水平是否存在顯著差異,從而為環(huán)境保護(hù)和公共健康管理提供重要的科學(xué)依據(jù)。
Season
kruskal.test(PM2.5.ug.m3. ~ Season, data = airquality)

Region

Daytime

Season
pairwise.t.tes=="summ







Region

Day of week
Weekends1=seq(3,nrow(airquality),by=7) ? ?Weekends2=seq(4,nrow(airquality),by=7)wilcox.test( airquality$PM2.5.ug.m3.[airquality$Weekends==0] , airquali

Fig 3. Day to day variations of PM2.5in different seasons, 不同季節(jié)PM2.5的逐日變化
不同季節(jié)PM2.5的逐日變化指的是在不同季節(jié)中,每天空氣中PM2.5濃度的變化情況。PM2.5是指空氣中直徑小于或等于2.5微米的顆粒物,它們可以懸浮在空氣中并被人們吸入。PM2.5來源于工業(yè)排放、交通尾氣、燃煤、木材燃燒等。
在不同季節(jié)中,PM2.5的逐日變化可能會有所不同。一般來說,春季和夏季的PM2.5濃度相對較低,而秋季和冬季的PM2.5濃度相對較高。
在春季,天氣溫暖,風(fēng)力較大,降雨較多,這些因素有助于減少空氣中的PM2.5濃度。此時,植物生長活躍,能夠吸收大量的二氧化碳和顆粒物,從而凈化空氣。
夏季的PM2.5濃度一般較低,主要是因?yàn)楦邷睾蛷?qiáng)烈的陽光可以加速顆粒物的分解和擴(kuò)散。此外,夏季也是降雨量較多的季節(jié),雨水可以洗刷空氣中的顆粒物。
秋季的PM2.5濃度開始上升,主要是因?yàn)樘鞖庾兝?,大氣穩(wěn)定,風(fēng)力較小,這有利于顆粒物的積累。此外,秋季還是農(nóng)作物收獲季節(jié),農(nóng)田燃燒殘留物會釋放出大量的顆粒物。
冬季是PM2.5濃度最高的季節(jié)。在冬季,天氣寒冷,大氣層穩(wěn)定,風(fēng)力較小,這導(dǎo)致顆粒物在空氣中滯留時間較長。此外,冬季是取暖季節(jié),燃煤和木材燃燒釋放的顆粒物也會增加。
總的來說,不同季節(jié)PM2.5的逐日變化受到多種因素的影響,包括氣溫、風(fēng)力、降雨量、植物生長和人類活動等。了解這些變化有助于我們采取相應(yīng)的措施來減少PM2.5的污染。
points(which(airquality$Season=="spring" & airquality$Weekends==1),airq




不同季節(jié)PM2.5的逐日變化 Diurnal variations of PM2.5in different months
不同季節(jié)PM2.5的逐日變化是指在不同季節(jié)中,每天PM2.5濃度的變化情況。PM2.5是指空氣中直徑小于或等于2.5微米的顆粒物,它們對人體健康有害。這些顆粒物主要來自于工業(yè)排放、交通尾氣、燃燒過程和自然來源等。
在不同季節(jié)中,PM2.5的逐日變化可能受到多種因素的影響。例如,冬季由于采暖需求增加,燃煤和燃?xì)獾氖褂昧吭黾?,?dǎo)致PM2.5濃度較高。而夏季由于氣溫升高,光化學(xué)反應(yīng)增多,加上交通尾氣和工業(yè)排放的貢獻(xiàn),PM2.5濃度也可能較高。
此外,氣象條件也會對PM2.5的逐日變化產(chǎn)生影響。例如,風(fēng)速、風(fēng)向、降雨等天氣因素都會影響PM2.5的擴(kuò)散和沉降,從而影響其濃度。
因此,不同季節(jié)中PM2.5的逐日變化是一個動態(tài)的過程,受到多種因素的綜合影響。通過對這種變化的研究和監(jiān)測,可以更好地了解和應(yīng)對空氣質(zhì)量問題。
grep( date,airquality$日期)),]$PM2.5.ug.m3. ?plot(Mar,type="p",col=j,ylab="95% CI")
3-5月份
6-8月份
9-11 月份
12-2 月份
Correlation coefficient and COD versus distance between the stations 相關(guān)系數(shù)和COD隨站間距離的變化
相關(guān)系數(shù)是用來衡量兩個變量之間的線性關(guān)系強(qiáng)度和方向的統(tǒng)計指標(biāo)。它的取值范圍在-1到1之間,其中1表示完全正相關(guān),-1表示完全負(fù)相關(guān),0表示無相關(guān)性。
相關(guān)系數(shù)和站間距離的變化之間可能存在一定的關(guān)系。如果兩個變量之間的相關(guān)系數(shù)較高(接近1或-1),則說明它們之間存在較強(qiáng)的線性關(guān)系。在這種情況下,站間距離的變化可能較小,因?yàn)樽兞恐g的關(guān)系比較穩(wěn)定。相反,如果兩個變量之間的相關(guān)系數(shù)較低(接近0),則說明它們之間的線性關(guān)系較弱或不存在。在這種情況下,站間距離的變化可能較大,因?yàn)樽兞恐g的關(guān)系較為不穩(wěn)定。
abline(lm(cordata~distdata),col="red")
GAMM模型分析溫度? 濕度,風(fēng)速 能見度 氣壓對PM2.5的影響
GAMM(Generalized Additive Mixed Models)是一種靈活的統(tǒng)計模型,結(jié)合了廣義可加模型(GAM,Generalized Additive Models)和混合模型(Mixed Models)的優(yōu)點(diǎn)。它可以用于解決包含非線性關(guān)系和隨機(jī)效應(yīng)的數(shù)據(jù)建模問題。
GAMM模型主要用于處理長期觀測數(shù)據(jù)和重復(fù)測量數(shù)據(jù),其中數(shù)據(jù)可能受到時間、空間或其他相關(guān)因素的影響。GAMM模型具有以下特點(diǎn):
廣義可加模型(GAM)的優(yōu)點(diǎn):GAM模型可以通過非線性平滑函數(shù)來建模解釋變量與響應(yīng)變量之間的復(fù)雜關(guān)系,適用于非線性關(guān)系的建模。
混合模型(Mixed Models)的優(yōu)點(diǎn):GAMM模型可以處理數(shù)據(jù)中的隨機(jī)效應(yīng),比如個體間的差異或?qū)蛹壗Y(jié)構(gòu)中的變化。
可解釋性:GAMM模型通過可加函數(shù)模型來描述數(shù)據(jù),可以直觀地解釋模型中的每個平滑項的效應(yīng)。
gamm(PM2.5.ug.m3.~s(平均溫度.攝
summary(b$gam) # gam style summary of fitted model
simple checking plots 模型檢驗(yàn)
用AR1殘差項擬合模型
lme擬合的細(xì)節(jié)
擬合模型的Gam風(fēng)格總結(jié)

模型檢驗(yàn)


最受歡迎的見解
1.R語言多元Logistic邏輯回歸 應(yīng)用案例
2.面板平滑轉(zhuǎn)移回歸(PSTR)分析案例實(shí)現(xiàn)
3.matlab中的偏最小二乘回歸(PLSR)和主成分回歸(PCR)
4.R語言泊松Poisson回歸模型分析案例
5.R語言混合效應(yīng)邏輯回歸Logistic模型分析肺癌
6.r語言中對LASSO回歸,Ridge嶺回歸和Elastic Net模型實(shí)現(xiàn)
7.R語言邏輯回歸、Naive Bayes貝葉斯、決策樹、隨機(jī)森林算法預(yù)測心臟病
8.python用線性回歸預(yù)測股票價格
9.R語言用邏輯回歸、決策樹和隨機(jī)森林對信貸數(shù)據(jù)集進(jìn)行分類預(yù)測