R語(yǔ)言Pearson相關(guān)性分析就業(yè)率和“性別平等”谷歌搜索熱度google trend時(shí)間序列數(shù)據(jù)可
全文鏈接:http://tecdat.cn/?p=31585
原文出處:拓端數(shù)據(jù)部落公眾號(hào)
Google Trends, 即谷歌趨勢(shì)。谷歌趨勢(shì)是谷歌旗下一款基于搜索數(shù)據(jù)推出的一款分析工具。它通過(guò)分析谷歌搜索引擎每天數(shù)十億的搜索數(shù)據(jù),告訴用戶某一關(guān)鍵詞或者話題各個(gè)時(shí)期下在谷歌搜索引擎中展示的頻率及其相關(guān)統(tǒng)計(jì)數(shù)據(jù)。
我們?yōu)橐晃豢蛻暨M(jìn)行了短暫的咨詢工作,他正在構(gòu)建一個(gè)主要基于谷歌搜索詞熱度和就業(yè)率的分析應(yīng)用程序。
思路是這樣的: 用本科就業(yè)人數(shù)employed-bachelor的數(shù)據(jù)除以總就業(yè)人數(shù)employed-all的數(shù)據(jù),得出百分比,即本科就業(yè)率。
然后把關(guān)鍵詞“性別平等”(gender equality)的谷歌趨勢(shì)google trend的數(shù)據(jù)整合成月的, 兩個(gè)數(shù)據(jù)做成一個(gè)表格, 然后作pearson correlation相關(guān)性的分析,和可視化:



讀取數(shù)據(jù)
employedall=read.csv("employed-all.csv") ?employed_bachelor=read.csv("employed-bachelor.csv") ?google=read.csv("gender equality- google trend.csv",skip=4)

合并數(shù)據(jù)
把google trend的數(shù)據(jù)整合成月的
for(j in c("01","02","03","04","05","06","07","08","09","10","11","12")){ ?
? ym=paste(i,"-",j,sep="") ?
??? index=grep(ym, google$Week ) ?
??? monthsum=c(monthsum,sum(as.numeric(google$gender.equality[index])))

合并google trend的數(shù)據(jù)和就業(yè)數(shù)據(jù)
result=cbind(monthsum,employed$proportion)

分析相關(guān)性可視化

Pearson's相關(guān)性檢驗(yàn)
在統(tǒng)計(jì)學(xué)中,皮爾遜相關(guān)系數(shù),是用于度量?jī)蓚€(gè)變量X和Y之間的相關(guān)(線性相關(guān)),其值介于-1與1之間,其絕對(duì)值越大說(shuō)明該兩個(gè)變量越相關(guān)。
cor.test(result$employed,result$google)

首先看Y與X是否有顯著關(guān)系,即P值大小,接著分析相關(guān)關(guān)系為正向或負(fù)向,也可通過(guò)相關(guān)系數(shù)大小說(shuō)明關(guān)系緊密程度。一般相關(guān)系數(shù)在0.7以上說(shuō)明關(guān)系非常緊密。p<0.01,因而說(shuō)明本科就業(yè)率和性別平等搜索熱度之間有著顯著的正相關(guān)關(guān)系。

最受歡迎的見解
1.R語(yǔ)言多元Logistic邏輯回歸 應(yīng)用案例
2.面板平滑轉(zhuǎn)移回歸(PSTR)分析案例實(shí)現(xiàn)
3.matlab中的偏最小二乘回歸(PLSR)和主成分回歸(PCR)
4.R語(yǔ)言泊松Poisson回歸模型分析案例
5.R語(yǔ)言回歸中的Hosmer-Lemeshow擬合優(yōu)度檢驗(yàn)
6.r語(yǔ)言中對(duì)LASSO回歸,Ridge嶺回歸和Elastic Net模型實(shí)現(xiàn)
7.在R語(yǔ)言中實(shí)現(xiàn)Logistic邏輯回歸
8.python用線性回歸預(yù)測(cè)股票價(jià)格
9.R語(yǔ)言如何在生存分析與Cox回歸中計(jì)算IDI,NRI指標(biāo)