R語言Pearson相關(guān)性分析就業(yè)率和“性別平等”谷歌搜索熱度google trend時間序列數(shù)據(jù)可
全文鏈接:http://tecdat.cn/?p=31585
原文出處:拓端數(shù)據(jù)部落公眾號
Google Trends, 即谷歌趨勢。谷歌趨勢是谷歌旗下一款基于搜索數(shù)據(jù)推出的一款分析工具。它通過分析谷歌搜索引擎每天數(shù)十億的搜索數(shù)據(jù),告訴用戶某一關(guān)鍵詞或者話題各個時期下在谷歌搜索引擎中展示的頻率及其相關(guān)統(tǒng)計數(shù)據(jù)。
我們?yōu)橐晃豢蛻暨M行了短暫的咨詢工作,他正在構(gòu)建一個主要基于谷歌搜索詞熱度和就業(yè)率的分析應用程序。
思路是這樣的: 用本科就業(yè)人數(shù)employed-bachelor的數(shù)據(jù)除以總就業(yè)人數(shù)employed-all的數(shù)據(jù),得出百分比,即本科就業(yè)率。
然后把關(guān)鍵詞“性別平等”(gender equality)的谷歌趨勢google trend的數(shù)據(jù)整合成月的, 兩個數(shù)據(jù)做成一個表格, 然后作pearson correlation相關(guān)性的分析,和可視化:



讀取數(shù)據(jù)
employedall=read.csv("employed-all.csv") ?employed_bachelor=read.csv("employed-bachelor.csv") ?google=read.csv("gender equality- google trend.csv",skip=4)

合并數(shù)據(jù)
把google trend的數(shù)據(jù)整合成月的
for(j in c("01","02","03","04","05","06","07","08","09","10","11","12")){ ?
? ym=paste(i,"-",j,sep="") ?
??? index=grep(ym, google$Week ) ?
??? monthsum=c(monthsum,sum(as.numeric(google$gender.equality[index])))

合并google trend的數(shù)據(jù)和就業(yè)數(shù)據(jù)
result=cbind(monthsum,employed$proportion)

分析相關(guān)性可視化

Pearson's相關(guān)性檢驗
在統(tǒng)計學中,皮爾遜相關(guān)系數(shù),是用于度量兩個變量X和Y之間的相關(guān)(線性相關(guān)),其值介于-1與1之間,其絕對值越大說明該兩個變量越相關(guān)。
cor.test(result$employed,result$google)

首先看Y與X是否有顯著關(guān)系,即P值大小,接著分析相關(guān)關(guān)系為正向或負向,也可通過相關(guān)系數(shù)大小說明關(guān)系緊密程度。一般相關(guān)系數(shù)在0.7以上說明關(guān)系非常緊密。p<0.01,因而說明本科就業(yè)率和性別平等搜索熱度之間有著顯著的正相關(guān)關(guān)系。

最受歡迎的見解
1.R語言多元Logistic邏輯回歸 應用案例
2.面板平滑轉(zhuǎn)移回歸(PSTR)分析案例實現(xiàn)
3.matlab中的偏最小二乘回歸(PLSR)和主成分回歸(PCR)
4.R語言泊松Poisson回歸模型分析案例
5.R語言回歸中的Hosmer-Lemeshow擬合優(yōu)度檢驗
6.r語言中對LASSO回歸,Ridge嶺回歸和Elastic Net模型實現(xiàn)
7.在R語言中實現(xiàn)Logistic邏輯回歸
8.python用線性回歸預測股票價格
9.R語言如何在生存分析與Cox回歸中計算IDI,NRI指標