最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

關(guān)注疫情數(shù)據(jù),用Excel竟然只需這三步!

2020-02-17 21:37 作者:愛數(shù)據(jù)分析社區(qū)  | 我要投稿

大家好,近期有收到一些朋友留言,表示自己是做數(shù)據(jù)分析的工作,也想自己關(guān)注所在地區(qū)的疫情數(shù)據(jù),問(wèn)我怎么能方便地獲取疫情的數(shù)據(jù),本文就給大家介紹一下用Excel獲取疫情數(shù)據(jù)的簡(jiǎn)單技能。

先搞清楚疫情數(shù)據(jù)的來(lái)源在哪里?

關(guān)注疫情的數(shù)據(jù),官方的公布渠道就是通過(guò)國(guó)家衛(wèi)健委、各省市區(qū)衛(wèi)健委公布的信息,所以我們首先應(yīng)該是考慮能不能從衛(wèi)健委的網(wǎng)站獲取數(shù)據(jù)?

例如下圖是國(guó)家衛(wèi)健委官網(wǎng)(http://www.nhc.gov.cn/)發(fā)布的頁(yè)面:

如果你要用工具獲取以上頁(yè)面中的數(shù)據(jù),就是需要抓取到上面的這串文本,然后通過(guò)文本關(guān)鍵字分析,提取出其中的關(guān)鍵數(shù)據(jù)出來(lái),再整理成結(jié)構(gòu)化數(shù)據(jù),才能用于數(shù)據(jù)的分析。

同理,如果你要獲取某個(gè)省的疫情數(shù)據(jù),也可以通過(guò)省級(jí)衛(wèi)健委官網(wǎng)公布的數(shù)據(jù),去提取整理。例如以下就是廣東省衛(wèi)健委公布的情況信息:

對(duì)于大多數(shù)人來(lái)說(shuō),這樣去整理數(shù)據(jù)確實(shí)費(fèi)時(shí)費(fèi)力,技能也不一定跟得上,但是要自己獲取這些數(shù)據(jù)的話,首先我們確實(shí)是這樣考慮的,畢竟衛(wèi)健委的是一手?jǐn)?shù)據(jù),質(zhì)量也能保障。但是由于技術(shù)難度相對(duì)較大,所以這種方法本文就不介紹了。

如果暫時(shí)沒(méi)有條件直接獲取到官方數(shù)據(jù)的話,我們還可以獲取別人整理好的數(shù)據(jù),例如騰訊、阿里、新浪、丁香園、網(wǎng)易、百度等等,他們都有對(duì)應(yīng)的疫情數(shù)據(jù)頁(yè)面,而且是國(guó)家,省,市級(jí)的數(shù)據(jù)都已經(jīng)整理好了,所以我們可以想辦法從他們的頁(yè)面中獲取你要的數(shù)據(jù)。

以下就開始,給大家介紹簡(jiǎn)單的數(shù)據(jù)獲取方法:

我們打開騰訊新聞的界面(https://news.qq.com/zt2020/page/feiyan.htm),里面是有全國(guó)的數(shù)據(jù),有分省的數(shù)據(jù),有市級(jí)的數(shù)據(jù)等,非常詳細(xì)。(可以看到它們的數(shù)據(jù)來(lái)源,也是寫著來(lái)源于衛(wèi)健委發(fā)布的信息)

網(wǎng)頁(yè)地址找到了,接下來(lái)就是用什么工具來(lái)獲???

工具其實(shí)是靈活的,看你熟悉使用哪個(gè),Python可以,VBA也可以,或者其他編程語(yǔ)言都行。但我們今天用的工具,非常簡(jiǎn)單,直接用Excel的Power Query功能來(lái)實(shí)現(xiàn)(Excel 2016以上默認(rèn)是內(nèi)置此功能的),以下介紹操作的步驟:

Step1:找到數(shù)據(jù)的真正地址。剛才我們只是拿到了頁(yè)面的地址,但這個(gè)地址中并沒(méi)有包含我們要的數(shù)據(jù)。怎么找?

這就需要你具備一定的網(wǎng)站數(shù)據(jù)傳輸知識(shí)了,有興趣的朋友可以百度“Chrome抓包分析”去了解更多。我在這里就直接提供我獲取到的2個(gè)地址給大家參考使用:

省數(shù)據(jù):https://api.inews.qq.com/newsqa/v1/query/pubished/daily/list?province=湖北

市數(shù)據(jù):https://api.inews.qq.com/newsqa/v1/query/pubished/daily/list?province=湖北&city=武漢

有些朋友應(yīng)該看懂了地址,你想看湖北的數(shù)據(jù),就寫湖北,想看廣東的就改成廣東,城市也是改成自己想看的城市名稱即可。

(截至發(fā)稿,地址是正常的,不排除后續(xù)網(wǎng)站運(yùn)營(yíng)者會(huì)更改)

Step2:用PQ來(lái)獲取數(shù)據(jù)。如果你看不到以下界面,證明你沒(méi)有PQ的功能。(沒(méi)有這個(gè)功能也不用擔(dān)心,文末提供了直接下載數(shù)據(jù)的方法)

按下確定后,就可以進(jìn)入以下界面了,事情就變得簡(jiǎn)單了,直接通過(guò)手工操作即可轉(zhuǎn)換好數(shù)據(jù)。

Step3:最后一步就是“關(guān)閉并上載”到新工作表即可。

夠簡(jiǎn)單吧?!然后你需要整理一些標(biāo)準(zhǔn)日期,還有字段名稱等,這里就不贅述了。

用PQ實(shí)現(xiàn)的好處是,每天你只需要刷新一下表格,即可自動(dòng)更新數(shù)據(jù)了,會(huì)非常方便。

當(dāng)然其實(shí)PQ并不是專業(yè)的爬蟲工具,對(duì)于一些復(fù)雜的網(wǎng)頁(yè)要獲取數(shù)據(jù),它并不能都解決。同時(shí)對(duì)于很多沒(méi)學(xué)過(guò)網(wǎng)頁(yè)知識(shí)的朋友來(lái)說(shuō),其實(shí)網(wǎng)頁(yè)數(shù)據(jù)的爬取,工具本身一般不需要太深的技術(shù),最難的是一些網(wǎng)站網(wǎng)頁(yè)的相關(guān)知識(shí),對(duì)數(shù)據(jù)獲取有興趣的朋友,可以自己深入學(xué)習(xí)下這方面的知識(shí)。

趕緊動(dòng)手試試,按上面的步驟,獲取自己所屬地區(qū)的數(shù)據(jù)來(lái)分析看看吧 ~

end.

作者:劉振雄.

想了解更多數(shù)據(jù)分析內(nèi)容請(qǐng)掃描下方二維碼


關(guān)注疫情數(shù)據(jù),用Excel竟然只需這三步!的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
和龙市| 荣成市| 博罗县| 沙洋县| 嘉义市| 顺平县| 武清区| 泸州市| 山阳县| 通海县| 凤凰县| 油尖旺区| 衡阳县| 奇台县| 苏尼特右旗| 昌吉市| 五指山市| 历史| 凤山市| 文登市| 阳曲县| 浑源县| 屯留县| 行唐县| 迁西县| 澎湖县| 云和县| 河北区| 始兴县| 收藏| 潜江市| 福贡县| 遵义县| 景泰县| 岱山县| 枝江市| 普兰县| 吉林省| 东安县| 文山县| 平塘县|