高德POI分類爬取,從未如此簡(jiǎn)單!
大家好,我是南南

POI想必是諸位常用的數(shù)據(jù)之一了,不知道大家是怎么獲取的呢?
想必是和南南一樣,用規(guī)劃云比較多吧

但是規(guī)劃云的局限性很大,因為他是用關(guān)鍵字搜索的,并且網(wǎng)頁版工具抓取的POI數(shù)量在2000以下,不完全,可用作簡(jiǎn)單分析。
所以,我們真正需要的poi檢索工具是可以根據(jù)類別進(jìn)行獲取的,下為我爬取的長(zhǎng)春市餐飲poi

這就需要運(yùn)用到另一個(gè)工具,python。很多粉絲會(huì)感到很難,因為不會(huì)寫代碼,這并沒有關(guān)系,因為我也不會(huì)。
我只會(huì)抄代碼,一般我這種人俗稱——腳本小子
能用就行,有現(xiàn)成的干嘛要自己寫,對(duì)吧

這里就要祭出我書簽百寶箱之爬蟲篇,百度高德POI數(shù)據(jù)獲取程序

本項(xiàng)目來自github,下為項(xiàng)目地址
https://github.com/liujiao111/poi
該項(xiàng)目提供了百度高德poi獲取程序,并支持自動(dòng)轉(zhuǎn)換為WGS84坐標(biāo)系,目前我只嘗試了高德地圖的poi爬取程序,該作者提供了省poi爬取,矩形選區(qū)poi爬取,市poi爬取
使用方法非常簡(jiǎn)單,執(zhí)行命令python?app.py
?即可開始爬取數(shù)據(jù),不過由于范圍大小、以及POI數(shù)量多少不一樣,爬取花費(fèi)的時(shí)間也不一樣,范圍越大,POI數(shù)量越多,花費(fèi)的時(shí)間越長(zhǎng)。比如爬取省的花費(fèi)時(shí)間比爬一個(gè)城市花費(fèi)的要長(zhǎng),爬取餐廳比爬圖書館花費(fèi)的時(shí)間長(zhǎng)。

當(dāng)然,也需要一丟丟小的設(shè)置,比如輸入你的key(自行前往高德開放平臺(tái)申請(qǐng)),poi類型,以及城市(省份)

當(dāng)然,不要忘了安裝你所使用的包
pip?install?xxx
雖然該程序很棒,但是獲得的poi結(jié)果也許并不是那么詳細(xì),這是由于高德地圖的局限性導(dǎo)致的,商業(yè)地圖軟件中的poi一般為商家將自己的地址發(fā)布到地圖上,有些商家會(huì)發(fā)布到百度地圖,有些會(huì)發(fā)布到高德地圖,有些不會(huì)發(fā)布(是真的不懂)
這里以我的大學(xué)長(zhǎng)春建筑學(xué)院為例,這是我們學(xué)校的商業(yè)街,但全校卻只有這一個(gè)poi點(diǎn)

下為我校對(duì)面的長(zhǎng)春旅游學(xué)院,這個(gè)對(duì)比很明顯。所以如果你需要精確的poi數(shù)據(jù),我推薦你綜合百度地圖等商業(yè)地圖的數(shù)據(jù)來進(jìn)行處理

另外,在代碼中的分類和城市須嚴(yán)格按照高德地圖的分類編碼表進(jìn)行輸入,當(dāng)然作者也給我們提供了這些表格的excel?文件
POI分類編碼表.xlsx
高德地圖城市編碼表.xlsx

關(guān)于源代碼下載,我一向是不屑干那些轉(zhuǎn)發(fā)集贊獲取的事。秉承著授之以漁的理念,本號(hào)依舊不提供代碼相關(guān)數(shù)據(jù)的下載服務(wù),清大家自行前往GitHub進(jìn)行下載
https://github.com/liujiao111/poi

寫文不易,請(qǐng)多多點(diǎn)贊轉(zhuǎn)發(fā)支持,關(guān)注我,帶你學(xué)習(xí)更多有意思的小知識(shí)
