全國POI邊界數(shù)據(jù),AOI數(shù)據(jù)2.0

? ? 在之前我的一篇文章專欄中,為大家介紹了AOI數(shù)據(jù),以及展示了部分AOI數(shù)據(jù)樣例。
大家可以移步這個(gè)鏈接
? ? https://www.bilibili.com/read/cv18076900?from=search&spm_id_from=333.337.0.0
? ? 不過后來有拿到數(shù)據(jù)的小伙伴問我,這個(gè)分類標(biāo)準(zhǔn)是什么呢,為什么和高德的分類標(biāo)準(zhǔn)不一樣。AOI和POI不是一一對應(yīng)的嗎。針對這些問題,這里來做一下統(tǒng)一解答。
1、AOI和POI是一一對應(yīng)的嗎?
? ? 要回答這個(gè)問題,還是要重新解釋下POI和AOI是什么,之前很多小伙伴問我,你們的POI數(shù)據(jù)為什么沒有路網(wǎng)呢,為什么沒有建筑呢。面對這些問題真的是不勝其煩,POI里面的“P”就是“Point”的意思,也就是一個(gè)點(diǎn),它僅包含了單組坐標(biāo)。舉個(gè)很簡單的例子,比如下圖中的國際投資大廈,他在地圖上僅以一個(gè)圖標(biāo)和名稱來標(biāo)注其實(shí)際位置,這便是一個(gè)POI興趣點(diǎn)。

? ? 然后回頭來說說AOI,AOI里的"A"是"Area"的意思,也就是興趣面,它包含了很多組坐標(biāo)組成的邊界范圍,它主要用于在地圖中表達(dá)區(qū)域狀的地理實(shí)體。下圖中的藍(lán)色虛線便是一個(gè)AOI數(shù)據(jù)。

? ? 因此,POI數(shù)據(jù)不包含路網(wǎng),建筑等相關(guān)信息,它僅僅是一個(gè)代表著某一個(gè)單位的位置點(diǎn)。?
? ? 那么POI和AOI是不是一一對應(yīng)呢,理論上是一一對應(yīng)的,但實(shí)際上并不是,也不可能一一對應(yīng)。比如一棟寫字樓上的眾多公司或組織,他們可能在地圖上都有POI點(diǎn)信息,但是卻不可能在地圖上都有AOI面信息。因?yàn)樵诘貓D的二維平面上,寫字樓實(shí)實(shí)在在就占據(jù)在那里,寫字樓內(nèi)部的公司或組織已經(jīng)不可能達(dá)到再細(xì)化成AOI面的程度了。
? ? 再比如街邊的店鋪、公交站、路標(biāo)等,他們也都有自己的POI點(diǎn)信息,但是卻不可能每個(gè)都有自己的AOI面信息,因?yàn)檫@些單位所占據(jù)的面積實(shí)在太小,沒有細(xì)化成AOI面的意義了。
2、AOI數(shù)據(jù)長什么樣子?
? ??AOI的數(shù)據(jù)主要來自三個(gè)平臺(tái),高德地圖、百度地圖和OpenMapStreet(OSM)地圖,這里逐一展示下。
其一,OSM地圖
? ? OSM地圖的矢量數(shù)據(jù)是志愿者自行上傳的,缺點(diǎn)是內(nèi)容覆蓋程度遠(yuǎn)遠(yuǎn)沒有國內(nèi)兩大地圖巨頭來的豐富,且里面一些關(guān)鍵屬性比如name很多為空,導(dǎo)致數(shù)據(jù)可用性不佳。

? ? 當(dāng)然優(yōu)點(diǎn)是獲取簡單,因?yàn)槭枪_免費(fèi)下載的,小伙伴可以自行去了解下。
其二,高德地圖
? ? 高德地圖的AOI數(shù)據(jù)遠(yuǎn)比OSM的豐富,基本上是可以“變成AOI的POI都變成了AOI”,當(dāng)然也不排除有遺漏的情況,畢竟數(shù)據(jù)采集工作非兩三個(gè)人兩三天就能完成的,它是一個(gè)漫長的過程。而且這個(gè)數(shù)據(jù)另外一大價(jià)值是,高德地圖的住宅類AOI數(shù)據(jù)包含了這個(gè)小區(qū)的建筑年份、容積率、綠化率、房價(jià)等一系列屬性。

其三,百度地圖
? ? 百度地圖的AOI豐富程度相比高德地圖相當(dāng),或者說兩個(gè)地圖各有利弊,也存在“我有的你沒有,你有的我沒有”這種情況。但是相較于高德地圖,百度地圖的AOI數(shù)據(jù)則簡單了一些。住宅類的數(shù)據(jù)中沒有建筑年份、容積率、綠化率、房價(jià)等屬性,但是個(gè)別城市或單位,尤其是區(qū)縣級(jí)城市的數(shù)據(jù)中包含了這個(gè)AOI的所屬街道,這是高德地圖沒有的。

3、數(shù)據(jù)不準(zhǔn)確怎么辦
? ? 很多在我這里拿到AOI數(shù)據(jù)的同學(xué)往往會(huì)問我,這個(gè)AOI邊界不對啊,明明是正方形,你這為什么是長方形?要知道我并不是數(shù)據(jù)的生產(chǎn)方,我只是負(fù)責(zé)把數(shù)據(jù)從高德地圖或者百度地圖拿下來,至于他們?yōu)槭裁磿?huì)把邊界采集成這個(gè)樣子我也不太清楚,大家發(fā)現(xiàn)錯(cuò)誤后積極使用地圖的糾錯(cuò)功能,幫助國內(nèi)兩大地圖完善自有數(shù)據(jù)。
4、AOI數(shù)據(jù)怎么獲?。?/strong>
OSM地圖
? ? 這個(gè)上文提到,OSM數(shù)據(jù)已經(jīng)公開免費(fèi)下載,大家可以自行百度。
高德地圖和百度地圖
? ? 首先國內(nèi)兩大地圖巨頭的開放平臺(tái)中同樣沒有開放數(shù)據(jù)獲取的API,不同于POI,POI數(shù)據(jù)可以通過其開放的web服務(wù)地名檢索接口進(jìn)行獲取。
? ? 這里需要重點(diǎn)強(qiáng)調(diào)一下,不管是高德地圖還是百度地圖,其用戶說明里均寫明了僅為用戶提供接口調(diào)用的服務(wù),用戶不可以違規(guī)將數(shù)據(jù)保存在自己本地,否則當(dāng)官方檢測出短時(shí)間內(nèi)用戶接口進(jìn)行了大量調(diào)用的時(shí)候,那么您的個(gè)人開發(fā)者賬號(hào)很可能馬上會(huì)被封停。
? ? 再回頭說一下數(shù)據(jù)獲取,上文提到POI可以直接獲取下來,但是AOI卻不可以,只能運(yùn)用爬蟲技術(shù)去分析高德地圖或百度地圖網(wǎng)頁上的數(shù)據(jù)查詢邏輯,然后找到其規(guī)律,通過代碼將其批量保存到本地。
? ?那么為什么這兩個(gè)地圖放在一起說呢,因?yàn)槠渑廊≡砭哂幸欢ǖ南嗨菩?,首先每個(gè)POI都有其自己的唯一標(biāo)識(shí),也被稱為主鍵。高德POI的主鍵是ID,內(nèi)容一般為B0FFFKHNP0這種樣子、百度POI的主鍵為UID,一般是8cba4bb0dcf02585ac0457ba這種。等獲取到主鍵之后,再將主鍵作為參數(shù)去調(diào)用數(shù)據(jù)查詢接口,然后將返回的結(jié)果保存到本地。
? ? 也就是說,要想獲取AOI數(shù)據(jù),首先您得有一份POI數(shù)據(jù),AOI數(shù)據(jù)獲取的豐富程度取決于您的POI數(shù)據(jù)豐富程度。
? ? 那么就衍生出一個(gè)問題,上文提到POI和AOI不是一一對應(yīng)的,那豈不是有相當(dāng)一部分POI的主鍵檢索不到AOI?? 答案是肯定的,2萬條POI數(shù)據(jù)檢索下來AOI或許也就1千條,相當(dāng)于我投入2萬塊錢只回來1千塊錢。但事實(shí)就是如此。
? ? 不過好在數(shù)據(jù)獲取途徑是有的,多付出一點(diǎn)時(shí)間也沒關(guān)系,但實(shí)際上并不是如此,就拿高德地圖來說,高德地圖有著出色的反爬機(jī)制,當(dāng)您調(diào)用其AOI數(shù)據(jù)接口調(diào)用次數(shù)過多的時(shí)候,就會(huì)彈出滑塊驗(yàn)證碼讓您驗(yàn)證,而這個(gè)滑塊驗(yàn)證碼經(jīng)過我與高德地圖漫長的斗智斗勇后發(fā)現(xiàn),基本是無法攻破的,換言之,高德地圖的AOI數(shù)據(jù)要想全量爬取下來,基本是不現(xiàn)實(shí)的,不過如果有小伙伴有思路了,可以私聊我,我們一起探討下。
? ? 但是百度地圖不一樣,百度地圖的AOI檢索接口沒有驗(yàn)證機(jī)制,因此理論上可以無限調(diào)用直到AOI數(shù)據(jù)全部獲取下來,但是我們知道檢索AOI需要用到POI數(shù)據(jù),但是百度地圖的POI數(shù)據(jù)太難獲取了,百度地圖的個(gè)人開發(fā)者賬號(hào)日用額度已經(jīng)下降到了100次/天,也就說,獲取一年您連一個(gè)小城市的POI數(shù)據(jù)都難全部獲取下來,更何況每天調(diào)用次數(shù)超標(biāo)之后,還有被封停的風(fēng)險(xiǎn)。
? ? 總結(jié)一下,1、AOI數(shù)據(jù)需要先拿到POI數(shù)據(jù),然后通過POI數(shù)據(jù)的ID去調(diào)用AOI數(shù)據(jù)查詢接口,然后將接口返回結(jié)果保存下來。2、高德地圖POI數(shù)據(jù)獲取方便,AOI數(shù)據(jù)獲取困難。3、百度地圖POI數(shù)據(jù)獲取困難,AOI數(shù)據(jù)獲取方便。
? ?為大家貼兩個(gè)都是我親身驗(yàn)證過的,可行的數(shù)據(jù)獲取方法鏈接:
百度地圖
https://www.cnblogs.com/zhangqinglan/p/13301425.html
高德地圖
https://blog.csdn.net/Smart3S/article/details/88606789
5、這篇文章為什么叫AOI2.0?
? ? 在上篇文章中,我給大家展示了1.0版本的AOI數(shù)據(jù),屬性內(nèi)容僅包含AOI的名稱,分類等屬性,且分類引用的第三方分類標(biāo)準(zhǔn),非高德與百度自有的分類。因此很多小伙伴使用起來不方便,因此在2.0版本中,我直接將百度自有的分類引用到AOI數(shù)據(jù)中,并且將屬性補(bǔ)充齊全,并且按照每一種分類進(jìn)行了分組。


6、AOI數(shù)據(jù)全嗎
? ??這也是一個(gè)大家經(jīng)常問的問題,AOI數(shù)據(jù)全嗎?也全,也不全,因?yàn)樯衔奶岬搅薃OI數(shù)據(jù)的獲取邏輯,首先得有一份POI數(shù)據(jù),而AOI數(shù)據(jù)的豐富程度取決于POI數(shù)據(jù)的豐富程度,因此不敢保證比如北京市的AOI數(shù)據(jù)就是百度地圖上北京市所有的AOI數(shù)據(jù),如果大家看到誰手上有全量的AOI數(shù)據(jù),那基本就是兩種可能:1,數(shù)據(jù)直接來自商業(yè)采購,購買的百度或者高德的數(shù)據(jù);2,吹牛皮大王。但我相信本人手頭上的POI數(shù)據(jù)相信原比各位要豐富,本人能獲取到的AOI數(shù)據(jù)豐富程度也絕對是能夠幫助各位完成論文、項(xiàng)目、課題的程度的,大家對于數(shù)據(jù)的豐富性可以不用懷疑。
7、AOI數(shù)據(jù)免費(fèi)提供嗎
? ? 其實(shí)數(shù)據(jù)的獲取方法在上文第4章中已經(jīng)提到過,而且數(shù)據(jù)獲取的方法也是本人親身驗(yàn)證過可行的,就連本人現(xiàn)在的數(shù)據(jù)獲取方法也是借用上面鏈接的思路進(jìn)行代碼再造得到,相信動(dòng)手能力強(qiáng)的小伙伴可以自行去獲取,但是肯定有一部分小伙伴不想再費(fèi)心去學(xué)習(xí)了,這也可以理解,畢竟假設(shè)我是一個(gè)餐飲行業(yè)的,我想看看店開在哪里比較好,我為什么還要費(fèi)心費(fèi)力去學(xué)習(xí)代碼呢,畢竟學(xué)了可能就用這一次,成本效益太低。
? ? 對于此類小伙伴,可以聯(lián)系作者本人了,作者本人提供的是有償?shù)臄?shù)據(jù)提供服務(wù),畢竟數(shù)據(jù)獲取不易,里面本身就有一些時(shí)間成本、金錢成本、風(fēng)險(xiǎn)在里面,就拿POI數(shù)據(jù)來說,目前高德的免費(fèi)額度為3000次/日,而單一個(gè)地級(jí)市就需要幾萬次的調(diào)用,因此不得不成為付費(fèi)用戶。AOI數(shù)據(jù)更是需要大量的時(shí)間來獲取。
? ? 但是即使如此,數(shù)據(jù)的價(jià)格肯定也是在大家能夠承受的范圍內(nèi),數(shù)據(jù)的主要受眾群體還是廣大的大學(xué)生,城鄉(xiāng)規(guī)劃從業(yè)者,換言之也是我的同事們,或者未來的同事,我很愿意看到大家進(jìn)入城鄉(xiāng)規(guī)劃、地理信息這個(gè)行業(yè),因此價(jià)格也在即使是一個(gè)學(xué)生也能承受的范圍內(nèi)。
8、可以提供技術(shù)指導(dǎo)嗎
? ? 從我這里獲取數(shù)據(jù)的小伙伴們提供終身的技術(shù)指導(dǎo),包括一些學(xué)術(shù)方面,技術(shù)方面的探究等,在我?guī)椭愕耐瑫r(shí),也提高了我自身的技術(shù)。
9、數(shù)據(jù)獲取鏈接
鏈接:https://pan.baidu.com/s/16zAn0M-A-nMMsYLEnydVdg?pwd=1234?
提取碼:1234?