最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

杭州珍瓚傳媒/大眾點(diǎn)評的美食數(shù)據(jù)分析

2023-03-29 10:27 作者:時(shí)光裁縫鋪  | 我要投稿

前言

近年來,隨著互聯(lián)網(wǎng)的不斷發(fā)展,使用互聯(lián)網(wǎng)的人數(shù)不斷上升,大眾點(diǎn)評網(wǎng)首創(chuàng)并領(lǐng)導(dǎo)的第三方評論模式已成為互聯(lián)網(wǎng)的一個(gè)新熱點(diǎn)。 大眾點(diǎn)評移動客戶端通過移動互聯(lián)網(wǎng),結(jié)合地理位置以及網(wǎng)友的個(gè)性化消費(fèi)需求,為網(wǎng)友隨時(shí)隨地提供餐飲、購物、休閑娛樂及生活服務(wù)等領(lǐng)域的商戶信息、消費(fèi)優(yōu)惠以及發(fā)布消費(fèi)評價(jià)的互動平臺,大眾點(diǎn)評移動客戶端已成為人們本地生活必備工具。而大眾點(diǎn)評的數(shù)據(jù)也蘊(yùn)含著大量的信息,值得數(shù)據(jù)研究者們進(jìn)行挖掘和分析。

本實(shí)驗(yàn)將使用python以及pyecharts對大眾點(diǎn)評的12個(gè)城市的美食數(shù)據(jù)進(jìn)行分析,包括食分布分析、美食類型分析、美食價(jià)格分析和美食評分分析等。以期能揭示當(dāng)前國民飲食偏好的一些規(guī)律,為后續(xù)的研究提供一定的參考。

01 概述?

1.1 大眾點(diǎn)評概述

大眾點(diǎn)評網(wǎng)于2003年4月成立于上海。大眾點(diǎn)評是中國領(lǐng)先的本地生活信息及交易平臺,也是全球最早建立的獨(dú)立第三方消費(fèi)點(diǎn)評網(wǎng)站。大眾點(diǎn)評不僅為用戶提供商戶信息、消費(fèi)點(diǎn)評及消費(fèi)優(yōu)惠等信息服務(wù),同時(shí)亦提供團(tuán)購、餐廳預(yù)訂、外賣及電子會員卡等O2O(Online To Offline)交易服務(wù)。

截止到2015年第一季度,大眾點(diǎn)評月活躍用戶數(shù)超過2億,收錄商戶數(shù)量超過1400萬家,覆蓋全國2500多個(gè)城市及美國、日本、法國等近百個(gè)熱門旅游國家和地區(qū)。除上??偛恐猓蟊婞c(diǎn)評已經(jīng)在北京、廣州、天津、杭州、南京等160多座城市設(shè)立分支機(jī)構(gòu)。

大眾點(diǎn)評月綜合瀏覽量(網(wǎng)站及移動設(shè)備)超過150億,其中移動客戶端的瀏覽量超過85%,移動客戶端累計(jì)獨(dú)立用戶數(shù)超過2億

因此就美食領(lǐng)域而言,大眾點(diǎn)評是當(dāng)之無愧的巨頭,其擁有的包含用戶數(shù)據(jù)、商戶數(shù)據(jù)、評價(jià)數(shù)據(jù)等的大型數(shù)據(jù)庫蘊(yùn)含著巨大的財(cái)富,吸引了眾多數(shù)據(jù)愛好者對其數(shù)據(jù)進(jìn)行挖掘和分析,以從中獲得各種飲食規(guī)律。



1.2 實(shí)驗(yàn)?zāi)康?/strong>

通過對大眾點(diǎn)評數(shù)據(jù)的分析,獲得各地人民的飲食偏好、全國人民的飲食偏好、店鋪價(jià)格、店鋪評分等規(guī)律,從而對國民的飲食習(xí)慣有一個(gè)較為深入的了解。


1.3 實(shí)驗(yàn)思路

此實(shí)驗(yàn)的實(shí)現(xiàn)分為以下幾個(gè)步驟:

(1)數(shù)據(jù)的獲取

找到大眾點(diǎn)評可用的數(shù)據(jù)接口或者一些沒有設(shè)置反爬措施的網(wǎng)頁,對各地?zé)衢T的餐廳信息進(jìn)行獲取,并存儲到本地上。

(2)數(shù)據(jù)處理

對獲取到的信息進(jìn)行清洗,去除無意義和無用的信息。同時(shí)對收集到的信息的有用條目進(jìn)行組織,做出必要的處理或者更改。

(3)可視化分析

使用可視化工具,對經(jīng)過處理的數(shù)據(jù)進(jìn)行可視化分析,從中歸納出規(guī)律。

(4)形成結(jié)果

將可視化的圖像整合,形成一個(gè)完整的大屏可視化結(jié)果;同時(shí)將每個(gè)圖所得出的結(jié)論根據(jù)完整的可視化結(jié)果進(jìn)行重新組織,以形成最終的分析結(jié)論。


1.4 實(shí)驗(yàn)意義

此次對大眾點(diǎn)評數(shù)據(jù)的分析主要從以下四個(gè)大方面進(jìn)行分析:評分分析、地點(diǎn)分布分析、類型分析以及價(jià)格分析。

評分分析可以探尋熱門餐廳與評分之間的關(guān)系,即探討“網(wǎng)紅店鋪”與“優(yōu)質(zhì)店鋪”之間是否存在著完全的相關(guān)性。

地點(diǎn)分布分析可以幫助讀者探尋各地的美食熱門區(qū)域。

類型分析可以發(fā)現(xiàn)國民普遍青睞的美食類型,也可以通過對不同地區(qū)美食類型的分析來分析各個(gè)地區(qū)的差別。

價(jià)格分析可以看出目前人們的飲食消費(fèi)水平。

該實(shí)驗(yàn)對于了解國民的飲食習(xí)慣、各地的商圈特征等具有一定的意義。

02 數(shù)據(jù)收集

2.1 數(shù)據(jù)來源

由于大眾點(diǎn)評網(wǎng)站本身有反爬蟲的設(shè)置,在多次爬取數(shù)據(jù)后會被要求輸入驗(yàn)證碼,因此無法直接從它目前提供給用戶的網(wǎng)頁端中爬取有用的信息。與此同時(shí),網(wǎng)上提供的現(xiàn)成的各類大眾點(diǎn)評數(shù)據(jù)集的時(shí)效性不夠,大部分都是2018年以前的數(shù)據(jù),分析意義不大。所以爬取數(shù)據(jù)成為了這次實(shí)驗(yàn)的第一個(gè)挑戰(zhàn)。

在瀏覽了各類資料后,我終于找到了大眾點(diǎn)評的一個(gè)網(wǎng)頁,它可能是被目前的大眾點(diǎn)評網(wǎng)頁端所放棄的一個(gè)網(wǎng)頁,里面雖然同步更新了熱門店鋪信息,但是沒有進(jìn)行頁面的裝飾,也沒有設(shè)計(jì)反爬機(jī)制。對于每個(gè)城市,該頁面都會展示該地的美食排行榜,可以按照自己的需要進(jìn)行頁面的選擇。

本次實(shí)驗(yàn)我選擇了12個(gè)城市,分別是上海、北京、杭州、成都、重慶、西安、武漢、蘇州、廣州、深圳、南京、天津。這12個(gè)城市有著其對應(yīng)的城市ID,只需要對網(wǎng)址中最后的Rnakid進(jìn)行更改,就可以訪問對應(yīng)城市的頁面進(jìn)行數(shù)據(jù)的爬取。例如下圖的上海熱門美食排行榜,網(wǎng)址為:


2.2 獲取方式

我采用python編寫程序?qū)W(wǎng)頁中的數(shù)據(jù)進(jìn)行爬取。

代碼如下:



根據(jù)自己的數(shù)據(jù)需求,我選擇了店鋪名稱、地點(diǎn)、類別、口味評分、環(huán)境評分、服務(wù)評分、總體評分、平均價(jià)格和城市這幾類數(shù)據(jù),按照各個(gè)城市進(jìn)行組織分別存儲于csv文件中,同時(shí)為了分析的方便,又將所有的數(shù)據(jù)匯集起來存儲到一個(gè)新的csv文件中,命名為“nation.csv”。


2.3 獲取結(jié)果

爬取后的csv文件格式如下圖所示(以上海的數(shù)據(jù)為例):


03 可視化工具?

3.1 pyecharts簡介

Echarts 是個(gè)由百度開源的數(shù)據(jù)可視化,憑借著良好的交互性,精巧的圖表設(shè)計(jì),得到了眾多開發(fā)者的認(rèn)可。而 Python 是門富有表達(dá)力的語言,很適合用于數(shù)據(jù)處理。當(dāng)數(shù)據(jù)分析遇上數(shù)據(jù)可視化時(shí)pyecharts 誕生了。

它具有以下特性:

? 簡潔的API設(shè)計(jì),使用如絲滑般流暢,支持鏈?zhǔn)秸{(diào)用

? 囊括了30+種常見圖表,應(yīng)有盡有

??支持主流Notebook 環(huán)境,Jupyter Notebook 和JupyterLab

??可輕松集成至Flask, Django等主流Web框架

??高度靈活的配置項(xiàng),可輕松搭配出精美的圖表

??詳細(xì)的文檔和示例,幫助開發(fā)者更快的上手項(xiàng)目

??多達(dá)400+地圖文件以及原生的百度地圖,為地理數(shù)據(jù)可視化提供強(qiáng)有力的支持


3.2 選擇原因

選擇pyecharts的主要原因是我們在課程中進(jìn)行實(shí)操的便是pyecharts這個(gè)工具,相比于其他工具而言,我對它的熟悉程度要更高一點(diǎn)。而且通過對gallery案例的瀏覽,我發(fā)現(xiàn)pyecharts其實(shí)可以實(shí)現(xiàn)大部分的可視化功能,因此便選擇了pyecharts作為此次可視化大作業(yè)的工具。

04 可視化過程

4.1 數(shù)據(jù)處理

爬取后的數(shù)據(jù)已經(jīng)相對規(guī)整,基本不用再進(jìn)行其他的處理。唯一的處理就是在地圖可視化時(shí),需要將地點(diǎn)數(shù)據(jù)改為各自地點(diǎn)所對應(yīng)的區(qū),由于這一類目下的地點(diǎn)十分零散,我對各個(gè)城市的區(qū)域劃分也不是很了解,沒有辦法通過編程來實(shí)現(xiàn)自動數(shù)據(jù)處理的目的。所以最后這列數(shù)據(jù)是經(jīng)過了手動處理形成了規(guī)整的所屬區(qū)域格式的。


4.2 數(shù)據(jù)可視化

(1)繪制全國美食類型柱狀圖(以12個(gè)地區(qū)的數(shù)據(jù)代表全國)

對總體數(shù)據(jù)的美食類型進(jìn)行分析,而已概括出目前國民飲食偏好的較為普遍的規(guī)律。


由于要收集的是全部城市總體的數(shù)據(jù),于是選擇讀取“nation.csv”這一個(gè)數(shù)據(jù)文件。從文件中提取“類別”這一特征,加入到category列表中,并采用Counter來統(tǒng)計(jì)列表中各個(gè)元素的個(gè)數(shù),即各個(gè)美食類別的個(gè)數(shù)。將種類和數(shù)量分別存入datax和datay列表中。

使用pyecharts中的bar進(jìn)行柱狀圖的繪制。使用reversal_axis對柱狀圖的坐標(biāo)進(jìn)行翻轉(zhuǎn),變成了橫向的柱狀圖。為了使美食種類的標(biāo)簽得以完全顯示,使用rotate對標(biāo)簽進(jìn)行了旋轉(zhuǎn)。設(shè)置主題為VINTAGE,為了后續(xù)將不同的圖結(jié)合起來的一致性考慮。


(2)繪制各個(gè)地區(qū)的熱門美食類型top5

上一個(gè)柱狀圖顯示的是較為總體的熱門美食類型,但由于不同地區(qū)的消費(fèi)水平、地理環(huán)境等因素的不同,飲食偏好應(yīng)該會存在一定的差異,為了探究這一差異,我選擇繪制一個(gè)矩形樹圖。



由于矩形樹圖輸入的數(shù)據(jù)結(jié)構(gòu)比較復(fù)雜,并不是簡單的列表,所以需要對各個(gè)城市所提取出來的數(shù)據(jù)進(jìn)行轉(zhuǎn)換,轉(zhuǎn)換為“name: xxx, value: xxx, children: xxx”的格式。并將該數(shù)據(jù)送入到treemap中進(jìn)行繪圖。按照所需要的層數(shù)設(shè)置levels。

效果如下:


(3)繪制美食分布地圖

了解各地?zé)衢T餐廳的分布情況,有助于我們掌握各個(gè)城市的美食聚集區(qū)域,可以成為未來的旅游指引。

代碼如下:


在繪制地圖時(shí),我遇到了一個(gè)比較棘手的問題:pyecharts所提供的地圖精度不夠。我原來的設(shè)想是將所有城市的區(qū)域信息整合到一張中國地圖中,隨著鼠標(biāo)的放縮可以瀏覽各個(gè)城市美食的區(qū)域分布狀況。但是pyecharts提供的中國地圖最深只能到達(dá)省級,無法到達(dá)市級,更別說是市級下屬的區(qū)縣級。為了能夠到達(dá)各個(gè)區(qū)縣級,我只能采用分個(gè)的城市地圖,而不是總體的中國地圖。但由于我最后想呈現(xiàn)的效果是BI大屏的類型,所以不能將所有的城市地圖同時(shí)呈現(xiàn)在界面中,需要對界面做一定的隱藏,再根據(jù)交互來顯示用戶需要的信息。

所以這時(shí)我就想到了用tab對各個(gè)城市的地圖進(jìn)行一個(gè)分頁,然后在最后整合時(shí)再將這個(gè)tab頁面加入到page中。但這個(gè)想法在后來的實(shí)踐中也失敗了,因?yàn)樵?strong>pyecharts中tab和page是同級頁面,這意味著我無法將tab頁面加入到page中。

最后我發(fā)現(xiàn)了地圖中自帶的add方法可以將不同城市的地圖整合在一個(gè)頁面里,但它呈現(xiàn)的形式是所有地圖疊在一起,顯得很雜亂。在仔細(xì)研究了各個(gè)圖例如何顯示和隱藏后,我采用了is_selected參數(shù),對除了上海之外的城市圖例進(jìn)行了隱藏,只有當(dāng)點(diǎn)擊時(shí)其他城市的地圖才會顯示。這個(gè)方法也存在著缺陷,就是進(jìn)行地圖的轉(zhuǎn)換時(shí)需要點(diǎn)擊兩次(一次隱藏當(dāng)前地圖,一次顯示所需地圖),相比于tab的點(diǎn)擊切換功能來說操作的確有點(diǎn)繁瑣,但這已經(jīng)是在兼顧pyecharts的功能和界面的美觀程度下的最佳解決方法了。

效果如下:

(4)繪制水滴圖

動態(tài)的水滴圖可以反映某種事物的比例,在該實(shí)驗(yàn)中我將用水滴圖來反映高分店鋪比例以及高人均餐廳比例。


因?yàn)樗ǖ某跏碱伾珵樗{(lán)色,與整個(gè)主題的顏色不太符合,所以將水波的顏色改為粉紅色。


(5)繪制散點(diǎn)圖

散點(diǎn)圖主要是用來分析兩個(gè)指標(biāo)之間是否存在關(guān)聯(lián)性的圖像,在此實(shí)驗(yàn)中我選擇利用散點(diǎn)圖來探究人均價(jià)格與各城市GDP的關(guān)系,以及人均價(jià)格與評分之間的關(guān)系。



首先讀取每個(gè)城市的數(shù)據(jù),對人均價(jià)格進(jìn)行求和,計(jì)算每個(gè)城市的平均人均價(jià)格。然后讀取之前手動在網(wǎng)上收集2019年各個(gè)城市的GDP資料。分別作為x值和y值傳入scatter里面進(jìn)行繪圖。這里的難點(diǎn)在于當(dāng)鼠標(biāo)懸浮在散點(diǎn)上時(shí)顯示的tooltip文本內(nèi)容以及格式的處理。后來經(jīng)過對gallery中示例的查找,我發(fā)現(xiàn)在TooltipOpts中的formatter里面可以自定義文本的內(nèi)容以及樣式,但需要使用javascript語言,于是我對javascript的語法進(jìn)行了粗略的學(xué)習(xí),并且不斷地修改formatter中的參數(shù)以觀察不同參數(shù)的含義以及效果,最后終于完成了我想要的效果。


(6)繪制餅圖

餅圖是用來反映比例的圖像,在該實(shí)驗(yàn)中,餅圖繪制的是全體熱門餐廳中的評分比例,可以用來分析熱門餐廳的總體水平。


為了使整個(gè)頁面不至于太單調(diào),我將餅狀圖設(shè)計(jì)成了玫瑰圖的樣式。并且為了整個(gè)頁面的排布不至于混亂,我取消了圖例,改為圖上的標(biāo)簽和當(dāng)鼠標(biāo)懸浮時(shí)浮現(xiàn)出來的對應(yīng)信息。

效果如下:


4.3 結(jié)果整合

我設(shè)想的最后的呈現(xiàn)效果是類似于BI大屏的各個(gè)圖像的有機(jī)組合,所以選擇了page對所有圖像進(jìn)行整合。并將結(jié)果存儲到一個(gè)html文件中。

代碼如下:

由于實(shí)驗(yàn)的主題是美食,所以不適宜使用傳統(tǒng)BI大屏所常用的科技感主題,相反,我選擇了較為溫暖的主題:VINTAGE主題,這個(gè)主題更加符合美食的特征。為了使各個(gè)圖片可以進(jìn)行自定義的排列,而不是默認(rèn)的順序排列,我將layout參數(shù)設(shè)置成了DraggablePageLayout,這意味著我可以對圖形進(jìn)行拖拽來實(shí)現(xiàn)自己的可視化最終展示成果。圖像布局完成后,可以點(diǎn)擊頁面中的“save config”按鈕對布局進(jìn)行存儲,隨后運(yùn)行“Page.save_resize_html”語句,根據(jù)剛剛存儲的布局文件形成最終頁面 。

效果如下:


05 可視化結(jié)果分析

5.1 美食類型偏好分析

實(shí)驗(yàn)中對于人們的美食類型偏好分析分為以下兩種:對于總體的美食類型偏好分析、對于各個(gè)城市的美食類型偏好分析。

對于總體的美食類型偏好分析,我選擇了柱形圖作為表現(xiàn)的形式。柱形圖采用長方形的形狀和顏色編碼數(shù)據(jù)的屬性,可以利用柱子的高度來反映數(shù)據(jù)的差異。在這一情景中,利用柱子的高度來反映對應(yīng)美食類型中的店鋪數(shù)量是較為合理的,而且由于美食類型較多,選擇柱形圖可以使整個(gè)界面較為整潔,優(yōu)化視覺體驗(yàn)。

在對于總體的美食類型偏好分析中,可以看出人們對于西餐和火鍋最為熱衷。大家喜歡吃西餐的原因不難理解,當(dāng)人們在家中吃慣了中餐時(shí),便會想要外出就餐,而西餐種類較多,較為正式,可以滿足不同的社交需求和飲食需求,因此西餐會成為人們外出就餐的主要選擇之一。除了西餐,火鍋也是人們很喜歡的一種美食類型,雖然圖片中的重慶火鍋數(shù)量略少于西餐數(shù)量,但是四川火鍋和其他類型的火鍋都得以上榜,相加起來的總數(shù)遠(yuǎn)超過西餐的數(shù)量,就該數(shù)據(jù)而言,不難看出國民們對于火鍋的熱愛。火鍋被人們喜愛的原因大概是口味豐富,而且火鍋所營造的熱鬧社交氛圍符合中國人喜歡群居的天性。

就外國料理而言,人們比較喜愛西餐、日本料理和韓國料理。日韓料理由于比較符合國人的飲食習(xí)慣,受到了人們的喜愛。

就國內(nèi)菜系而言,排名靠前的菜系有川菜、粵菜和浙菜。

對各個(gè)城市的美食偏好分析,由于要對不同的城市數(shù)量前五美食類型進(jìn)行展示,所以我采用了矩形樹圖。矩形式樹狀結(jié)構(gòu)圖(Treemap)是一種有效的實(shí)現(xiàn)層次結(jié)構(gòu)可視化的圖表結(jié)構(gòu),簡稱矩形樹圖或樹圖。在矩形樹圖中,各個(gè)小矩形的面積表示每個(gè)子節(jié)點(diǎn)的大小,矩形面積越大,表示子節(jié)點(diǎn)在父節(jié)點(diǎn)中的占比越大,整個(gè)矩形的面積之和表示整個(gè)父節(jié)點(diǎn)。通過矩形樹圖及其鉆取情況,我們可以很清晰地知道數(shù)據(jù)的全局層級結(jié)構(gòu)和每個(gè)層級的詳情。相比于同樣是用來表示層級結(jié)構(gòu)的旭日圖,矩形樹圖更適合表示層次較少的數(shù)據(jù),也更適合這次實(shí)驗(yàn)的任務(wù)。

通過分析,可以看出各個(gè)城市的飲食偏好。

重慶排名前五的美食類型為:重慶火鍋、川菜館、面館、西餐、融合烤肉。

武漢排名前五的美食類型為:重慶火鍋、湖北菜、日本料理、川菜館、韓國料理。

西安排名前五的美食類型為:陜菜、東南亞菜、面包烘焙、老北京火鍋、面館。

杭州排名前五的美食類型為:浙菜、創(chuàng)意菜、西餐、面包烘焙、四川火鍋。

天津排名前五的美食類型為:西餐、自助餐、天津菜、日本料理、四川火鍋。

南京排名前五的美食類型為:韓國料理、西餐、淮揚(yáng)菜、日本料理、茶餐廳。

蘇州排名前五的美食類型為:面館、茶餐廳、蘇幫菜、西餐、咖啡廳。

成都排名前五的美食類型為:四川火鍋、川菜館、串串香、自助餐、重慶火鍋。

北京排名前五的美食類型為:西餐、老北京火鍋、烤鴨、重慶火鍋、川菜館。

深圳排名前五的美食類型為:粵菜館、西餐、火鍋、茶餐廳、日式燒烤。

廣州排名前五的美食類型為:粵菜館、西餐、廣州菜、日本料理、粵式茶點(diǎn)。

上海排名前五的美食類型為:重慶火鍋、茶餐廳、自助餐、西餐、粵菜館。

從中可以看出各地的美食偏好都帶有很濃烈的地區(qū)特征,本地的代表菜系往往會被本地的人們所選擇,比如蘇州的蘇幫菜、杭州的浙菜、廣州的粵菜等。因?yàn)檫@些當(dāng)?shù)靥厣朗扯际琼槕?yīng)著當(dāng)代人的口味和該地區(qū)的地理因素,在長時(shí)間的演變中形成的,所以自然而然會成為當(dāng)?shù)鼐用裢獬鼍筒偷暮眠x擇。而上海的代表菜系之所以沒有上榜,可能是因?yàn)樯虾T陂L時(shí)間的發(fā)展中都是文化交融的國際大城市的定位,外來人口較多,自然而然地帶來了各地的菜系,從而形成了多種美食交匯的飲食結(jié)構(gòu)。

同時(shí)對于各個(gè)城市的美食類型分析,也進(jìn)一步驗(yàn)證了人們對于火鍋、西餐、日本料理以及韓國料理的喜愛。


5.2 美食分布分析

由于對美食的分布分析需要展現(xiàn)它們的地理位置,因此我選擇了地圖加熱力圖這一可視化表現(xiàn)形式。地圖為底用來顯示各個(gè)店鋪所屬的區(qū)域,熱力圖疊加通過顏色來判斷該區(qū)域的店鋪數(shù)量。

由圖可知,上海市熱門餐廳最為聚集的區(qū)域是黃浦區(qū),其次是靜安區(qū)和徐匯區(qū),隨后是長寧區(qū)和浦東新區(qū)。嘉定區(qū)、寶山區(qū)、普陀區(qū)、楊浦區(qū)和閔行區(qū)分布的餐廳數(shù)量不多。

北京熱門餐廳最為聚集的區(qū)域是朝陽區(qū),其次是東城區(qū)、海淀區(qū)和西城區(qū)。

南京熱門餐廳最為聚集的區(qū)域是玄武區(qū),玄武區(qū)包含了70所餐廳,占全部餐廳的70%。除此之外,鼓樓區(qū)和秦淮區(qū)也包括了一定數(shù)量的餐廳。建鄴區(qū)、雨花臺區(qū)、江寧區(qū)、棲霞區(qū)和浦口區(qū)分布著若干餐廳。

天津和平區(qū)、南開區(qū)和河西區(qū)三個(gè)區(qū)域包含了絕大多數(shù)的餐廳,其余有餐廳分布的區(qū)域?yàn)椋?strong>河北區(qū)、河?xùn)|區(qū)、紅橋區(qū)、津南區(qū)、西青區(qū)和靜海區(qū)。

廣州熱門餐廳聚集的區(qū)域有天河區(qū)、越秀區(qū)、海珠區(qū)和荔灣區(qū),花都區(qū)、白云區(qū)和番禺區(qū)各分布了1、2家熱門餐廳。

成都而言,熱門餐廳主要分布在市中心的區(qū)域中,包括錦江區(qū)、青羊區(qū)、武侯區(qū)、金牛區(qū)和成華區(qū)。其他的區(qū)域基本沒有熱門餐廳的分布。

杭州熱門餐廳的分布呈現(xiàn)以上城區(qū)為中心,逐步向外擴(kuò)散的特征。

武漢的熱門餐廳分布比較均勻,從武昌區(qū)、洪山區(qū)到江岸區(qū)、江漢區(qū)和硚口區(qū),都分布著一定數(shù)量的熱門餐廳。其中江岸區(qū)囊括了最多數(shù)量的熱門餐廳。

深圳的熱門餐廳主要分布在西部的寶安區(qū)、南山區(qū)和福田區(qū),其次是龍崗區(qū)、龍華區(qū)和羅湖區(qū)。

蘇州姑蘇區(qū)覆蓋了最多的熱門餐廳,吳中區(qū)和虎丘區(qū)也包含了較多的熱門餐廳。

西安的美食分布集中于中部,以雁塔區(qū)為中心向外擴(kuò)散,碑林區(qū)和鄂邑區(qū)緊隨其后。

重慶的也呈現(xiàn)了由中心向外擴(kuò)散的特征,渝中區(qū)作為市中心包含了大量的熱門餐廳。

從總體來看,熱門美食的分布與該城市的熱門商圈、市中心的分布有著十分密切的關(guān)系。而且相比于居民區(qū),商業(yè)區(qū)聚集了更多的熱門餐廳。餐廳更愿意選擇在人流量多的地方開業(yè),而人流量又很容易將一個(gè)餐廳捧為熱門餐廳,也就是大家口中的網(wǎng)紅餐廳,這兩者是相輔相成的關(guān)系,因此熱門餐廳多聚集于大型的商業(yè)區(qū)。但熱門餐廳并不代表一定是最優(yōu)質(zhì)的餐廳,部分餐廳可能只是由于一時(shí)的噱頭而人氣暴漲或借助于地理優(yōu)勢吸引客戶,熱門餐廳與優(yōu)質(zhì)餐廳的關(guān)聯(lián)度如何,還需要進(jìn)行進(jìn)一步的分析。


5.3 GDP、價(jià)格與評分的關(guān)聯(lián)性分析

由于要探究GDP和人均價(jià)格,人均價(jià)格與綜合評分的關(guān)系,所以我選擇了可以表現(xiàn)事物關(guān)系的散點(diǎn)圖作為可視化的形式。散點(diǎn)圖可以通過軸判斷出變量之間的相關(guān)性。如果變量之間不存在相互關(guān)系,那么,在散點(diǎn)圖上就會表現(xiàn)為隨機(jī)分布的離散的點(diǎn);如果變量之間存在某種相關(guān)性,那么大部分的數(shù)據(jù)點(diǎn)就會相對密集并呈現(xiàn)出某種趨勢。

可以看出,GDP和人均價(jià)格存在著正相關(guān)的關(guān)系。我一開始的假設(shè)是GDP和人均價(jià)格不存在明顯的相關(guān)關(guān)系,因?yàn)閲吮容^注重飲食,所以在飲食的花銷上差距應(yīng)該不大。但是結(jié)果和我的假設(shè)相反。這說明一個(gè)城市的生產(chǎn)能力會影響到飲食的消費(fèi)水平。

通過圖片可以得知,店鋪的評分高低跟店鋪的價(jià)格并沒有十分直接的關(guān)系。人均價(jià)格在200元以上的餐廳能保持一定的質(zhì)量,總評分沒有低于8分的。但在人均200元以下的餐廳中,可以明顯看出價(jià)格與評分不存在直接關(guān)系。因此得出結(jié)論:人均價(jià)格很高的餐廳一般質(zhì)量較高,但是在中等人均價(jià)格(200元)的區(qū)間內(nèi),餐廳質(zhì)量與餐廳的價(jià)格無法構(gòu)成正比。


5.4 評分和價(jià)格分析

關(guān)于評分和價(jià)格分析主要分為兩個(gè)部分。

第一部分是對高質(zhì)量店鋪和高價(jià)格店鋪的比例分析。由于只需要展示某一數(shù)據(jù)在總體中的比例,所以我選擇了水滴圖作為可視化展現(xiàn)的形式。水滴圖可以將某類屬性的比例通過水占容器中的比例表現(xiàn)出來。

在設(shè)置指標(biāo)時(shí),我將人均80元作為中等偏上人均的標(biāo)準(zhǔn),將總體評分8.5分作為優(yōu)質(zhì)店鋪的標(biāo)準(zhǔn)。通過分析可以看出,超過半數(shù)的餐廳價(jià)格處于中等偏上的水平,而大部分餐廳屬于優(yōu)質(zhì)餐廳。

為了探究熱門餐廳的店鋪質(zhì)量分布,我進(jìn)行了第二部分的分析:對所有餐廳的分?jǐn)?shù)段比例進(jìn)行分析。由于涉及到比例關(guān)系,所以我選擇了餅圖來呈現(xiàn)最后的結(jié)果。餅圖可以呈現(xiàn)各部分在整體中的比例,能夠體現(xiàn)部分與整體之間的關(guān)系。

可以看出,全部店鋪評分都在7分以上,其中8分以上店鋪占了絕大部分。由此可以對熱門餐廳的總體做一個(gè)概括性的描述:大部分餐廳都處于中等消費(fèi)水平以上,同時(shí)質(zhì)量相對有保證,質(zhì)量與熱門與否之間存在著一定的正相關(guān)關(guān)系。


5.5 總體分析

對于總體的布局,我采用了各類的視覺原理,以呈現(xiàn)較為清晰而且較為有調(diào)理的可視化結(jié)果。

首先,為了使各類數(shù)據(jù)一目了然,我沒有選擇傳統(tǒng)的拖拽瀏覽的布局方式,而是采用了大屏的呈現(xiàn)方法。這樣能夠讓使用的人快速對所有的內(nèi)容有一定的了解,并且在短時(shí)間內(nèi)對自己感興趣的內(nèi)容進(jìn)行定位。

其次,在對圖表的布局時(shí),我聯(lián)系了格式塔原則,將相同類型的圖表放在一起,將主題關(guān)聯(lián)的圖表放在一起,符合格式塔中的接近原則,便于使用者將相關(guān)的圖表關(guān)聯(lián)在一起來觀看 。同時(shí),我將結(jié)果中比較重要的內(nèi)容:店鋪分布地圖放置在整個(gè)頁面的中間,有利于使用者第一時(shí)間將視線聚焦到重點(diǎn)上,符合美學(xué)因素中的聚焦原則。

在顏色的搭配上,我沒有采用傳統(tǒng)的BI大屏所使用的具有科技感的黑藍(lán)配色,而是選擇了暖色系的主題。這是因?yàn)榇舜螌?shí)驗(yàn)的研究內(nèi)容是美食數(shù)據(jù)的可視化,食物在人們心中應(yīng)該是幸福的、溫暖的,所以我選擇了米黃色這一讓人聯(lián)想到溫暖的顏色作為主題顏色,同時(shí)保證其他的顏色飽和度不是太高,以營造一種溫暖但又不過分興奮的氛圍。

除此之外,還采用了各種交互手段,時(shí)用戶可以按照所需的展示方式修改視圖展現(xiàn)結(jié)果。

(動態(tài)化展示結(jié)果可見結(jié)尾視頻)

06 心得體會

6.1 創(chuàng)新與特色

本次實(shí)驗(yàn)的創(chuàng)新與特色之處有以下幾點(diǎn):

1、對美食的分布進(jìn)行分析

對熱門餐廳的美食分布進(jìn)行分析,不僅有利于人們掌握各個(gè)城市美食聚集區(qū)域,形成一份美食地圖,同時(shí)還可以將此地圖信息與地理環(huán)境、城市規(guī)劃等分析結(jié)合起來,從而進(jìn)行更深入的研究。

2、對熱門美食的類型進(jìn)行總體和局部的分析

在其他的關(guān)于美食數(shù)據(jù)的分析中,往往有人將美食的類型進(jìn)行分析,但是很少有人同時(shí)對熱門美食的類型進(jìn)行總體和局部的對比分析,以及不同城市的對比分析。這一分析不僅有利于我們對總體國民的飲食偏好有個(gè)總體的了解,還可以深入比較不同城市的飲食習(xí)慣共同之處和差異,同樣的也可以結(jié)合對應(yīng)的地理環(huán)境進(jìn)行理解,并對其中可能出現(xiàn)的異常情況進(jìn)行分析。

3、對GDP、人均價(jià)格的關(guān)聯(lián)分析

對GDP和人均價(jià)格分析可以看出地區(qū)國民生產(chǎn)水平與消費(fèi)水平特別是飲食消費(fèi)水平的關(guān)系,這有利于分析國民消費(fèi)結(jié)構(gòu)等消費(fèi)性的問題。

4、區(qū)域數(shù)據(jù)類型豐富

相比于其他只分析某個(gè)地區(qū)的數(shù)據(jù)分析而言,我結(jié)合了12個(gè)城市的數(shù)據(jù),覆蓋面較廣,數(shù)據(jù)類型比較豐富,涵蓋了評分、價(jià)格、地區(qū)等數(shù)據(jù),可以挖掘出更多更深入的內(nèi)容。

5、大屏展示形式

大部分的美食可視化分析并沒有最后形成一個(gè)完整的結(jié)果,只是將數(shù)據(jù)形成圖像后進(jìn)行分析,雖然也能將分析結(jié)果敘述清楚,但是無法將圖片綜合起來做成一個(gè)作品。而我使用了大屏的展示形式,不僅較為清楚直觀的展示我所進(jìn)行數(shù)據(jù)可視化的內(nèi)容,還可以給觀看者一個(gè)自己與可視化視圖交互的接口,同時(shí)還兼顧了視覺體驗(yàn)。


6.2 不足與反思

雖然這次試驗(yàn)我克服了很多困難,也在完成的過程中一遍遍地優(yōu)化,但是還存在著一些問題:

1、數(shù)據(jù)分析的條例不夠清晰

有人說數(shù)據(jù)可視化分析的過程就是用數(shù)據(jù)講故事的過程,那么我覺得我的作品的故事線不夠明晰。我認(rèn)為一個(gè)好的可視化作品應(yīng)該是層層遞進(jìn)、環(huán)環(huán)相扣的,即使對于大屏這種多樣化的數(shù)據(jù)展現(xiàn)形式,所展現(xiàn)的思路也不應(yīng)該是隨意的堆砌,而應(yīng)該是有明確的目標(biāo)導(dǎo)向,再由這個(gè)目標(biāo)分散出對應(yīng)的可視化任務(wù)。但我在做這個(gè)實(shí)驗(yàn)時(shí),由于所獲取的數(shù)據(jù)的限制,我的思路變得有點(diǎn)混亂,只能將大主題定為對大眾點(diǎn)評數(shù)據(jù)的分析,這個(gè)大主題很明顯太過籠統(tǒng)了,這導(dǎo)致我后來的可視化思路變得有點(diǎn)凌亂,這是我未來可以改進(jìn)的方向。

2、分析的深度不夠

其實(shí)對于實(shí)驗(yàn)中的一些分析任務(wù),我還可以廣泛收集其他各類數(shù)據(jù)進(jìn)行更深入的分析,比如在美食分布分析中,我可以收集各個(gè)城市的地理數(shù)據(jù),比如人口數(shù)據(jù)、商圈數(shù)據(jù)等進(jìn)行可視化的呈現(xiàn),從而將分析的結(jié)果進(jìn)行進(jìn)一步的深入。這也是后期我繼續(xù)優(yōu)化作品的方向。

在這次實(shí)驗(yàn)中,我學(xué)到了很多。我原來以為可視化只是將信息用圖像方式表現(xiàn)出來,在用些炫酷的效果便能做出很好的作品。然而當(dāng)我真的上手實(shí)操后,我發(fā)現(xiàn)一切都沒有那么簡單。如何確定一個(gè)主題,如何捋清楚自己的思路,如何獲取數(shù)據(jù),如何在兼顧可觀賞性和可理解性上做文章等,都是需要考慮的問題。這時(shí)候我就會發(fā)現(xiàn)自己學(xué)的知識還遠(yuǎn)遠(yuǎn)不夠,所以只能在實(shí)踐的過程中不斷學(xué)習(xí)、不斷充實(shí)自己。只有自己實(shí)打?qū)嵉匕颜麄€(gè)可視化的過程做下來,才能真正了解課本中所講的各個(gè)知識點(diǎn),才能對數(shù)據(jù)可視化這一個(gè)課題有著較為全面的了解。

所以對于這個(gè)大作業(yè),我的感想就是很充實(shí)且很幸運(yùn),雖然我還存在著很多的不足,但我也在不斷完善自己,因此收獲到了獲得新知識地充實(shí)感。其次就是覺得擁有這個(gè)機(jī)會很幸運(yùn),可以通過這次機(jī)會做出一個(gè)屬于自己的作品,真正掌握一門可視化的工具。在未來繼續(xù)深入學(xué)習(xí)數(shù)據(jù)科學(xué)的路上,我相信數(shù)據(jù)可視化教給我的東西一定可以成為我的左肩右膀,為我的未來助力。

杭州珍瓚傳媒

行業(yè)報(bào)白-門店認(rèn)領(lǐng)

包通過

1.足療按摩 2.洗浴中心 3.汗蒸溫泉?

4.鮮花diy 5.spa美體 6美發(fā)美甲?

7.賽馬溜冰 8.水上樂園 9.攀巖射擊?

10.戶外游玩11.兒童運(yùn)動12. 綜合商場

杭州珍瓚傳媒/大眾點(diǎn)評的美食數(shù)據(jù)分析的評論 (共 條)

分享到微博請遵守國家法律
行唐县| 宁波市| 搜索| 洪泽县| 贡山| 安阳市| 昭通市| 富锦市| 封丘县| 滁州市| 房山区| 民勤县| 垫江县| 威信县| 中卫市| 德阳市| 黄冈市| 辽阳县| 道真| 长沙县| 穆棱市| 玛曲县| 雷州市| 泰兴市| 曲松县| 潞西市| 柳江县| 南昌市| 治多县| 上饶县| 额敏县| 延津县| 潢川县| 麻阳| 泾川县| 罗源县| 斗六市| 繁昌县| 景洪市| 德安县| 广水市|