游記數(shù)據(jù)感知旅游目的地形象
原文鏈接:http://tecdat.cn/?p=14997
越來越多的人愿意精神消費。旅游不僅可以提升人們對外地環(huán)境和外地人文的認知,也可以放松身心、愉悅心情,是一種受歡迎的精神消費。
▼
隨著國內近些年來互聯(lián)網(wǎng)的發(fā)展,越來越多的人開始線上消費,消費感受的推薦成為了潮流。在各個旅游平臺上,越來越多的人愿意參與旅游目的地游玩感受的分享。
本文試圖從馬蜂窩旅游官網(wǎng)上就新疆這個旅游目的地游記進行感知分析。
游記表現(xiàn)出多元復雜的情感
通過情感分析(也稱為意見挖掘),用文本挖掘和計算機語言學來識別和提取原始資料中的主觀信息,分析主觀信息(例如觀點,情感,態(tài)度,評估,情感等),以進行提取,分析,處理,歸納和推理。
圖表1

通過數(shù)據(jù)分析可知,旅客對新疆整體上正向情感還是遠高于負向情感,旅游群體對新疆旅游地區(qū)還是呈現(xiàn)出積極的肯定態(tài)度,如舒適、恬靜、賞心悅目、激動、留戀等。從詞頻統(tǒng)計看出,自然風光多,旅游對民族特色的較為關注,如:盆地、白云、沙漠、草原、南疆。當然還有吃食,如“奶酪”等等。從結果也可以看到有少量的“失望”、“惆悵”等情感,通過游記我們發(fā)現(xiàn)風景基本上滿足了旅客的需求,但是深層次的體驗項目較少,新疆旅游景點間空間跨度大、路況條件差、行車時間長、節(jié)假日擁堵排隊等。新疆旅游大部分都是景區(qū)內的風景,對于自然風貌記錄偏少,規(guī)劃、人文旅游也偏少。情感分析可知,游客對風景、美食都很滿意,有著更高的期待。
哪些游記幫助人數(shù)最多
通過游記的內容特點和幫助人數(shù),我們通過決策樹來判斷哪些游記的幫助人數(shù)最多,同時也發(fā)現(xiàn)大多數(shù)驢友的心里出行需求。
圖表2

樣本游記從游記篇幅、作者等級、人均花費、旅行組合、出行天數(shù)等方面反映游記的特點。游記篇幅的大小和作者等級是影響幫助人數(shù)的最重要的因素,內容詳盡的游記能幫助到更多的人,經(jīng)驗老道的驢友的游記一般更有參考價值。旅行組合中家庭組合較少,赴疆游客以個人或朋友背包客徒步、自由行旅游為主,人均費用在7k以下,出行天數(shù)小于12天。游記的幫助人數(shù)客觀地反映了驢友們旅游行程規(guī)劃的心理預期,同時會對其他旅游者的決策和對旅游目的地的營銷產(chǎn)生重要影響。
游記話題情感認知形象
接下來我們通過主題挖掘尋找游記話題和表達情感之間的關系。
圖表3

從中可以看到有兩個主題是景點相關,從關鍵詞中可以用看到驢友們關注比較多的景點是獨庫公路、天山、喀納斯、禾木、布爾津、五彩灘等?!靶陆薄ⅰ蔼殠旃贰?、“喀納斯”、“烏魯木齊”是游記樣本中共現(xiàn)頻率最高的詞,成為兩個重要的中心節(jié)點。通常情況下,距離中心節(jié)點越近,表示與兩個節(jié)點的關聯(lián)越緊密。由此可見,語義網(wǎng)絡圖呈現(xiàn)出兩個較為明顯的趨勢:一是“新疆”一詞輻射出的語義網(wǎng)絡除旅游景區(qū)外,更多地表現(xiàn)了游客對新疆“雪山”、“草原”、“景色”等旅游形象的整體情感感知:如“獨特”、“寧靜”等,這與新疆對外旅游宣傳所采用的詞語相一致; 二是“烏魯木齊”、“風景”一詞輻射出的語義網(wǎng)絡集合了更多與行程和旅游攻略相關的信息,如“酒店”、“機場”、“包車”、“自駕”等,從游客感知視角證實了新疆旅游的旅游攻略行程信息以及烏魯木齊作為重要的旅游集散中心在新疆旅游業(yè)發(fā)展中的地位。

相關見解
1.數(shù)據(jù)類崗位需求的數(shù)據(jù)面
2.探析大數(shù)據(jù)期刊文章研究熱點
3.機器學習助推快時尚精準銷售預測
4.用機器學習識別不斷變化的股市狀況—隱馬爾科夫模型(HMM)的應用
5.數(shù)據(jù)盤點:家電線上消費新趨勢
6.在r語言中使用GAM(廣義相加模型)進行電力負荷時間序列分析
7.虎撲論壇基因探秘:社群用戶行為數(shù)據(jù)洞察
8.把握出租車行駛的數(shù)據(jù)脈搏
9.智能門鎖“剁手”數(shù)據(jù)攻略