計(jì)算機(jī)畢業(yè)設(shè)計(jì)Python+Spark旅游推薦系統(tǒng) 旅游大數(shù)據(jù) 旅游數(shù)據(jù)分析 大數(shù)據(jù)畢業(yè)設(shè)計(jì)
(一)選題依據(jù)(包括項(xiàng)目研究的背景、研究或應(yīng)用的意義、國(guó)內(nèi)外研究或應(yīng)用現(xiàn)狀,附主要參考文獻(xiàn))
1、研究背景
在旅游推薦系統(tǒng)中應(yīng)用大數(shù)據(jù)技術(shù), 有利于推動(dòng)旅游行業(yè)長(zhǎng)遠(yuǎn)發(fā)展。隨著人們物質(zhì)生活水平的進(jìn)一步提升, 其更加重視精神上的享受, 這就使得旅游行業(yè)迅速發(fā)展。能夠向用戶提供更加優(yōu)質(zhì)的旅游服務(wù), 旅游單位需要充分利用大數(shù)據(jù)技術(shù), 對(duì)更具價(jià)值的信息及潛在用戶進(jìn)行充分挖掘, 進(jìn)一步研究旅游推薦系統(tǒng), 從而做出更加合理的旅游產(chǎn)業(yè)信息化決策。大數(shù)據(jù)與旅游產(chǎn)業(yè)的結(jié)合將給旅游業(yè)高質(zhì)量發(fā)展提供技術(shù)支撐與服務(wù)架構(gòu)。
根據(jù)中商情報(bào)網(wǎng)訊顯示2021年上半年,我國(guó)在線旅行預(yù)訂行業(yè)強(qiáng)勁復(fù)蘇,出游人次快速反彈增長(zhǎng),企業(yè)業(yè)績(jī)大幅提升。在線旅行預(yù)訂企業(yè)不斷進(jìn)行數(shù)字化營(yíng)銷升級(jí),尋求新的業(yè)績(jī)?cè)鲩L(zhǎng)點(diǎn)。在行業(yè)回暖的同時(shí),旅行預(yù)訂市場(chǎng)消費(fèi)結(jié)構(gòu)發(fā)生變化,推動(dòng)整個(gè)行業(yè)高質(zhì)量發(fā)展。截至2021年6月,我國(guó)在線旅行預(yù)訂用戶規(guī)模達(dá)3.67億,較2020年12月增長(zhǎng)2411萬,占網(wǎng)民整體的36.3%。由此看出,我國(guó)的旅游業(yè)市場(chǎng)競(jìng)爭(zhēng)壓力較大, 從旅游大數(shù)據(jù)中挖掘有價(jià)值的信息、潛在客戶, 并提供更優(yōu)質(zhì)的服務(wù), 可以促進(jìn)旅游業(yè)的發(fā)展。因此對(duì)于該研究是有必要的。
2、研究意義
大數(shù)據(jù)還能帶動(dòng)旅游相關(guān)產(chǎn)業(yè)發(fā)展,為旅游業(yè)開拓新的市場(chǎng)與業(yè)務(wù)提供服務(wù)。我國(guó)旅游資源豐富,旅游業(yè)自改革開放以來發(fā)展迅速,已成為第三產(chǎn)業(yè)重要組成部分。互聯(lián)網(wǎng)及移動(dòng)設(shè)備的普及也為旅游業(yè)的發(fā)展提供了新的機(jī)遇和平臺(tái),人們會(huì)使用相關(guān)的旅游推薦App和視頻軟件來進(jìn)行搜索景點(diǎn)、門票、路線等信息,利用旅游大數(shù)據(jù)進(jìn)行挖掘和分析其隱藏的價(jià)值,同時(shí)也能更好地根據(jù)用戶的興趣推薦相關(guān)信息,方便用戶更快速、更便捷的出行。隨著各地“智慧旅游”建設(shè)步伐加快, 旅游業(yè)將會(huì)朝著現(xiàn)代化、網(wǎng)絡(luò)化、智能化的方向發(fā)展, 為游客提供更加優(yōu)質(zhì)、專業(yè)、個(gè)性化的服務(wù)。應(yīng)用大數(shù)據(jù)及數(shù)據(jù)挖掘技術(shù)可以有效管理旅游業(yè), 為旅客提供更加優(yōu)質(zhì)的服務(wù)。目前, 旅游大數(shù)據(jù)的應(yīng)用主要集中在在線旅游業(yè)。隨著科技的發(fā)展, 旅游業(yè)對(duì)數(shù)據(jù)及信息的依賴性將不斷增加, 越來越多地應(yīng)用大數(shù)據(jù), 并且從線上影響轉(zhuǎn)移到線下實(shí)體。
3、國(guó)內(nèi)外研究現(xiàn)狀
(1)國(guó)外研究現(xiàn)狀
M.D’Amore等開發(fā)了一種用六臺(tái)機(jī) 器組合成的命名為RaspberryPi 的系統(tǒng),它是一種開源的、低成本獲取網(wǎng)絡(luò)大數(shù)據(jù)的采集系統(tǒng),可以使學(xué) 者和研究者方便地獲取旅游大數(shù)據(jù)從而更好地研究旅游現(xiàn)象,而大數(shù)據(jù)在云計(jì)算、物聯(lián)網(wǎng)等技術(shù)的支持下,Google開發(fā)了MapReduce 計(jì)算框架,Yahoo!、 Facebook在此基礎(chǔ)上開發(fā)了Hadoop、PUMA,微軟 開發(fā)了Cosmos,這些為旅游大數(shù)據(jù)的分析提供了很好的選擇。?
(2)國(guó)內(nèi)研究現(xiàn)狀
隨著旅游業(yè)的發(fā)展, 旅游市場(chǎng)競(jìng)爭(zhēng)壓力增大, 客戶成為旅游企業(yè)爭(zhēng)奪的資源。目前旅游大數(shù)據(jù)信息量大, 但相對(duì)分離, 企業(yè)一般只擁有客戶的姓名、性別、年齡、旅游目的地選擇等基礎(chǔ)原始信息, 信息中缺少數(shù)據(jù)隱含的規(guī)律與潛在價(jià)值, 不能對(duì)客戶連續(xù)性的行為活動(dòng)進(jìn)行持續(xù)、全面分析, 不能提取有效的關(guān)聯(lián)信息, 對(duì)企業(yè)決策作用不大。利用數(shù)據(jù)挖掘技術(shù)可以提取、分析游客的路線查詢、信息搜索、服務(wù)點(diǎn)評(píng)等信息和消費(fèi)情況, 為企業(yè)的旅游路線規(guī)劃提供參考依據(jù),以便為客戶提供更合適的旅游方案, 增強(qiáng)企業(yè)的市場(chǎng)競(jìng)爭(zhēng)力。城市旅游規(guī)劃作為城市總體規(guī)劃中的專項(xiàng)規(guī)劃內(nèi)容, 對(duì)于旅游大數(shù)據(jù)的應(yīng)用不完善, 旅游大數(shù)據(jù)的實(shí)際應(yīng)用價(jià)值沒有得到很好的體現(xiàn)。
大數(shù)據(jù)與旅游產(chǎn)業(yè)的結(jié)合將給旅游業(yè)高質(zhì)量發(fā)展提供技術(shù)支撐與服務(wù)架構(gòu)。大數(shù)據(jù)不僅能夠儲(chǔ)存海量的旅游數(shù)據(jù),而且能夠?qū)?shù)據(jù)進(jìn)行整合,幫助人們分析旅游需求與市場(chǎng)發(fā)展趨勢(shì),為科學(xué)的決策提供依據(jù)。大數(shù)據(jù)還能帶動(dòng)旅游相關(guān)產(chǎn)業(yè)發(fā)展,為旅游業(yè)開拓新的市場(chǎng)與業(yè)務(wù)提供服務(wù)。旅游大數(shù)據(jù)被廣泛應(yīng)用于營(yíng)銷及服務(wù)領(lǐng)域。近年來, 國(guó)內(nèi)旅游平臺(tái)迅速發(fā)展, 包括螞蜂窩旅行網(wǎng)、攜程旅行網(wǎng)、去哪兒網(wǎng)等旅游服務(wù)平臺(tái), 依據(jù)游客的旅游愛好、旅游資金、出行需求等為用戶提供旅游方案建議, 并提供出行、住宿、餐飲、門票等一體化服務(wù) , 簡(jiǎn)化了人們旅游出行的準(zhǔn)備工作。與此同時(shí), 政府順應(yīng)大數(shù)據(jù)時(shí)代潮流, 開始“智慧旅游”建設(shè), 目前全國(guó)有33個(gè)城市被批準(zhǔn)為智慧旅游試點(diǎn)城市, 致力于城市旅游的特色化、智能化發(fā)展。
4、參考文獻(xiàn):
[1]薛東.大數(shù)據(jù)技術(shù)在旅游推薦系統(tǒng)中的應(yīng)用[J].電子技術(shù)與軟件工程,2018(18):146.
[2]盧秀蕓.數(shù)據(jù)挖掘技術(shù)在旅游業(yè)中的應(yīng)用[J].鎮(zhèn)江高專學(xué)報(bào),2018,31(02):54-56.
[3]尹書華,傅城州.基于百科大數(shù)據(jù)的旅游景點(diǎn)推薦系統(tǒng)應(yīng)用研究[J].旅游論壇,2017,10(03):107-115.
[4]賀劍武.基于大數(shù)據(jù)分析技術(shù)的旅游智慧平臺(tái)設(shè)計(jì)[J].現(xiàn)代電子技術(shù),2020,43(14):183-186.
[5]張軍愛.大數(shù)據(jù)背景下旅游業(yè)發(fā)展的新技術(shù)應(yīng)用[J].科技創(chuàng)新與生產(chǎn)力,2020(02):30-36.
[6]郭玲霞.大數(shù)據(jù)助力智慧旅游發(fā)展的研究綜述[J].河北旅游職業(yè)學(xué)院學(xué)報(bào),2017,22(02):50-54.
[7]尚泉酉. 大數(shù)據(jù)技術(shù)在大氣污染防治審計(jì)中的應(yīng)用研究[D].河南財(cái)經(jīng)政法大學(xué),2021.
[8]陳國(guó)宏,索柏民.基于大數(shù)據(jù)的旅游企業(yè)融合創(chuàng)新研究[J].沈陽師范大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2016,40(06):81-84.
[9]Chang Victor and Ji Ziyang and Xu Qianwen Ariel. Big Data Applications in Guangzhou Restaurants Analysis.[J]. Big data, 2021,
[10]Wang Nan. Application of DASH client optimization and artificial intelligence in the management and operation of big data tourism hotels[J]. Alexandria Engineering Journal, 2022, 61(1) : 81-90.
[11]吳開軍.旅游大數(shù)據(jù)研究熱點(diǎn)及特征探析——基于國(guó)外文獻(xiàn)的分析[J].統(tǒng)計(jì)與信息論壇,2019,34(04):105-113.
(二)設(shè)計(jì)或研究?jī)?nèi)容、預(yù)期目標(biāo)及擬解決的關(guān)鍵問題(此部分為重點(diǎn)闡述內(nèi)容)。
1、研究?jī)?nèi)容
(1)旅游信息的提取。 對(duì)用戶的旅游系統(tǒng)的搜索記錄及點(diǎn)擊等信息進(jìn)行收集, 對(duì)其興趣愛好進(jìn)行分析, 提取出對(duì)用戶最具吸引力的旅游項(xiàng)目、旅游目的地及旅游路線等信息。相關(guān)的旅游管理單位可以依據(jù)數(shù)據(jù)分析結(jié)果優(yōu)化旅游信息網(wǎng)站設(shè)計(jì), 并定期更新信息, 以確保網(wǎng)站信息與游客需求高度吻合,為游客提供更加優(yōu)質(zhì)的服務(wù), 并為特殊、特定游客提供個(gè)性化服務(wù), 保證旅游服務(wù)的優(yōu)質(zhì)、全面。
(2)旅游用戶的挖掘。借助旅游類網(wǎng)絡(luò)與App對(duì)用戶的訪問記錄的數(shù)據(jù)信息進(jìn)行提取, 從而聚類與分析數(shù)據(jù);對(duì)于新訪客可借助其訪問記錄對(duì)其有沒有可能成為潛在客戶進(jìn)行識(shí)別,對(duì)其可不可當(dāng)作潛在客戶對(duì)待進(jìn)行評(píng)估;對(duì)于潛在旅游客戶, 應(yīng)及時(shí)的結(jié)合其興趣愛好對(duì)相應(yīng)的旅游信息進(jìn)行精準(zhǔn)推送。
(3)優(yōu)化旅游線路和項(xiàng)目, 也就是數(shù)據(jù)挖掘旅游目的地、旅游線路的游客訪問狀況, 以便旅游管理單位能夠更好的確定最適宜的、具備市場(chǎng)發(fā)展?jié)摿Φ摹⒆顑?yōu)的旅游線路;并能夠?qū)τ嘘P(guān)旅游線路進(jìn)行綜合管理與合理規(guī)劃, 及對(duì)旅游網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行不定時(shí)的調(diào)整, 以便用戶訪問與咨詢, 使得網(wǎng)絡(luò)的相關(guān)度得以增強(qiáng), 且網(wǎng)站訪問量得以提升。利用旅游大數(shù)據(jù)創(chuàng)建涵蓋較廣的旅游目的地及旅游項(xiàng)目數(shù)據(jù)庫, 借助數(shù)據(jù)挖掘技術(shù), 形成多種旅游方案。針對(duì)不同客戶推薦不同的旅游目的地及旅游項(xiàng)目, 提高旅游客戶的旅游體驗(yàn)滿意度。
2、預(yù)期目標(biāo)
(1)為游客提供優(yōu)質(zhì)、精準(zhǔn)的旅游咨詢與服務(wù), 制定合理的旅游計(jì)劃與路線。
(2)游客在互聯(lián)網(wǎng)上搜索旅游目的地, 便可以獲得相關(guān)的吃、住、行、游、購、娛等信息, 自行判斷與選擇, 前期準(zhǔn)備工作大為減少。
(3)借助旅游大數(shù)據(jù)來引領(lǐng)旅游業(yè)可持續(xù)發(fā)展, 對(duì)旅游業(yè)加以整體調(diào)控, 對(duì)旅游經(jīng)濟(jì)數(shù)據(jù)信息進(jìn)行密切掌握, 并實(shí)時(shí)監(jiān)測(cè)旅游輿情,將公共服務(wù)能力進(jìn)行提升, 并對(duì)公共服務(wù)設(shè)施加以進(jìn)一步完善, 對(duì)數(shù)據(jù)搜集、整理、應(yīng)用機(jī)制進(jìn)行構(gòu)建, 使得數(shù)據(jù)分析更加的合理與有效。?
3、擬解決的關(guān)鍵問題
(1)?無法準(zhǔn)確找到所需文獻(xiàn)和數(shù)據(jù),解決方法通過知網(wǎng)網(wǎng)站、百度文庫和B站查找。
(2)?環(huán)境配置遇到或網(wǎng)頁遇到404報(bào)錯(cuò)問題,解決方法通過百度、B站搜索服務(wù)器配置相關(guān)資料并重新配置。
(3)?數(shù)據(jù)安全性,解決方法通過購買更好的服務(wù)器。
(三)研究方案(包括有關(guān)方法、技術(shù)路線、實(shí)驗(yàn)手段、關(guān)鍵技術(shù)等)。
1、有關(guān)方法
(1)問題定義及規(guī)劃,通過查閱各種資料,了解大數(shù)據(jù)技術(shù)和旅游系統(tǒng)推薦相關(guān)資料。
(2)通過閱讀和收集國(guó)內(nèi)外相關(guān)文獻(xiàn)資料,并對(duì)其進(jìn)行歸納和分析整理,學(xué)習(xí)和研究與大數(shù)據(jù)技術(shù)對(duì)旅游經(jīng)濟(jì)發(fā)展相關(guān)的知識(shí)和理論。明確發(fā)展現(xiàn)狀和不足,并在此基礎(chǔ)上進(jìn)行。
(3)旅游案例進(jìn)行分析。
(4)就相關(guān)旅游平臺(tái)推薦數(shù)據(jù)進(jìn)讀取、清洗和分析。
2、技術(shù)路線
hadoop spark python springboot vue
3、實(shí)驗(yàn)手段
操作系統(tǒng):Windows 7操作系統(tǒng)
開發(fā)工具:Jupyter、IDEA2019.3.3
繪圖軟件:Tableau(用于對(duì)數(shù)據(jù)可視化并分析做成報(bào)表)
數(shù)據(jù)獲?。豪肞ython爬蟲到相應(yīng)網(wǎng)站進(jìn)行數(shù)據(jù)的爬取
4、關(guān)鍵技術(shù):
(1)?在相關(guān)網(wǎng)站上對(duì)相關(guān)數(shù)據(jù)進(jìn)行網(wǎng)絡(luò)爬蟲。
(2)?MySQL數(shù)據(jù)庫對(duì)數(shù)據(jù)進(jìn)行存儲(chǔ)和查詢。
(3)?利用機(jī)器學(xué)習(xí)庫sklearn、NumPy等對(duì)數(shù)據(jù)進(jìn)行清洗與分析。
(4)?使用Matplotlib繪圖可視化制作圖表。



















