【優(yōu)秀開題報告】美團外賣個性化推薦系統(tǒng)開題報告
一、選題的目的、意義、研究現(xiàn)狀,本選題研究的基本內(nèi)容、擬解決的主要問題:?
1、研究目的
伴隨著外賣行業(yè)蓬勃發(fā)展,為了滿足商家需要及時了解消費者的消費需求,以及消費者能夠找到直觀了解外賣商品的信息并且能更好更準確的為顧客服務,因此開發(fā)一個完善的美團外賣數(shù)據(jù)爬取系統(tǒng)十分必要。本課題的主要目的是開發(fā)美團外賣數(shù)據(jù)爬取系統(tǒng),以滿足廣大消費者和商家的需要。
2、研究意義
本課題來源于生產(chǎn)實際,本系統(tǒng)基于美團外賣店鋪自營的商業(yè)模式,并且在校期間有做過類似于基于Hadoop大數(shù)據(jù)平臺下的用戶喜好推薦分析而進行課題研究,美團外賣數(shù)據(jù)爬取系統(tǒng)解決的是消費者選擇到自己合意的商品,同時擴大了外賣店鋪的知名度和提高外賣銷量,被更多的用戶所選擇,而不僅僅局限于以往的大海撈針。
3、研究現(xiàn)狀
近年來,隨著我國經(jīng)濟與科技的飛速發(fā)展,人們的生活水平正在不斷提高。人們在追求高質(zhì)量的生活質(zhì)量的同時,也試圖尋求一種更加方便快捷的生活方式,網(wǎng)上訂餐方式應運而生。網(wǎng)上訂餐方式對我們來說并不陌生,可以說是與我們的生活息息相關。隨著網(wǎng)上訂餐方式給我們的工作與學習生活帶來了巨大的便利,這種訂餐方式也得到了越來越多人的認可和接受。隨著時間推移,人們對餐外賣飲的要求也越來越高,不僅要求解決溫飽,更要追求味覺的享受。針對消費者這一需求,同時使消費者更加清晰明了的掌握所在外賣的信息情況,在基于大量數(shù)據(jù)的前提下,對美團外賣信息數(shù)據(jù)進行分類的處理,并以圖像化的結(jié)果展示在用戶面前。我們依次通過理論研究、算法設計、系統(tǒng)實現(xiàn)以及實驗驗證等階段,最終來完成該查詢系統(tǒng)。該系統(tǒng)可根據(jù)用戶的查詢行為,查詢處所需要的外賣數(shù)據(jù);希望在總體誤差的約束內(nèi)獲得近似的查詢結(jié)果,以權(quán)衡查詢結(jié)果的準確性和誤差率?。同時在信息化的今天,數(shù)據(jù)信息已經(jīng)成為了這個時代發(fā)展的重要標志之一,外賣商家等數(shù)據(jù)在日常訂餐生活中不可缺少,本系統(tǒng)就是為了讓用戶體驗到查看外賣商品及數(shù)據(jù)的方便性和直觀性。
4、研究內(nèi)容
(1)爬蟲模塊,使用requests模塊發(fā)起請求,爬取美團美食數(shù)據(jù);
(2)用戶模塊,使用django做后端使用diango-allauth實現(xiàn)用戶登錄,注冊,注冊時郵箱驗證,找回密碼(通過郵箱找回);
(3)檢索模塊,可以根據(jù)關鍵詞檢索數(shù)據(jù)??梢圆榭疵朗硵?shù)據(jù);
(4)點贊和推薦模塊,可以查看美食數(shù)據(jù)進行點贊,在美食詳情頁面有推薦類似美食;
(5)可視化模塊,可視化圖表分析。
?
5、擬解決的主要問題
(1)解決商家渴望了解何種因素影響自家商品銷量的問題。
通過調(diào)查法、案例分析法、數(shù)據(jù)歸納法,分析互聯(lián)網(wǎng)餐飲外賣商家的現(xiàn)有數(shù)據(jù)。得出當前影響消費者對于外賣選擇的因素,分清哪些是正面影響繼續(xù)保持,哪些是負面影響迅速改進。使商家明白消費者的需求,從中設計出有效的銷售策略,增強店鋪綜合競爭力。
(2)解決消費者面臨眾多外賣商品不知如何選擇的問題。
消費者對于外賣的選擇不再是大海撈針式的海選,更加直觀的了解到不同商家的特點以及其他消費者對商家的評價,從而做出自己的決斷。
二、選題研究步驟、研究方法及措施:?
按照軟件工程開發(fā)規(guī)范進行課題的設計、實現(xiàn)、測試和部署發(fā)布,編寫對應的設計和測試文檔、創(chuàng)建課題的運行環(huán)境,完成課題所需的數(shù)據(jù)庫創(chuàng)建和源代碼編寫。
(1)項目前期階段
美團外賣作為現(xiàn)階段外賣市場的龍頭老大,其數(shù)據(jù)也具有普遍代表意義。確定數(shù)據(jù)來源為美團外賣店鋪、用戶評價、用戶好評率、商品銷量、商品種類、數(shù)據(jù)。
(2)數(shù)據(jù)采集階段
通過python的scrapy框架對店鋪、用戶評價、評論等數(shù)據(jù)的爬取,考慮到所爬取數(shù)據(jù)內(nèi)容復雜且數(shù)據(jù)為json格式,初始階段爬取到的數(shù)據(jù)采用MongoDB數(shù)據(jù)庫進行存儲。
(3)數(shù)據(jù)清洗階段
對所采集的大量數(shù)據(jù)進行數(shù)據(jù)清洗、集成、規(guī)約等處理,通過填補遺漏數(shù)據(jù)、消除異常數(shù)據(jù)、平滑噪聲數(shù)據(jù),以及糾正不一致數(shù)據(jù),去掉數(shù)據(jù)中的噪音、填充空值、丟失值和處理不一致數(shù)據(jù),確保數(shù)據(jù)的完整性、唯一性、權(quán)威性、合法性、一致性,經(jīng)過預處理之后的、具有一定價值的數(shù)據(jù)訓著存儲在MySQL數(shù)據(jù)庫中。
(4)數(shù)據(jù)分析階段
首先,使用統(tǒng)計學分析方法,分析并展示用戶外賣種類喜好分布、商家銷量排名。以及時間和空間維度上的外賣銷量數(shù)據(jù)。以商家銷售量和消費者好評率為指標,將協(xié)同過濾結(jié)果劃分為兩類。推薦商家、不推薦商家將其作為分類屬性基于算法建立決策樹模型得到配送費、店鋪評分和好評率是影響是否推薦消費者選擇商家的主要因素然后從決策樹中提取分類規(guī)則。最后,基于Django搭建網(wǎng)站框架,圖形化展示外賣店鋪的特點以及用戶的喜好情況
2、研究方法及措施
計算機:一臺能夠支持協(xié)同過濾算法模型訓練的計算機,內(nèi)存32G,I5CPU
開發(fā)環(huán)境: Python 3.7 ?, mysql 5.7.23
數(shù)據(jù)需求:近年來美團外賣重慶地區(qū)的店鋪、用戶評價等數(shù)據(jù)。
(1)文獻調(diào)研法,通過知網(wǎng)、萬方、維普等文獻網(wǎng)站查詢本課題相關的文獻,認真閱讀并歸納總結(jié),得出問題解決研究方案。
(2)比較分析法,在確定店鋪算法時,通過對算法的分析和運算,選出適合商家和消費者推薦的算法或模型。
(3)數(shù)據(jù)分析法,通過收集美團商家數(shù)據(jù),分析其特點,從而找到適合的模型或算法。
(4)實驗分析法,通過大量的實驗計算,驗證相關算法,并以此為基礎,完成原型系統(tǒng)的開發(fā)實現(xiàn)。
三、選題研究工作進度:
起訖日期
主要工作內(nèi)容
2021.10.21-2021.11.12
選題、調(diào)研、收集資料
2021.11.13-2021.11.28
論證、開題、撰寫開題報告
2021.11.29-2022.1.31
實踐研究、資料搜集過程
2022.2.1-2022.5.17
論文寫作
2022.3.14-2022.3.21
中期檢查
2022.5.18-2022.5.25
論文答辯
四、主要參考文獻:
[1] 李洪磊,姜珊.O2O模式下的“餐飲外賣”對餐飲業(yè)的影響[J].電子商務,2017(07):1+67.
[2] 溫玥.外賣平臺商家銷量的影響因素研究[D].哈爾濱工業(yè)大學,2020.
[3] 楊文雅.基于數(shù)據(jù)挖掘的美團外賣商家評分研究[D].山東師范大學,2020.
[4]漆智勤.基于 O2O 模式的外賣訂餐系統(tǒng)[D]. 南昌: 南昌大學計算機技術(shù)學科碩士學位論文, 2014: 1-2
[5]漆智勤.基于O2O模式的外賣訂餐系統(tǒng)[D].南昌: 南昌大學計算機技術(shù)學科碩士學位論文, 2014:1-2
[6]夏名首,劉玉林.基于K-MEANS聚類的電商店鋪經(jīng)營策略分析[J].商業(yè)經(jīng)濟研究,2017(05):52-54.
[7]王丹.餐飲外賣O2O物流服務質(zhì)量顧客滿意度影響因素實證研究[D].西安電子科技大學,2019.
[8]亓梓諭,錢瑛, 林敏捷. 外賣訂餐平臺模式分析及優(yōu)化[J]. 電子商務, 2015, (4):47-48.
[9]王娜. 電子商務中的 O2O 模式[J]. 山東行政學院學報, 2012, (5): 76-78
[10]盧益清, 李忱. O2O 商業(yè)模式及發(fā)展前景研究[J]. 企業(yè)經(jīng)濟, 2013, (11): 98-101.
[11]劉鵬.O2O 本地生活服務電子商務模式研究[D].北京: 北京郵電大學.工商管理碩士學位論文, 2012: 29-34.
[12] Zhao Yuhao. Research on wireless distributed financial risk data stream mining based on dual privacy protection. 2020, 2020(1)