基于hadoop的高校圖書館閱讀書目智慧推薦系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
1.選題背景及意義:
處于一個(gè)信息革命的時(shí)代里,互聯(lián)網(wǎng)技術(shù)的蓬勃發(fā)展,手機(jī)與手機(jī)之間、人與互聯(lián)網(wǎng)之間,互聯(lián)網(wǎng)與手機(jī)之間無時(shí)無刻不在進(jìn)行著信息交互。隨著信息技術(shù)的發(fā)展,線上與線下的結(jié)合也越發(fā)緊密。為了滿足人們對(duì)信息的渴望追求,各種各樣的應(yīng)用開發(fā)層出不窮,信息交互的方式更加多元。但是互聯(lián)網(wǎng)上信息數(shù)據(jù)的爆炸式增長(zhǎng),產(chǎn)生了許多垃圾信息并導(dǎo)致了信息冗長(zhǎng)復(fù)雜,信息過載慢慢成為人們高效獲取有用資訊的一個(gè)巨大的障礙,這導(dǎo)致消費(fèi)者想從大量信息中找到自己感興趣的信息,信息產(chǎn)出者想讓自己生產(chǎn)的信息脫穎而出從而得到關(guān)注變成一件很難的事情,推薦系統(tǒng)的任務(wù)就是連接用戶和信息。在信息過載的推動(dòng)下,使信息高效有針對(duì)性的呈現(xiàn)在大眾面前。
個(gè)性化推薦技術(shù)是根據(jù)用戶的歷史行為數(shù)據(jù)以及習(xí)慣數(shù)據(jù),主動(dòng)分析用戶的興趣喜好,并為用戶推薦符合其興趣愛好的物品?,F(xiàn)在隨著數(shù)據(jù)量的急劇增加,互聯(lián)網(wǎng)數(shù)據(jù)的級(jí)別已經(jīng)達(dá)到TB、PB、EB、ZB的級(jí)別,基于大數(shù)據(jù)的推薦已經(jīng)應(yīng)用而生。個(gè)性化推薦技術(shù)正是借助于機(jī)器學(xué)習(xí)以及數(shù)據(jù)挖掘算法才能夠成功應(yīng)用到各種各樣的電子商務(wù)平臺(tái)。但是在高校圖書館中圖書資源這個(gè)領(lǐng)域進(jìn)行個(gè)性化推薦還不夠普及和完善。早期國(guó)內(nèi)外有一些學(xué)者開始做圖書方面的個(gè)性化推薦,但是這些推薦都或多或少的存在一些問題,推薦不夠準(zhǔn)確,準(zhǔn)確率和召回率低,此外對(duì)大數(shù)據(jù)推薦沒有做一些技術(shù)處理,圖書推薦算法沒有改進(jìn),導(dǎo)致這些推薦系統(tǒng)沒有實(shí)現(xiàn)針對(duì)高校學(xué)生的真正意義上的個(gè)性化推薦。隨著高校圖書館資源越來越豐富,圖書館里面的圖書資源的種類和數(shù)量也是越來越多,圖書數(shù)據(jù)量呈指數(shù)爆炸式增長(zhǎng),在海量的圖書數(shù)據(jù)中如何挖掘出每個(gè)用戶的興趣和愛好,然后對(duì)用戶實(shí)現(xiàn)個(gè)性化推薦正是科研領(lǐng)域內(nèi)的研究者們?cè)谧龅难芯抗ぷ?。同時(shí)也是由于這種需求的存在,推薦技術(shù)被迅速運(yùn)用到高校圖書推薦領(lǐng)域。
2.國(guó)內(nèi)外背景分析:
20世紀(jì)90年代個(gè)性化推薦技術(shù)作為一個(gè)獨(dú)立的概念被正式提出,隨后在電子商務(wù)、人工智能等相關(guān)領(lǐng)域成為了非常熱門和受歡迎的獨(dú)立學(xué)科。如今,隨著大數(shù)據(jù)時(shí)代的到來,互聯(lián)網(wǎng)的各個(gè)領(lǐng)域競(jìng)爭(zhēng)都變的越來越激烈,個(gè)性化推薦技術(shù)已經(jīng)逐漸成為企業(yè)、高校、乃至國(guó)家提高其自身競(jìng)爭(zhēng)力的主要技術(shù)。個(gè)性化推薦的主要特點(diǎn)是為用戶提供精準(zhǔn)且有實(shí)際意義的推薦信息,擴(kuò)大并鎖住用戶群體進(jìn)而為企業(yè)帶來效益。目前,個(gè)性化推薦技術(shù)已經(jīng)為一些互聯(lián)網(wǎng)企業(yè)在電子商務(wù)領(lǐng)域帶來了較大的經(jīng)濟(jì)效益,其他一些領(lǐng)域的研究工作,還需要更加深入的研究和探索。例如,推動(dòng)企業(yè)在移動(dòng)互聯(lián)網(wǎng)資源方面的利用,如何提高企業(yè)的核心競(jìng)爭(zhēng)力、增強(qiáng)企業(yè)的知名度,讓更多的用戶對(duì)企業(yè)產(chǎn)生信任和依賴等。
國(guó)內(nèi)外關(guān)于推薦算法、推薦系統(tǒng)和個(gè)性化搜索的研究開始于上個(gè)世紀(jì)90年代,從90年代中期開始,誕生了第一個(gè)基于協(xié)同過濾推薦技術(shù)的推薦系統(tǒng)(Tapestry)然后以此為起始線,各個(gè)國(guó)家的學(xué)者和研究機(jī)構(gòu)開始對(duì)推薦系統(tǒng)的研究越來越關(guān)注,投入也越來越多,其主要是表現(xiàn)在推薦技術(shù)的改進(jìn),以此來適應(yīng)不同的領(lǐng)域和研究方向。從推薦算法所采用的技術(shù)可以將推薦技術(shù)主要分為基于內(nèi)容的推薦和協(xié)同過濾推薦其中基于內(nèi)容的推薦主要是根據(jù)用戶的歷史興趣信息來進(jìn)行物品的預(yù)測(cè),主要分析的是被推薦項(xiàng)目屬性之間的關(guān)系,它是根據(jù)項(xiàng)目的特征或者屬性進(jìn)行推薦?;趦?nèi)容的推薦技術(shù)存在一定的缺陷其主要表現(xiàn)在對(duì)用戶推薦的物品具有局限性,它只能向用戶推薦與其歷史興趣愛好相關(guān)的物品,無法實(shí)現(xiàn)對(duì)用戶興趣的調(diào)整。此外當(dāng)有大批項(xiàng)目被頻繁更新的時(shí)候,系統(tǒng)會(huì)因此變得非常不靈活,因此該算法適用性不是很廣。?
研究?jī)?nèi)容、研究方法與思路:
從兩個(gè)方面進(jìn)行描述:
1. 研究?jī)?nèi)容:
擬實(shí)現(xiàn)的內(nèi)容模塊:圖書管理模塊、用戶管理模塊、用戶瀏覽及閱讀信息挖掘模塊、智能推薦模塊、讀者反饋模塊、借閱管理模塊。本文研究的主要內(nèi)容是通過基于Hadoop大數(shù)據(jù)處理框架實(shí)現(xiàn)圖書的個(gè)性化推薦功能。圖書館內(nèi)的圖書資源眾多,用戶在進(jìn)行選擇時(shí)難免眼花繚亂,大數(shù)據(jù)推薦技術(shù)正好可以實(shí)現(xiàn)對(duì)用戶的個(gè)性化推薦,方便用戶快速找到自己需要的圖書資源。
2. 研究方法與思路:
對(duì)推薦算法的研究,通過比較分析了解國(guó)內(nèi)外推薦系統(tǒng)的研究狀況。主要是研究一些經(jīng)典的推薦算法包括協(xié)同過濾推薦算法、基于用戶的推薦、基于項(xiàng)目的推薦等,推薦算法在實(shí)際生活的各個(gè)領(lǐng)域中應(yīng)用很廣泛,具有很大的應(yīng)用價(jià)值,本文主要討論的是基于用戶的協(xié)同過濾推薦算法在個(gè)性化推薦系統(tǒng)中的應(yīng)用。?
主要?jiǎng)?chuàng)新點(diǎn):
(1)對(duì)Hadoop的整體框架以及其核心技術(shù)——HDFS和MapReduce作了詳細(xì)
介紹與分析。?
(2)對(duì)推薦系統(tǒng)的發(fā)展進(jìn)行了介紹,重點(diǎn)研究了推薦算法,對(duì)常用的幾類推薦算法及其性能評(píng)價(jià)做了較為詳細(xì)的介紹。??
(3)對(duì)本文所要實(shí)現(xiàn)的個(gè)性化推薦系統(tǒng)進(jìn)行了設(shè)計(jì),并按不同系統(tǒng)模塊依次進(jìn)行了細(xì)節(jié)描述,在Hadoop平臺(tái)上構(gòu)建起了一個(gè)個(gè)性化推薦系統(tǒng)
總體安排和計(jì)劃進(jìn)度:
2022年09月22日至2022年10月13日:根據(jù)任務(wù)書要求,做好開題準(zhǔn)備工作,完成開題報(bào)告;
2022年10月14日至2023年03月06日:完成課題主要任務(wù)并提交論文初稿;
2023年03月07日至2023年04月05日:完成課題任務(wù)并提交論文定稿,提交答辯相關(guān)資料;
2023年04月06日至2023年04月27日:答辯。
準(zhǔn)備情況:
1.文獻(xiàn)參考:
[1]楊凱. 基于Hadoop平臺(tái)的個(gè)性化新聞推薦系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D].北京交通大學(xué),2019.
[2] 楊宏勝. 基于大數(shù)據(jù)的用戶個(gè)性化推薦系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D].南京郵電大學(xué),2020.
[3] 劉暢. 基于Hadoop的影片推薦系統(tǒng)的研究與開發(fā)[D].華北電力大學(xué),2021.
[4] 葉熠琳. 基于Hadoop的個(gè)性化推薦系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D].天津大學(xué),2017.
[5] 王茜子. 基于混合算法的電影推薦系統(tǒng)的研究與設(shè)計(jì)[D].電子科技大學(xué),2020.
[6] 嚴(yán)亞寧.基于Hadoop的數(shù)據(jù)處理平臺(tái)的設(shè)計(jì)與開發(fā)研究[J].現(xiàn)代信息科技,2019,3(03):5-7.
[7] 劉媛媛. 基于Mahout的電子商務(wù)個(gè)性化推薦系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D].中國(guó)科學(xué)院大學(xué)(中國(guó)科學(xué)院工程管理與信息技術(shù)學(xué)院),2017.
[8] 楊議. 基于SSH架構(gòu)的高校自助化圖書管理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D].大連理工大學(xué),2015.
2.實(shí)驗(yàn)儀器設(shè)備準(zhǔn)備情況:
系統(tǒng)的實(shí)現(xiàn)采用的是基于SSH框架模式進(jìn)行開發(fā)Web推薦引擎的。系統(tǒng)的開發(fā)前端框架使用的是Jquery+EasyUI進(jìn)行搭建的。后端的開發(fā)環(huán)境是采用的是經(jīng)典的SSH框架。


