主題挖掘LDA和情感分析圖書館話題知乎用戶問答行為數(shù)據(jù)|附代碼數(shù)據(jù)
全文鏈接:http://tecdat.cn/?p=16890
最近我們被客戶要求撰寫關(guān)于主題挖掘LDA和情感分析的研究報告,包括一些圖形和統(tǒng)計輸出。
當(dāng)前是大數(shù)據(jù)盛行的時代,各種用戶信息行為數(shù)據(jù)分析的結(jié)果影響著人們的生活和學(xué)習(xí),同時對圖書館的發(fā)展也有著影響
▼
?
本文在圖書館話題下知乎用戶問答行為數(shù)據(jù)的基礎(chǔ)上,分析了圖書館信息資源建設(shè)的新要求,并提出了相關(guān)建議。
?
圖書館熱門話題
?
通過主題挖掘分析知乎熱門圖書館話題下的問答,了解到目前大多數(shù)用戶去圖書館不再單純的以獲取資源為目的,除了借還書和查閱文獻資料外,更多的讀者是選擇來圖書館進行自習(xí)、復(fù)習(xí)、備考,他們認為圖書館更有學(xué)習(xí)的氛圍,同時有很多用戶關(guān)注圖書館交友的話題。
?
?
圖表1
?

?
我們從評論數(shù)量、被關(guān)注度和贊同數(shù)量來評估用戶的參與程度,可以看到圖書館交友話題(主題1)關(guān)注人數(shù)和贊同人數(shù)最多(如圖書館怎么認識女生?),其次是考研、復(fù)習(xí)(主題3)的相關(guān)話題(如圖書館應(yīng)該為考研學(xué)生提供特權(quán)嗎?),該話題下討論的人數(shù)最多。接下來是學(xué)校圖書館對外開放(主題2)的話題(如公辦大學(xué)的圖書館/自習(xí)室該不該對外開放?)和學(xué)習(xí)環(huán)境話題(主題4)(如本部圖書館內(nèi)部環(huán)境設(shè)置怎么樣,在同類高校中是屬于很陳舊的還是很現(xiàn)代化的?)。
點擊標(biāo)題查閱往期內(nèi)容

自然語言處理NLP:主題LDA、情感分析疫情下的新聞文本數(shù)據(jù)

左右滑動查看更多

01

02

03

04

?
圖書館話題內(nèi)容表達的情感
?
接下來,通過主題挖掘和情感分析(也稱為意見挖掘)知乎熱門話題下的問答,我們詳細看下熱門話題中用戶表達了哪些情感。
?
?
圖表2
?

?
從圖書館資源設(shè)施和學(xué)習(xí)環(huán)境話題來看,環(huán)境優(yōu)美、設(shè)施齊全的圖書館的上座率更高,在期末備考或者迎接大型考試的前期圖書館的上座率又普遍上升,大多用戶對占座表達出負面情緒,這說明在用戶看來圖書館是整個學(xué)校最能提供足夠?qū)W習(xí)氛圍的場所,融休閑與學(xué)習(xí)為一體的咖啡廳式圖書館更受廣大用戶的喜愛。圖書館交友話題最為熱門,很多用戶有“書中自有顏如玉”的想法,預(yù)設(shè)圖書館是浪漫邂逅的地方。同時,從聊天、吵鬧等負面關(guān)鍵詞來看大多數(shù)用戶表達出他們更愿意在安靜愜意的圖書館環(huán)境里來讀書。
?
?
疫情前后的圖書館話題
?
?
新型冠狀病毒導(dǎo)致的肺炎疫情給大學(xué)圖書館信息資源建設(shè)工作帶來了極大影響和沖擊,通過時間線的對比,我們發(fā)現(xiàn)疫情前后的圖書館話題數(shù)量和情感表現(xiàn)發(fā)生明顯變化。
?
?
圖表3
?

?
由于疫情原因,圖書館閉館后,很多用戶表達出了開館少、無法自習(xí)、借書逾期等負面情感。從正面情感來看,一些用戶回答表示圖書館加強了網(wǎng)絡(luò)在線服務(wù),確保數(shù)據(jù)庫資源正常使用和相關(guān)文獻資源使用權(quán),還策劃了一些列活動以期更加全面地幫助全校師生在疫情防控期間充分利用網(wǎng)絡(luò)進行專業(yè)資源,助力師生更好地開展學(xué)習(xí)、生活和科研等工作。同時,圖書館免除讀者在疫情防控期間所產(chǎn)生的圖書逾期費用。面對新冠病毒導(dǎo)致的肺炎疫情帶來的深遠沖擊,抓住機遇,引入新技術(shù)、新模式,更好地保障用戶的科研、學(xué)習(xí)需求,是當(dāng)前圖書館的必然選擇。

本文摘選?《?數(shù)據(jù)視域下圖書館話題情感分析?》?,點擊“閱讀原文”獲取全文完整資料。
點擊標(biāo)題查閱往期內(nèi)容
文本挖掘NLP分析:LDA主題模型分析網(wǎng)購數(shù)據(jù)
游記數(shù)據(jù)感知旅游目的地形象
數(shù)據(jù)類崗位需求的數(shù)據(jù)面NLP自然語言處理—主題模型LDA案例:挖掘人民網(wǎng)留言板文本數(shù)據(jù)
Python主題建模LDA模型、t-SNE 降維聚類、詞云可視化文本挖掘新聞組數(shù)據(jù)集
自然語言處理NLP:主題LDA、情感分析疫情下的新聞文本數(shù)據(jù)
R語言對NASA元數(shù)據(jù)進行文本挖掘的主題建模分析
R語言文本挖掘、情感分析和可視化哈利波特小說文本數(shù)據(jù)
Python、R對小說進行文本挖掘和層次聚類可視化分析案例
用于NLP的Python:使用Keras進行深度學(xué)習(xí)文本生成
長短期記憶網(wǎng)絡(luò)LSTM在時間序列預(yù)測和文本分類中的應(yīng)用
用Rapidminer做文本挖掘的應(yīng)用:情感分析
R語言文本挖掘tf-idf,主題建模,情感分析,n-gram建模研究
R語言對推特twitter數(shù)據(jù)進行文本情感分析
Python使用神經(jīng)網(wǎng)絡(luò)進行簡單文本分類
用于NLP的Python:使用Keras的多標(biāo)簽文本LSTM神經(jīng)網(wǎng)絡(luò)分類
R語言文本挖掘使用tf-idf分析NASA元數(shù)據(jù)的關(guān)鍵字
R語言NLP案例:LDA主題文本挖掘優(yōu)惠券推薦網(wǎng)站數(shù)據(jù)
Python使用神經(jīng)網(wǎng)絡(luò)進行簡單文本分類
R語言自然語言處理(NLP):情感分析新聞文本數(shù)據(jù)
Python、R對小說進行文本挖掘和層次聚類可視化分析案例
R語言對推特twitter數(shù)據(jù)進行文本情感分析
R語言中的LDA模型:對文本數(shù)據(jù)進行主題模型topic modeling分析
R語言文本主題模型之潛在語義分析(LDA:Latent Dirichlet Allocation)