自然語言處理NLP:主題LDA、情感分析疫情下的新聞文本數(shù)據(jù)|附代碼數(shù)據(jù)
全文鏈接:http://tecdat.cn/?p=12310
最近我們被客戶要求撰寫關(guān)于自然語言處理NLP的研究報告,包括一些圖形和統(tǒng)計輸出。
新冠肺炎的爆發(fā)讓今年的春節(jié)與往常不同。與此同時,新聞記錄下了這場疫情發(fā)展的時間軸
▼
為此我們分析了疫情相關(guān)的新聞內(nèi)容、發(fā)布時期以及發(fā)布內(nèi)容的主題和情感傾向這些方面的數(shù)據(jù),希望通過這些數(shù)據(jù),能對這場疫情有更多的了解。
新聞對疫情相關(guān)主題的情感傾向
通過對疫情相關(guān)的新聞進行主題分析和情感分析,我們可以得到每個主題的關(guān)鍵詞以及情感分布。
圖表1

癥狀檢測主題的新聞內(nèi)容表達出最多積極情感,該話題下討論的是醫(yī)院中檢測患者的癥狀,其次是城市服務(wù)以及學(xué)校相關(guān)的新聞內(nèi)容,討論了商店關(guān)閉,社區(qū)隔離和學(xué)校延遲開學(xué)等話題,生活主題也表達出較多的積極情感(關(guān)鍵詞:時間、家庭),疫情增加了家人相處的時間(圖1)。
點擊標(biāo)題查閱往期相關(guān)內(nèi)容

R語言自然語言處理(NLP):情感分析新聞文本數(shù)據(jù)

左右滑動查看更多

01

02

03

04

新聞表達的情感傾向隨時間變化
考慮到新聞發(fā)布的時間、新聞相關(guān)的話題因素,圖2顯示了通過情感交叉分析得到的結(jié)果。
圖表2

從話題排名來看,不同時間段的新聞中最熱門的話題都有經(jīng)濟、出行和政治。從情感分布來看,1月份的經(jīng)濟主題新聞表達出較多的負面情緒(如股市因?qū)跔畈《镜娜找骊P(guān)注而下跌)。3月份隨著疫情逐漸好轉(zhuǎn),城市主題新聞(如疫情期間保證商店服務(wù)和生產(chǎn)經(jīng)營)的熱度排名超過防護主題(關(guān)鍵詞:口罩,洗手,健康等)。從1月到3月,各個主題下的積極情感比例都在不斷增加。
新聞對不同主題關(guān)鍵詞的關(guān)注度
考慮到不同話題的關(guān)注度,圖3顯示了高頻關(guān)鍵詞的分布。
圖表3

從中我們可以看到疫情相關(guān)的新聞中最關(guān)注的方面,首先是健康,家庭和隔離和出行,其中健康出現(xiàn)的頻率最高。然后關(guān)注的話題,包含冠狀病毒、疫情期間的工作和病毒檢測。其次關(guān)注的話題包含區(qū)分健康和感染的癥狀。其他關(guān)注的熱門關(guān)鍵詞包含學(xué)校、商業(yè)、旅行和經(jīng)濟等。
本文章中的所有信息(包括但不限于分析、預(yù)測、建議、數(shù)據(jù)、圖表等內(nèi)容)僅供參考,拓端數(shù)據(jù)(tecdat)不因文章的全部或部分內(nèi)容產(chǎn)生的或因本文章而引致的任何損失承擔(dān)任何責(zé)任。

本文摘選?《?自然語言處理NLP:主題LDA、情感分析疫情下的新聞文本數(shù)據(jù)?》?,點擊“閱讀原文”獲取全文完整資料。

點擊標(biāo)題查閱往期內(nèi)容
【視頻】文本挖掘:主題模型(LDA)及R語言實現(xiàn)分析游記數(shù)據(jù)
NLP自然語言處理—主題模型LDA案例:挖掘人民網(wǎng)留言板文本數(shù)據(jù)
Python主題建模LDA模型、t-SNE 降維聚類、詞云可視化文本挖掘新聞組數(shù)據(jù)集
自然語言處理NLP:主題LDA、情感分析疫情下的新聞文本數(shù)據(jù)
R語言對NASA元數(shù)據(jù)進行文本挖掘的主題建模分析
R語言文本挖掘、情感分析和可視化哈利波特小說文本數(shù)據(jù)
Python、R對小說進行文本挖掘和層次聚類可視化分析案例
用于NLP的Python:使用Keras進行深度學(xué)習(xí)文本生成
長短期記憶網(wǎng)絡(luò)LSTM在時間序列預(yù)測和文本分類中的應(yīng)用
用Rapidminer做文本挖掘的應(yīng)用:情感分析
R語言文本挖掘tf-idf,主題建模,情感分析,n-gram建模研究
R語言對推特twitter數(shù)據(jù)進行文本情感分析
Python使用神經(jīng)網(wǎng)絡(luò)進行簡單文本分類
用于NLP的Python:使用Keras的多標(biāo)簽文本LSTM神經(jīng)網(wǎng)絡(luò)分類
R語言文本挖掘使用tf-idf分析NASA元數(shù)據(jù)的關(guān)鍵字
R語言NLP案例:LDA主題文本挖掘優(yōu)惠券推薦網(wǎng)站數(shù)據(jù)
Python使用神經(jīng)網(wǎng)絡(luò)進行簡單文本分類
R語言自然語言處理(NLP):情感分析新聞文本數(shù)據(jù)
Python、R對小說進行文本挖掘和層次聚類可視化分析案例
R語言對推特twitter數(shù)據(jù)進行文本情感分析
R語言中的LDA模型:對文本數(shù)據(jù)進行主題模型topic modeling分析
R語言文本主題模型之潛在語義分析(LDA:Latent Dirichlet Allocation)R語言對NASA元數(shù)據(jù)進行文本挖掘的主題建模分析
R語言文本挖掘、情感分析和可視化哈利波特小說文本數(shù)據(jù)
Python、R對小說進行文本挖掘和層次聚類可視化分析案例
用于NLP的Python:使用Keras進行深度學(xué)習(xí)文本生成
長短期記憶網(wǎng)絡(luò)LSTM在時間序列預(yù)測和文本分類中的應(yīng)用
用Rapidminer做文本挖掘的應(yīng)用:情感分析
R語言文本挖掘tf-idf,主題建模,情感分析,n-gram建模研究
R語言對推特twitter數(shù)據(jù)進行文本情感分析
Python使用神經(jīng)網(wǎng)絡(luò)進行簡單文本分類
用于NLP的Python:使用Keras的多標(biāo)簽文本LSTM神經(jīng)網(wǎng)絡(luò)分類
R語言文本挖掘使用tf-idf分析NASA元數(shù)據(jù)的關(guān)鍵字
R語言NLP案例:LDA主題文本挖掘優(yōu)惠券推薦網(wǎng)站數(shù)據(jù)
Python使用神經(jīng)網(wǎng)絡(luò)進行簡單文本分類
R語言自然語言處理(NLP):情感分析新聞文本數(shù)據(jù)
Python、R對小說進行文本挖掘和層次聚類可視化分析案例
R語言對推特twitter數(shù)據(jù)進行文本情感分析
R語言中的LDA模型:對文本數(shù)據(jù)進行主題模型topic modeling分析
R語言文本主題模型之潛在語義分析(LDA:Latent Dirichlet Allocation)