自然語言處理NLP:主題LDA、情感分析疫情下的新聞文本數(shù)據(jù)|附代碼數(shù)據(jù)
全文鏈接:http://tecdat.cn/?p=12310
最近我們被客戶要求撰寫關于自然語言處理NLP的研究報告,包括一些圖形和統(tǒng)計輸出。
新冠肺炎的爆發(fā)讓今年的春節(jié)與往常不同。與此同時,新聞記錄下了這場疫情發(fā)展的時間軸
▼
為此我們分析了疫情相關的新聞內容、發(fā)布時期以及發(fā)布內容的主題和情感傾向這些方面的數(shù)據(jù),希望通過這些數(shù)據(jù),能對這場疫情有更多的了解。
新聞對疫情相關主題的情感傾向
通過對疫情相關的新聞進行主題分析和情感分析,我們可以得到每個主題的關鍵詞以及情感分布。
圖表1

癥狀檢測主題的新聞內容表達出最多積極情感,該話題下討論的是醫(yī)院中檢測患者的癥狀,其次是城市服務以及學校相關的新聞內容,討論了商店關閉,社區(qū)隔離和學校延遲開學等話題,生活主題也表達出較多的積極情感(關鍵詞:時間、家庭),疫情增加了家人相處的時間(圖1)。
點擊標題查閱往期相關內容

R語言自然語言處理(NLP):情感分析新聞文本數(shù)據(jù)

左右滑動查看更多

01

02

03

04

新聞表達的情感傾向隨時間變化
考慮到新聞發(fā)布的時間、新聞相關的話題因素,圖2顯示了通過情感交叉分析得到的結果。
圖表2

從話題排名來看,不同時間段的新聞中最熱門的話題都有經(jīng)濟、出行和政治。從情感分布來看,1月份的經(jīng)濟主題新聞表達出較多的負面情緒(如股市因對冠狀病毒的日益關注而下跌)。3月份隨著疫情逐漸好轉,城市主題新聞(如疫情期間保證商店服務和生產(chǎn)經(jīng)營)的熱度排名超過防護主題(關鍵詞:口罩,洗手,健康等)。從1月到3月,各個主題下的積極情感比例都在不斷增加。
新聞對不同主題關鍵詞的關注度
考慮到不同話題的關注度,圖3顯示了高頻關鍵詞的分布。
圖表3
從中我們可以看到疫情相關的新聞中最關注的方面,首先是健康,家庭和隔離和出行,其中健康出現(xiàn)的頻率最高。然后關注的話題,包含冠狀病毒、疫情期間的工作和病毒檢測。其次關注的話題包含區(qū)分健康和感染的癥狀。其他關注的熱門關鍵詞包含學校、商業(yè)、旅行和經(jīng)濟等。
本文章中的所有信息(包括但不限于分析、預測、建議、數(shù)據(jù)、圖表等內容)僅供參考,拓端數(shù)據(jù)(tecdat)不因文章的全部或部分內容產(chǎn)生的或因本文章而引致的任何損失承擔任何責任。

本文摘選?《?自然語言處理NLP:主題LDA、情感分析疫情下的新聞文本數(shù)據(jù)?》?,點擊“閱讀原文”獲取全文完整資料。
點擊標題查閱往期內容
【視頻】文本挖掘:主題模型(LDA)及R語言實現(xiàn)分析游記數(shù)據(jù)
NLP自然語言處理—主題模型LDA案例:挖掘人民網(wǎng)留言板文本數(shù)據(jù)
Python主題建模LDA模型、t-SNE 降維聚類、詞云可視化文本挖掘新聞組數(shù)據(jù)集
自然語言處理NLP:主題LDA、情感分析疫情下的新聞文本數(shù)據(jù)
R語言對NASA元數(shù)據(jù)進行文本挖掘的主題建模分析
R語言文本挖掘、情感分析和可視化哈利波特小說文本數(shù)據(jù)
Python、R對小說進行文本挖掘和層次聚類可視化分析案例
用于NLP的Python:使用Keras進行深度學習文本生成
長短期記憶網(wǎng)絡LSTM在時間序列預測和文本分類中的應用
用Rapidminer做文本挖掘的應用:情感分析
R語言文本挖掘tf-idf,主題建模,情感分析,n-gram建模研究
R語言對推特twitter數(shù)據(jù)進行文本情感分析
Python使用神經(jīng)網(wǎng)絡進行簡單文本分類
用于NLP的Python:使用Keras的多標簽文本LSTM神經(jīng)網(wǎng)絡分類
R語言文本挖掘使用tf-idf分析NASA元數(shù)據(jù)的關鍵字
R語言NLP案例:LDA主題文本挖掘優(yōu)惠券推薦網(wǎng)站數(shù)據(jù)
Python使用神經(jīng)網(wǎng)絡進行簡單文本分類
R語言自然語言處理(NLP):情感分析新聞文本數(shù)據(jù)
Python、R對小說進行文本挖掘和層次聚類可視化分析案例
R語言對推特twitter數(shù)據(jù)進行文本情感分析
R語言中的LDA模型:對文本數(shù)據(jù)進行主題模型topic modeling分析
R語言文本主題模型之潛在語義分析(LDA:Latent Dirichlet Allocation)R語言對NASA元數(shù)據(jù)進行文本挖掘的主題建模分析
R語言文本挖掘、情感分析和可視化哈利波特小說文本數(shù)據(jù)
Python、R對小說進行文本挖掘和層次聚類可視化分析案例
用于NLP的Python:使用Keras進行深度學習文本生成
長短期記憶網(wǎng)絡LSTM在時間序列預測和文本分類中的應用
用Rapidminer做文本挖掘的應用:情感分析
R語言文本挖掘tf-idf,主題建模,情感分析,n-gram建模研究
R語言對推特twitter數(shù)據(jù)進行文本情感分析
Python使用神經(jīng)網(wǎng)絡進行簡單文本分類
用于NLP的Python:使用Keras的多標簽文本LSTM神經(jīng)網(wǎng)絡分類
R語言文本挖掘使用tf-idf分析NASA元數(shù)據(jù)的關鍵字
R語言NLP案例:LDA主題文本挖掘優(yōu)惠券推薦網(wǎng)站數(shù)據(jù)
Python使用神經(jīng)網(wǎng)絡進行簡單文本分類
R語言自然語言處理(NLP):情感分析新聞文本數(shù)據(jù)
Python、R對小說進行文本挖掘和層次聚類可視化分析案例
R語言對推特twitter數(shù)據(jù)進行文本情感分析
R語言中的LDA模型:對文本數(shù)據(jù)進行主題模型topic modeling分析
R語言文本主題模型之潛在語義分析(LDA:Latent Dirichlet Allocation)