[Python-gensim]LDA主題模型全解析:理論講解、C刊精讀與代碼實操
2023-08-16 14:03 作者:nongfusummer | 我要投稿

LDA主題模型全解析
?
00:15
??
03:36
?將語料庫輸入LDA,結(jié)果:(1)語料中隱含哪些主題(2)提取主題詞(3)根據(jù)不同主題在某篇文檔中的概率分布,將該篇文檔進(jìn)行主題歸類
?
04:59
?主題熱度-評估相關(guān)主題的演化趨勢
- ?07:35?
- LDA進(jìn)行主題識別
- 確定最優(yōu)主題數(shù)目
- 主題熱度計算
- 主題熱度隨時間變化
?
08:02
?閾值-取均值
- ?11:51?
- jieba分詞的處理
- LDA可以獲取文檔-主題概率矩陣和主題-詞分布
- 基于文檔-主題概率矩陣,計算主題強度,識別熱點主題
- 基于主題-詞分布,凝練主題內(nèi)容,并繪制詞云
?
12:32
?- ?14:25?
- ?15:59?
- 結(jié)合LDAvis判斷最優(yōu)主題數(shù)目(更直觀)
- 不同主題類別的文獻(xiàn)數(shù)量統(tǒng)計,不同主題分時間段的文獻(xiàn)數(shù)量統(tǒng)計
?
16:30
?最優(yōu)主題數(shù)目的確定按照一致性得分(coherence score),不同于之前三篇文章
- ?17:57?
- 依據(jù)LDA主題提取結(jié)果繪制主題演進(jìn)?;鶊D
- LDA功能實現(xiàn)
- 文本預(yù)處理
- 結(jié)合ldavis確定最優(yōu)主題書
- 文檔-主題矩陣
- 主題-詞分布
- 主題強度/熱度計算
- 分階段強度/熱度
- 各主題包含的文檔數(shù)量統(tǒng)計
- 隨時間變化
- 主題詞云
- 主題演進(jìn)?;鶊D
標(biāo)簽: