貴州醬酒頤和酒業(yè)有限公司 張衛(wèi)軍 文本分析的價值
文本數(shù)據(jù)屬于非結(jié)構(gòu)化數(shù)據(jù),數(shù)據(jù)信息更為復(fù)雜,具有不規(guī)則、不完整性特征,無法通過既定的數(shù)據(jù)模型直接分析。需要將文本數(shù)據(jù)進行預(yù)處理,輸出可以應(yīng)用數(shù)據(jù)庫二位邏輯表來表現(xiàn)的數(shù)據(jù)。
文本數(shù)據(jù)的來源很多,例如微博、小紅書、知乎、淘寶、論壇、視頻網(wǎng)站等等。在電商領(lǐng)域,本文數(shù)據(jù)來源主要來自電商直播的聊天窗口、客服咨詢界面、產(chǎn)品售后評價等。分析方法主要為文本數(shù)據(jù)預(yù)處理,提煉出主要分析維度和細分維度,匹配維度下的關(guān)鍵詞,輸出各維度的詞頻和轉(zhuǎn)化率,挖掘用戶觀點,發(fā)現(xiàn)產(chǎn)品機會點。

標(biāo)簽: