馬老師電商項(xiàng)目--用戶評(píng)論情感分析 馬老師大型電商日志離線分析系統(tǒng)
2023-04-06 11:09 作者:獅子王萬(wàn)受無(wú)疆 | 我要投稿
倒排索引的結(jié)構(gòu),適用于快速的全文(Text)搜索。一個(gè)倒排索引由文檔中所有不重復(fù)詞的列表構(gòu)成,對(duì)于其中每個(gè)詞,有一個(gè)包含它的文檔列表。
倒排索引建立的是分詞(Term)和文檔(Document)之間的映射關(guān)系,在倒排索引中,數(shù)據(jù)是面向詞而不是面向文檔的。
Term(詞):精準(zhǔn)值,foo、Foo是不相同的詞
Text(文本):非結(jié)構(gòu)化文本,默認(rèn)文本會(huì)被解析為詞,這是索引中實(shí)際存儲(chǔ)的內(nèi)
?
標(biāo)簽: