小象-文本內容糾錯項目實戰(zhàn)
自然語言。詞向量化可以捕捉到自然語言和實數(shù)間的本質關系。通過詞向量化,一個詞語或者一段短語可以用一個定維的向量表示,例如向量的長度可以為100。
4. 詞性標注
什么是詞性標注?簡單來說,詞性標注是對句子中的詞語標注為名字、動詞、形容詞、副詞等的過程。
5. 命名實體消歧
什么是命名實體消岐?命名實體消岐是對句子中的提到的實體識別的過程。例如,對句子“Apple earned a revenue of 200 Billion USD in 2016”,命名實體消岐會推斷出句子中的Apple是蘋果公司而不是指一種水果。一般來說,命名實體要求有一個實體知識庫,能夠將句子中提到的實體和知識庫聯(lián)系起來。
標簽: