【知識(shí)圖譜最值教程】第15節(jié) 知識(shí)抽取之 關(guān)系抽?。?)

關(guān)系抽取
任務(wù)定義:從文本中抽取出兩個(gè)或多個(gè)實(shí)體之間的語(yǔ)義關(guān)系
- 基于模板的方法,召回率低
1.1基于觸發(fā)詞匹配

1.2.基于依存句法分析匹配的關(guān)系抽取
對(duì)句子進(jìn)行分詞,詞性標(biāo)注,命名實(shí)體識(shí)別,依存分析等處理,分局依存語(yǔ)法樹(shù)匹配規(guī)則,生成三元組

2.基于機(jī)器學(xué)習(xí)的方法
預(yù)先定義關(guān)系類別,人工標(biāo)注數(shù)據(jù),設(shè)計(jì)特征表示,選擇分類方法,評(píng)估結(jié)果
如果兩個(gè)實(shí)體存在關(guān)系,存在句子描述這種關(guān)系
特征表示:

2.1特征函數(shù)+最大熵模型

2.2核函數(shù)方法
輸入句子X(jué),Y計(jì)算二者之間相似度得分
如果兩個(gè)實(shí)體對(duì)同時(shí)滿足一個(gè)關(guān)系,那么這兩個(gè)實(shí)體對(duì)所在的文本上下文應(yīng)該相似,相似通過(guò)核函數(shù)得到

機(jī)器學(xué)習(xí)方法方法總結(jié):

3.深度學(xué)習(xí)
建模詞組之間依賴關(guān)系,RNN,CNN

標(biāo)簽: