自然語言處理 緒論習題
問題1:NLP的定義是什么?
自然語言處理(Natureal Language Processing,NLP)是研究利用計算機技術對語言文本(句子、篇章或話語等)進行處理和加工的一門學科,研究內容包括對詞法、句法、語義和語用等信息的識別、分類、提取、轉換和生成等各種處理方法和實現(xiàn)技術。--------《計算機科學技術百科全書》宗成慶
也就是利用計算機模擬人的語言智能。
問題2:自然語言與人工語言的區(qū)別是什么?
自然語言是自然形成的人類語言,例如漢語,英語。人工語言是人類設計出的語言系統(tǒng),例如C語言,Python語言。
問題3:NLP經(jīng)歷的三個階段是什么?
①理性主義:符號邏輯。1947年到1990年,特點為 規(guī)則、詞典加上算法。
②經(jīng)驗主義:統(tǒng)計學習。1990年到2013年左右,特點為 語料、特征加上模型。
③連結主義:神經(jīng)網(wǎng)絡。特點為 語料?模型,在神級網(wǎng)絡大火后發(fā)展起來。
問題4:NLP的困難和挑戰(zhàn)是什么?
五個基本問題:①形態(tài)學問題②句法問題③語義問題④語用學問題⑤語言學問題
兩大主要困難:①大量歧義現(xiàn)象:a.語法歧義(分詞)? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?b.詞性歧義? c.結構歧義? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? d.語義歧義 e.語音歧義
? ? ? ? ? ? ? ? ? ? ?? ②大量未知語言現(xiàn)象: a.新詞? b.新含義? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?? ? c.新用法和新句型