貪心自然語言處理高級(jí)魔鬼訓(xùn)練營(yíng)11期
NLP 與文本挖掘(或文本分析)之間的不同
自然語言處理是理解給定文本的含義與結(jié)構(gòu)的流程。
文本挖掘或文本分析是通過模式識(shí)別提起文本數(shù)據(jù)中隱藏的信息的流程。
自然語言處理被用來理解給定文本數(shù)據(jù)的含義(語義),而文本挖掘被用來理解給定文本數(shù)據(jù)的結(jié)構(gòu)(句法)。
例如,在「I found my wallet near the bank」一句中,NLP 的任務(wù)是理解句尾「bank」一詞指代的是銀行還是河邊。
三、NLP在人工智能中的地位

由于自然語言是人類區(qū)別于其他動(dòng)物的根本標(biāo)志。沒有語言,人類的思維也就無從談起,所以自然語言處理體現(xiàn)了人工智能的最高任務(wù)與境界,也就是說,只有當(dāng)計(jì)算機(jī)具備了處理自然語言的能力時(shí),機(jī)器才算實(shí)現(xiàn)了真正的智能。
事實(shí)上,“人工智能”被作為一個(gè)研究問題正式提出來的時(shí)候,創(chuàng)始人把計(jì)算機(jī)國(guó)際象棋和機(jī)器翻譯作為兩個(gè)標(biāo)志性的任務(wù),認(rèn)為只要國(guó)際象棋系統(tǒng)能夠打敗人類世界冠軍,機(jī)器翻譯系統(tǒng)達(dá)到人類翻譯水平,就可以宣告人工智能的勝利。四十年后的1997年,IBM公司的深藍(lán)超級(jí)計(jì)算機(jī) 已經(jīng)能夠打敗國(guó)際象棋世界冠軍卡斯帕羅夫。而機(jī)器翻譯到現(xiàn)在仍無法與人類翻譯水平相比,從此可以看出自然語言處理有多么困難!
一句話總結(jié)就是,語言是文明的標(biāo)志,是人類思維邏輯和情感線索的載體,自然語言處理正是人工智能的最高境界。