用AI回憶起曾被忘卻的語言

































語言是文明的DNA,然而聯(lián)合國教科文組織調(diào)查數(shù)據(jù)顯示,全球有七千多種有記錄的語言,超過400種瀕危,兩千種極危。中國語言種類繁多,目前有130 多種語言,有25種語言使用人口已不足千人。
以前的少數(shù)民族語言保護(hù)是采用田野調(diào)查建立起龐大的口語語料庫,保存了原始聲音文件和國際音標(biāo)標(biāo)注等豐富素材,但工作人員往往只能獲得單語語料,無法有效解讀語義,而且中國國土面積廣闊,田野調(diào)查的時(shí)間和經(jīng)費(fèi)成本非常高,少數(shù)民族語言的保護(hù)傳承工作道阻且長。
隨著AI技術(shù)在千行百業(yè)中的深入發(fā)展,大家發(fā)現(xiàn)AI技術(shù)在保護(hù)少數(shù)民族語言方面有獨(dú)特的優(yōu)勢(shì),研發(fā)出的無監(jiān)督跨語言詞向量算法+OCR光學(xué)智能識(shí)別技術(shù)合成的自動(dòng)生成式“漢語-少數(shù)民族語言”辭典成為保護(hù)少數(shù)民族語言的曙光。下面就讓白洞帶大家了解AI究竟是如何保護(hù)少數(shù)民族語言的吧!
標(biāo)簽:AI