王立非:積極推進(jìn)中國式語言資源服務(wù)能力現(xiàn)代化建設(shè)
語言服務(wù)政策解讀之四:
王立非:積極推進(jìn)中國式語言資源服務(wù)能力現(xiàn)代化建設(shè)
國家發(fā)展改革委、商務(wù)部第52號令公布《鼓勵(lì)外商投資產(chǎn)業(yè)目錄(2022年版)》(以下簡稱《目錄》),將“語言服務(wù)產(chǎn)業(yè)”納入《目錄》(2022版)第460條的租賃與商務(wù)服務(wù)業(yè),包括翻譯、本地化服務(wù)、語言技術(shù)開發(fā)應(yīng)用、語言資源服務(wù)等,對于推進(jìn)服務(wù)業(yè)擴(kuò)大開放、助力語言服務(wù)產(chǎn)業(yè)高質(zhì)量發(fā)展意義重大。
教育部和國家語委《關(guān)于加強(qiáng)高等學(xué)校服務(wù)國家通用語言文字高質(zhì)量推廣普及的若干意見》(教語用〔2022〕2號)提出,探索數(shù)字化賦能推普新舉措。積極建設(shè)國家通用語言文字?jǐn)?shù)字化資源、教學(xué)和科研平臺。支持全球中文學(xué)習(xí)平臺和國家語言資源服務(wù)平臺建設(shè)。鼓勵(lì)建設(shè)特色鮮明的語言資源庫、語言博物館,逐步實(shí)現(xiàn)與中國語言文字?jǐn)?shù)字(網(wǎng)絡(luò))博物館、地方文化館和科技館等的互聯(lián)互通。語言資源是數(shù)字和人工智能時(shí)代的新型生產(chǎn)力要素,是數(shù)字治理、數(shù)字經(jīng)濟(jì)、數(shù)字貿(mào)易、數(shù)字人文必不可少的基礎(chǔ)性和戰(zhàn)略性生產(chǎn)資料。
一、中國式語言資源服務(wù)的內(nèi)涵和范圍
(一)語言資源服務(wù)的概念
語言資源指用于完成機(jī)器翻譯、開展教學(xué)研究、開發(fā)語言技術(shù)和實(shí)現(xiàn)語言交流等所需的各種語言相關(guān)的數(shù)據(jù)、工具和資料,包括以下幾類:1. 書面和口語語料庫、2. 詞典和詞匯資源、3. 語音資源、4. 翻譯記憶庫、5. 語言工具和軟件、6. 多語言資源、7. 語言學(xué)習(xí)資源等。語言資源的獲取、管理和利用通過語言資源服務(wù)來實(shí)現(xiàn),語言資源服務(wù)旨在提供高質(zhì)量、可持續(xù)、便捷的語言資源,支持各種語言相關(guān)的研究和應(yīng)用所需要的服務(wù),幫助個(gè)人和組織在全球化時(shí)代有效地應(yīng)對多語言環(huán)境的挑戰(zhàn),促進(jìn)文化交流、商務(wù)合作、技術(shù)創(chuàng)新,推動語言資源的有效利用和傳播。
(二)語言資源服務(wù)的范圍
語言資源服務(wù)包括語言信息資源服務(wù)、語言內(nèi)容資源服務(wù)、語言數(shù)據(jù)資源服務(wù)、語言技術(shù)資源服務(wù)、語言人力資源服務(wù)等。語言信息資源服務(wù)提供關(guān)于語言和文化的信息資源,包括語言學(xué)習(xí)資料、詞典、語法參考、翻譯指南等,幫助用戶了解和學(xué)習(xí)不同語言的基本知識和規(guī)則,提高語言應(yīng)用能力。語言內(nèi)容資源服務(wù)提供多語言的文本內(nèi)容資源,包括翻譯、本地化、內(nèi)容創(chuàng)作等服務(wù)。這些資源可以用于文化傳播、市場營銷、媒體發(fā)布等,以滿足不同語言和文化背景下的用戶需求。語言數(shù)據(jù)資源服務(wù)提供語言數(shù)據(jù)集和語料庫,用于語言處理、機(jī)器翻譯、自然語言處理等技術(shù)應(yīng)用。這些數(shù)據(jù)資源可以包括雙語對照語料、平行語料、翻譯記憶庫等,為語言技術(shù)的發(fā)展和應(yīng)用提供基礎(chǔ)支持。語言技術(shù)資源服務(wù)提供各種語言技術(shù)工具和平臺,包括機(jī)器翻譯系統(tǒng)、語音識別系統(tǒng)、語音合成系統(tǒng)等。這些技術(shù)資源可以幫助用戶進(jìn)行自動翻譯、語音識別、語音合成等語言相關(guān)的處理和應(yīng)用。語言人力資源服務(wù)提供專業(yè)的語言人力資源,包括翻譯、語言教師、語言專家、語言服務(wù)企業(yè)員工等,他們提供專業(yè)的語言服務(wù)和支持,滿足用戶在跨文化交流和多語言環(huán)境下的人力需求。
(三)中國式語言資源服務(wù)的特點(diǎn)
中國式語言資源服務(wù)是指在中國特定的語言環(huán)境和文化背景下進(jìn)行的語言資源保護(hù)與服務(wù),具有中國語言多樣性、文化傳承性、社區(qū)參與性、技術(shù)創(chuàng)新性和可持續(xù)發(fā)展性等鮮明的特點(diǎn)。中國擁有眾多的語言,包括漢語、藏語、蒙古語、維吾爾語等,十分注重保護(hù)和傳承各種語言的文化和多樣性,促進(jìn)不同語言的發(fā)展和交流。中國式語言資源服務(wù)注重語言與文化的緊密聯(lián)系,致力于保護(hù)和傳承語言所承載的文化元素,如口頭傳統(tǒng)、民間故事、傳統(tǒng)音樂和舞蹈等,以維護(hù)和弘揚(yáng)中國文化遺產(chǎn)。中國式語言資源服務(wù)強(qiáng)調(diào)社區(qū)的參與和共同努力,鼓勵(lì)語言社區(qū)自主組織和參與語言資源保護(hù)與服務(wù)的活動,如語言節(jié)日、文化展覽和社區(qū)項(xiàng)目,增強(qiáng)社區(qū)對語言的認(rèn)同和自豪感。中國式語言資源服務(wù)積極探索和應(yīng)用現(xiàn)代技術(shù)和工具,如語言學(xué)習(xí)軟件、在線資源和語言技術(shù),利用技術(shù)手段提升語言資源服務(wù)的效率和質(zhì)量,推動語言的傳承和發(fā)展。中國式語言資源服務(wù)注重語言資源的可持續(xù)發(fā)展,通過培養(yǎng)語言服務(wù)人才、制定相關(guān)政策和法律、促進(jìn)語言產(chǎn)業(yè)發(fā)展等方式,推動語言資源的保護(hù)和利用,為經(jīng)濟(jì)社會和文化繁榮提供支持。
二、語言資源服務(wù)的重點(diǎn)領(lǐng)域
(一)語言信息資源服務(wù)
通過建立綜合的語言信息資源服務(wù)平臺,為用戶提供全面、準(zhǔn)確、專業(yè)的語言學(xué)習(xí)資料和支持。收集和整理語言學(xué)習(xí)資料,包括課程教材、語法指南、詞匯表、聽力練習(xí)等。確保這些資料具有準(zhǔn)確性、全面性,并滿足用戶的學(xué)習(xí)需求。創(chuàng)建在線學(xué)習(xí)平臺,將語言學(xué)習(xí)資料進(jìn)行整合和發(fā)布,方便用戶隨時(shí)隨地訪問和學(xué)習(xí)。平臺可以提供用戶注冊、學(xué)習(xí)進(jìn)度跟蹤、學(xué)習(xí)社區(qū)互動等功能,提升用戶體驗(yàn)。提供個(gè)性化學(xué)習(xí)建議,根據(jù)用戶的語言學(xué)習(xí)需求和水平,通過用戶自測評估、學(xué)習(xí)目標(biāo)設(shè)定和學(xué)習(xí)計(jì)劃制定來實(shí)現(xiàn),幫助用戶制定有效的學(xué)習(xí)策略。開發(fā)語言學(xué)習(xí)應(yīng)用程序,開發(fā)手機(jī)應(yīng)用程序,包括單詞記憶游戲、語音練習(xí)、語法測試等功能,幫助用戶通過手機(jī)隨時(shí)進(jìn)行語言學(xué)習(xí)互動體驗(yàn)。創(chuàng)建在線語言社區(qū)和論壇,供用戶之間交流、分享學(xué)習(xí)經(jīng)驗(yàn)和解答疑問,促進(jìn)用戶之間的互動,提供學(xué)習(xí)資源推薦和學(xué)習(xí)支持。提供在線語言咨詢服務(wù),為用戶提供關(guān)于語言學(xué)習(xí)和應(yīng)用的咨詢服務(wù),包括回答學(xué)習(xí)問題、提供學(xué)習(xí)建議等。不斷更新和改進(jìn),通過用戶調(diào)查、數(shù)據(jù)分析和市場研究等方法來了解用戶需求和優(yōu)化服務(wù)。
(二)語言內(nèi)容資源服務(wù)
語言內(nèi)容開發(fā)與管理是語言內(nèi)容資源服務(wù)的重點(diǎn)之一,通過了解用戶的多語言翻譯、本地化、內(nèi)容創(chuàng)作等方面的需求,組建一支具有專業(yè)翻譯技能和領(lǐng)域知識的團(tuán)隊(duì)。這些翻譯人員應(yīng)具備熟練掌握目標(biāo)語言和源語言的能力,同時(shí)要了解目標(biāo)領(lǐng)域的專業(yè)術(shù)語和文化背景。建立質(zhì)量控制機(jī)制,確保所提供的翻譯、本地化和內(nèi)容創(chuàng)作服務(wù)的準(zhǔn)確性和專業(yè)性。這可以包括對翻譯稿件進(jìn)行審校和編輯、采用術(shù)語管理系統(tǒng)和翻譯記憶庫等方法。制定項(xiàng)目管理流程,確保項(xiàng)目能夠按時(shí)交付,并與客戶保持良好的溝通和協(xié)作。這可以包括項(xiàng)目分派、進(jìn)度跟蹤、反饋收集和客戶滿意度調(diào)查等環(huán)節(jié)。應(yīng)用現(xiàn)代技術(shù)工具和平臺,包括機(jī)器翻譯系統(tǒng)、術(shù)語管理工具、內(nèi)容管理系統(tǒng)等,提供自動化和標(biāo)準(zhǔn)化的服務(wù)流程。確??蛻粜畔⒑椭R產(chǎn)權(quán)的保密和安全。建立嚴(yán)格的數(shù)據(jù)保護(hù)措施和合同條款,確保客戶的信息和知識產(chǎn)權(quán)不被泄露或?yàn)E用。持續(xù)關(guān)注行業(yè)動態(tài)和技術(shù)發(fā)展,通過參加培訓(xùn)、學(xué)習(xí)新技術(shù)和分享經(jīng)驗(yàn)等方式,提升團(tuán)隊(duì)的專業(yè)水平。
(三)語言數(shù)據(jù)資源服務(wù)
提供語言數(shù)據(jù)資源服務(wù),包括數(shù)據(jù)收集與整理,包括語料庫、翻譯記憶庫、語言模型、語音數(shù)據(jù)等。數(shù)據(jù)加工與標(biāo)注,包括對語料庫清洗和預(yù)處理,對翻譯記憶庫對齊和標(biāo)記,對語音數(shù)據(jù)分割和標(biāo)注等。數(shù)據(jù)存儲與管理,包括建立數(shù)據(jù)庫和文件管理系統(tǒng),實(shí)施合適的權(quán)限控制和備份機(jī)制,以保護(hù)和維護(hù)數(shù)據(jù)資源。提供數(shù)據(jù)查詢與訪問服務(wù),讓用戶能夠方便地搜索、查詢和下載所需的數(shù)據(jù)。數(shù)據(jù)定制與加值服務(wù),對特定領(lǐng)域或特定語言的數(shù)據(jù)定制、數(shù)據(jù)分析和挖掘、提供數(shù)據(jù)處理和轉(zhuǎn)換等附加服務(wù)。數(shù)據(jù)質(zhì)量與更新保障,通過建立數(shù)據(jù)質(zhì)量評估機(jī)制、與數(shù)據(jù)提供者合作,更新數(shù)據(jù)。與語言研究機(jī)構(gòu)、語言技術(shù)公司和學(xué)術(shù)界等建立合作與伙伴關(guān)系,共享和交換語言數(shù)據(jù)資源,擴(kuò)大數(shù)據(jù)資源的范圍和質(zhì)量。
(四)語言技術(shù)資源服務(wù)
開展語言技術(shù)研發(fā),包括機(jī)器翻譯、語音識別、語義分析等。通過投入資源和人才,不斷改進(jìn)和創(chuàng)新語言技術(shù)。對現(xiàn)有的語言技術(shù)進(jìn)行評估和選擇,通過技術(shù)評估和實(shí)驗(yàn)、與技術(shù)供應(yīng)商的合作等方式。將語言技術(shù)應(yīng)用于具體的場景和任務(wù)中,包括開發(fā)和定制特定領(lǐng)域的語言技術(shù)應(yīng)用,進(jìn)行系統(tǒng)集成和部署等。為用戶提供技術(shù)支持和培訓(xùn),包括提供在線文檔和教程、定期舉辦培訓(xùn)和研討會等方式,幫助用戶充分利用語言技術(shù)資源。建立和維護(hù)大規(guī)模的語言數(shù)據(jù)資源和語料庫,為語言技術(shù)的訓(xùn)練和應(yīng)用提供支持,包括收集、整理和標(biāo)注大量的語言數(shù)據(jù),構(gòu)建具有代表性和多樣性的語料庫。
(五)語言人力資源服務(wù)
開發(fā)語言人力資源,招聘與選拔語言人才,發(fā)布職位廣告、面試和評估候選人的語言能力和專業(yè)技能等。提供語言學(xué)習(xí)培訓(xùn)、專業(yè)知識和技能培訓(xùn)、跨文化溝通和管理培訓(xùn)等,以提升員工的綜合素質(zhì)和能力。建立有效的績效管理機(jī)制,設(shè)定明確的工作目標(biāo)和標(biāo)準(zhǔn),定期績效評估和反饋,提供獎勵(lì)和晉升機(jī)會,激勵(lì)員工的積極性和工作表現(xiàn)。建立良好的工作環(huán)境和發(fā)展空間,建立開放的溝通渠道、鼓勵(lì)團(tuán)隊(duì)合作和知識分享,提供平衡工作與生活的政策和福利等。為員工提供能力和表現(xiàn)相匹配的職業(yè)發(fā)展路徑,提升員工的職業(yè)滿意度和忠誠度。建立人才儲備和交流平臺,吸引和留住優(yōu)秀語言人才。通過了解行業(yè)動態(tài)和最佳實(shí)踐,不斷改進(jìn)和優(yōu)化人力資源管理策略和方法。
三、積極推進(jìn)中國式語言資源服務(wù)能力建設(shè)
加強(qiáng)中國式語言資源服務(wù)能力現(xiàn)代化建設(shè)十分重要:首先,它是保護(hù)語言多樣性和文化遺產(chǎn)的需要。語言是一個(gè)民族的重要文化標(biāo)志,承載著該民族的歷史、傳統(tǒng)和價(jià)值觀。加強(qiáng)語言資源服務(wù)能力建設(shè),保護(hù)和傳承語言的文化元素,維護(hù)和促進(jìn)文化多樣性。其次,它是促進(jìn)社會發(fā)展和人文交流的需要,為社會提供更好的語言服務(wù),促進(jìn)經(jīng)濟(jì)社會和文化發(fā)展,推動各國人民的交流和合作。第三,它是保障語言權(quán)利和減少語言歧視的需要。可以確保我國的通用語言文字和民族語言權(quán)利得到充分尊重和保障,避免語言歧視。第四,它是適應(yīng)全球化和數(shù)字化時(shí)代的需要。全球化和數(shù)字化的發(fā)展促使語言服務(wù)需求不斷增長,提升語言資源服務(wù)人才隊(duì)伍的專業(yè)能力和技術(shù)應(yīng)用能力,是新時(shí)代的要求。第五,它是推動可持續(xù)發(fā)展的需要。語言資源是寶貴的財(cái)富,保護(hù)和傳承語言資源可以促進(jìn)可持續(xù)發(fā)展。
(一)建成國家語言資源服務(wù)平臺
教育部積極推進(jìn)國家語言資源服務(wù)能力建設(shè),取得實(shí)質(zhì)性進(jìn)展。2023年,教育部語言文字信息管理司主導(dǎo)建設(shè)的全國性、綜合性在線開放資源服務(wù)平臺——“國家語言資源服務(wù)平臺“成功上線,面向社會提供語言文字資源服務(wù)。網(wǎng)站提供公益性學(xué)習(xí)、研究或欣賞,以及其他非商業(yè)性或非盈利性用途的語言資源服務(wù)。平臺建設(shè)以服務(wù)教育數(shù)字化戰(zhàn)略行動為目標(biāo),秉持“開放、共享、智能、服務(wù)”建設(shè)理念,深入分析教育教學(xué)、科學(xué)研究、文化傳承、社會應(yīng)用中急需的語言文字需求,努力破解語言資源版權(quán)復(fù)雜、碎片化嚴(yán)重、服務(wù)性不強(qiáng)等問題,建設(shè)滿足國家、社會和人民需要的語言資源服務(wù)。平臺匯聚近 50 家單位提供的近百項(xiàng)高質(zhì)量語言資源和優(yōu)質(zhì)語言服務(wù),同時(shí)收錄資源涵蓋語言教育、語言文化、語言翻譯、語言技術(shù)等公共語言資源,聚焦社會需要和實(shí)際應(yīng)用建設(shè)近 20 項(xiàng)語言服務(wù)。平臺數(shù)據(jù)和資料包括文字、圖片、聲音、錄像、圖表等。該國家級語言資源服務(wù)平臺的建成對積極服務(wù)數(shù)字中國建設(shè),服務(wù)教育數(shù)字化戰(zhàn)略,服務(wù)國家語言資源安全,探索語言文字事業(yè)數(shù)字化賦能,推動教育和語言文字事業(yè)高質(zhì)量發(fā)展做出重要貢獻(xiàn)。
(二)建立語言資源學(xué)二級學(xué)科
北京語言大學(xué)創(chuàng)立“語言資源學(xué)”學(xué)科,以語言資源為研究對象,系統(tǒng)研究語言資源的類型、構(gòu)成、分布、質(zhì)量特征、使用狀況及其與語言研究和社會發(fā)展之間的關(guān)系,聚焦語言資源理論與實(shí)踐、語言資源應(yīng)用技術(shù)、語言資源管理與倫理三個(gè)主要研究方向,培養(yǎng)具有開拓精神和創(chuàng)新思維能力的語言資源服務(wù)高水平人才。人工智能時(shí)代,對各種語言資源的匯集、保護(hù)、利用和開發(fā),對語言研究、國家經(jīng)濟(jì)建設(shè)、科技文化建設(shè)、國家安全與穩(wěn)定、人類命運(yùn)共同體構(gòu)建都具有重要價(jià)值和重大意義。
本文為國家語委科研重大項(xiàng)目“新時(shí)代中國特色語言管理理論建構(gòu)研究”(ZDA135-16)和北京市社會科學(xué)基金重點(diǎn)項(xiàng)目“一帶一路”語言服務(wù)便利度測量模型構(gòu)建與應(yīng)用(20YYA002)的相關(guān)成果。
(作者簡介:北京語言大學(xué)高級翻譯學(xué)院教授,國際語言服務(wù)研究院院長,國家語言服務(wù)出口基地負(fù)責(zé)人,上海財(cái)經(jīng)大學(xué)特聘教授,華北科技學(xué)院特聘兼職高層次專家)
特別說明:本文僅用于學(xué)術(shù)交流,如有侵權(quán)請后臺聯(lián)系小編刪除。
- END -
轉(zhuǎn)載來源:語言服務(wù)研究院
轉(zhuǎn)載編輯:田貝西