最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊

數(shù)字人文中的語言敏感性和多樣性

2023-08-07 17:21 作者:翻譯技術(shù)點(diǎn)津  | 我要投稿

轉(zhuǎn)載請注明“刊載于《數(shù)字人文研究》2022年第3期”;參考文獻(xiàn)格式:保羅?約瑟夫?斯彭斯,雷納塔?布蘭多. 數(shù)字人文中的語言敏感性和多樣性[J]. 謝佳,譯. 數(shù)字人文研究,2022,2(3):4-20. 全文已在知網(wǎng)、萬方及編輯部網(wǎng)站(http://dhc.ruc.edu.cn)上發(fā)表,此處注釋及參考文獻(xiàn)從略。


數(shù)字人文中的語言敏感性和多樣性

Towards Language Sensitivity and Diversity in the Digital Humanities

保羅?約瑟夫?斯彭斯 雷納塔?布蘭多

謝佳/譯


摘 要

近年來,數(shù)字人文(DH)領(lǐng)域的多樣性愈發(fā)受到關(guān)注,但針對地理語言多樣性的研究卻相對較少。以往的研究通常聚焦于DH領(lǐng)域地理分布,或?qū)ⅰ罢Z言”視為有待解決的技術(shù)性或語言學(xué)問題。本文采取另外一個(gè)角度,即我們需要透過以數(shù)字為媒介的語言和文化的多重“框架”,來審視DH的多樣性。這并不只是一個(gè)關(guān)于認(rèn)知正義和群體間相互尊重的問題,DH領(lǐng)域需要更加積極地應(yīng)對數(shù)字多語主義、跨文化交流和地理多樣性的全球動(dòng)態(tài)所帶來的挑戰(zhàn)。文章以數(shù)字研究中的“語言漠視”為鏡探討了這些問題,并響應(yīng)伊莎貝爾?加里納?拉塞爾關(guān)于DH中地理語言多樣性狀況應(yīng)有更完善數(shù)據(jù)的呼吁。本文闡述了多種以戰(zhàn)略性、計(jì)劃性和研究為主導(dǎo)方式處理這種多樣性的可能框架。最后,探討了更深廣的多語言關(guān)注在艾倫?劉所說的DH“多樣性的技術(shù)”中所扮演的角色,并指出如能更充分地介入當(dāng)代與語言相關(guān)的文化挑戰(zhàn),DH領(lǐng)域?qū)⑹芤娣藴\,也將做出許多貢獻(xiàn)。


關(guān) 鍵 詞 多語言DH;語言和文化多樣性;數(shù)字現(xiàn)代語言;語言漠視;反對數(shù)字單語主義


作者簡介 保羅?約瑟夫?斯彭斯(Paul Joseph Spence),倫敦國王學(xué)院數(shù)字人文系高級(jí)講師,Email:paul.spence@kcl.ac.uk;雷納塔?布蘭多(Renata Brandao),倫敦國王學(xué)院數(shù)字人文系;謝佳(譯者),德國海德堡大學(xué)跨文化研究中心博士研究生,Email:jia.xie@stud.uni-heidelberg.de。


引 言

伊莎貝爾?加里納?拉塞爾(Isabel Galina Russel)于2014年發(fā)表了一篇具有里程碑意義的文章《數(shù)字人文中地理和語言的多樣性》(Geographical and linguistic diversity in the Digital Humanities)。她通過擴(kuò)展關(guān)于多樣性的討論(主要關(guān)注了性別、階級(jí)、民族、種族和性取向方面),來探討語言和地域是如何在數(shù)字人文(DH)領(lǐng)域里形塑爭論的。“誰是‘我們’?”,她在評(píng)價(jià)關(guān)于語言和區(qū)域性的新倡議時(shí)問道。這些倡議的目的是挑戰(zhàn)英語在DH中的主導(dǎo)地位,增強(qiáng)該領(lǐng)域內(nèi)非英語群體的自主。過去幾年里有一系列文章對DH的地理文化(geocultural)構(gòu)成提出質(zhì)疑,拉塞爾的這篇文章便是其中之一。質(zhì)疑者們通常聚焦于數(shù)字人文專業(yè)組織。這些年,至少在地理性機(jī)構(gòu)建設(shè)上已經(jīng)取得了一些顯著的進(jìn)展。比如,在她的文章發(fā)表后的六年里,數(shù)字人文組織聯(lián)盟(ADHO)新增了四個(gè)協(xié)會(huì)。


雖然這一時(shí)期人們對DH的地理分布表現(xiàn)給予很多關(guān)注,卻對地理語言多樣性(geolinguistic diversity)關(guān)心甚少。其實(shí),已有不少實(shí)踐嘗試著將DH的語言聚焦范圍擴(kuò)大,比如西語和葡語的“DH日”(Day of DH)的設(shè)立,又如《數(shù)字人文季刊》(Digital Humanities Quarterly)西語、法語和葡語特刊的發(fā)布,以及《編程歷史學(xué)家》(The Programming Historian)西語版和法語版的發(fā)行。然而,盡管這些嘗試已經(jīng)開始為非英語使用者開辟空間,但并沒有在DH研究的語言多樣性和地理文化多樣性上形成具有話語權(quán)的學(xué)術(shù)介入,也并未實(shí)質(zhì)性地參與更廣泛的以語言為重點(diǎn)的研究。


長久以來,DH與計(jì)算語言學(xué)、語文學(xué)等學(xué)科相接觸、交疊,但它其實(shí)并未能廣泛、均衡地涉及以語言為重點(diǎn)的研究領(lǐng)域。這種局面最近開始有所轉(zhuǎn)變,我們看到越來越多的人關(guān)注現(xiàn)代語言學(xué)和其他語言學(xué)科中的數(shù)字媒介。在此過程中產(chǎn)生了關(guān)于跨文化、跨語言交流的交叉議題。盡管如此,本文認(rèn)為,DH領(lǐng)域尚未同現(xiàn)代語言、翻譯研究、少數(shù)族群語言檔案或?yàn)l危語言檔案等領(lǐng)域形成雙向知識(shí)互動(dòng)?!罢Z言漠視”(language indifference)或“語言鈍感”(language insensitivity),對于DH領(lǐng)域的數(shù)字多語主義和地理語言多樣性來說是關(guān)鍵阻礙,對其進(jìn)行更實(shí)質(zhì)性、更批判性的探討將有益于DH的成長。


縱觀歷史,關(guān)于DH語言多樣性的討論和意識(shí)往往集中于學(xué)術(shù)交流政策。雖然這很重要,但為了實(shí)現(xiàn)變革,DH和以語言為重點(diǎn)的研究領(lǐng)域之間應(yīng)該建立更廣泛的互動(dòng)軸。本文將會(huì)搭建一系列認(rèn)知框架和視角來探討這個(gè)話題,進(jìn)而研究DH中語言多樣性的關(guān)鍵特征。本文首先追蹤新興的(以及交疊的)DH網(wǎng)絡(luò)和DH實(shí)踐群體,并勾勒其大致輪廓,它們可以粗略界定為“多語言DH”、“翻譯和跨文化數(shù)字學(xué)術(shù)”(translingual/transcultural digital scholarship)或是“數(shù)字現(xiàn)代語言”(digital modern languages)。之后將討論它們給DH領(lǐng)域的戰(zhàn)略方向和學(xué)術(shù)議程帶來的影響,并提出一些理論和實(shí)踐框架,以將DH中的語言多樣性模型化。在此之前,我們將簡要探討應(yīng)對此問題的兩個(gè)有用框架:一是地理語言多樣性,二是“語言鈍感”概念( 即“語言漠視”)。


框架

1.1

框架一:語言和地理文化在互聯(lián)網(wǎng)上的動(dòng)態(tài)

據(jù)瀕危語言項(xiàng)目組織估計(jì),世界上大約有7000種活語言,但其中超過40%已瀕臨滅絕。大衛(wèi)?格拉多爾(David Graddol)在2004年預(yù)測,未來多達(dá)90%的口頭語言或?qū)⒉粡?fù)存在。


有些學(xué)者從生物文化多樣性概念出發(fā),把對語言存活的關(guān)注與影響人類生存的生態(tài)威脅聯(lián)系起來。在歐洲,許多文件強(qiáng)調(diào)了保衛(wèi)作為“活遺產(chǎn)”的語言和文化的重要性,因?yàn)槠浼仁菂^(qū)域認(rèn)同的關(guān)鍵因素,也是社會(huì)和物質(zhì)財(cái)富的一大驅(qū)動(dòng)力。與此類似,近年來的一系列研究表明,從多項(xiàng)指標(biāo)上看,使用多語言對個(gè)人和社會(huì)都有益處,包括促進(jìn)個(gè)人早期認(rèn)知發(fā)展及防范后期認(rèn)知老化。雖然有些人警告稱:圍繞語言瀕危的討論是一種危險(xiǎn)的將其“本質(zhì)化的話語”(essentializing discourse),并建議關(guān)注語言認(rèn)同中的一種“多項(xiàng)式”(polynomic)模式。但毫無疑問,語言的區(qū)分在文化生產(chǎn)和相關(guān)知識(shí)實(shí)踐中發(fā)揮了重要作用。


在學(xué)術(shù)界,2001年《維也納宣言》(Vienna Manifesto)對學(xué)術(shù)機(jī)構(gòu)解決“單語主義的代價(jià)” 的一系列措施進(jìn)行強(qiáng)調(diào)之后,整體的國際政策幾乎沒有任何調(diào)整。查爾斯?福斯迪克(Charles Forsdick)在探討“科學(xué)的單語主義”(scientific monolingualism)及其潛在的認(rèn)識(shí)論威脅(或稱為“對知識(shí)體系的殺傷”)時(shí),強(qiáng)調(diào)了多語言知識(shí)流動(dòng)的重要性、翻譯的價(jià)值以及擁有強(qiáng)語言意識(shí)的多文化研究團(tuán)隊(duì)所帶來的更廣闊的研究空間。2018年的OPERAS《多語主義白皮書》指出,“對語言系統(tǒng)的選擇往往意味著對參考框架、方法論和學(xué)派的選擇”。2016年,馬特?皮克爾斯(Matt Pickles)在BBC網(wǎng)站上發(fā)表了一篇探究是否“英語的主導(dǎo)地位(或?qū)ⅲ?huì)傷害全球?qū)W術(shù)”的文章。該文章引用了其他學(xué)者的觀點(diǎn),列舉了各式各樣的挑戰(zhàn),包括不同的修辭文化,忽視其他語言的工作所造成的研究范圍和研究質(zhì)量的限制,只使用單一語言導(dǎo)致的認(rèn)識(shí)論偏見,以及阻礙知識(shí)流動(dòng)的事實(shí)上的區(qū)域“閉鎖”效應(yīng)。這在DH領(lǐng)域絕非新鮮話題,過去已有關(guān)于“DH與知識(shí)的地緣政治”的討論。例如,多米尼克?菲奧蒙特(Domenico Fiormonte)提出,在英語區(qū)國家DH領(lǐng)域流行的一些標(biāo)準(zhǔn)和技術(shù)文化規(guī)范對生物文化多樣性(biocultural diversity )構(gòu)成了威脅。然而,在更廣、更細(xì)地探查多樣性的基本動(dòng)態(tài)方面,尤其是與語言文化因素相關(guān)的方面,DH領(lǐng)域內(nèi)幾乎沒有過步調(diào)一致的努力,因此伊莎貝爾?加里納?拉塞爾說道,“這方面的已有信息微乎其微”。


1.2

框架二:語言鈍感和語言漠視

查爾斯?福斯迪克等人批評(píng)了存在于眾多學(xué)科和非學(xué)術(shù)部門的不易被人察覺的單語預(yù)設(shè),認(rèn)為對語言不敏感是整個(gè)學(xué)術(shù)界需要改變的現(xiàn)象。無獨(dú)有偶,2018年的一份《現(xiàn)代語言的跨國化》(Transnationalizing Modern Languages)項(xiàng)目報(bào)告認(rèn)為,我們需要反對語言漠視,突出語言和翻譯工作;我們需要強(qiáng)調(diào),語言不是中立的存在,而是與社會(huì)生活的文化、政治和經(jīng)濟(jì)層面有著深刻聯(lián)系。報(bào)告還認(rèn)為我們應(yīng)該在教育系統(tǒng)和日常實(shí)踐中關(guān)注語言。那么,從DH的角度來看,這里所說的語言敏感度,遠(yuǎn)不止是簡單地在多語言選項(xiàng)前打個(gè)勾;它要求我們首先要弄清楚,(多)語言是如何與文化以及群體的概念聯(lián)系在一起,塑造我們在DH工作中對位置和視角的感受。


DH和其他大多數(shù)領(lǐng)域一樣受到“單語預(yù)設(shè)”的影響,雖然已有一些舉措,如“DH全球展望”(Global Outlook DH)翻譯工具包。這一工具包為多語言會(huì)議禮儀提供建議,代表了與單語主義模式相反的全球包容性學(xué)術(shù)交流的語言敏感模式。然而DH的內(nèi)部實(shí)踐還有很多地方亟待改進(jìn)。誠然,這些重要成果十分關(guān)鍵,有助于引起關(guān)于DH政策基礎(chǔ)和學(xué)術(shù)交流的更廣泛討論。但本文認(rèn)為,政策方面的回應(yīng)只是其一;對于語言敏感性和語言多樣性,我們不僅要視之為DH交流實(shí)踐中的一個(gè)關(guān)鍵因素,還應(yīng)該把它視作DH研究議程的一大基本特征。換句話說,我們并不是僅僅把語言漠視作為DH學(xué)術(shù)交流中的設(shè)計(jì)缺陷,而是要將克服語言漠視當(dāng)作極為重要的研究和教學(xué)挑戰(zhàn)。


洛雷娜?波萊齊(Loredana Polezzi)在呼吁開展反對語言冷漠的運(yùn)動(dòng)時(shí)認(rèn)為,正是語言的“無處不在”使其經(jīng)常被忽視,但語言也“總是多樣的,總是不同的”。在這種背景下,我們認(rèn)為對數(shù)字研究至關(guān)重要的是要擺脫兩種觀點(diǎn):一是狹隘地以語言學(xué)角度看待“語言”,而割裂其文化背景;二是僅將其視為純粹的“技術(shù)”問題,認(rèn)為只靠數(shù)字工具就能解決.


DH中探討“語言”的六個(gè)視角

要想解決數(shù)字研究中的語言敏感性和多樣性的問題,首先得意識(shí)到我們面臨的挑戰(zhàn)有多大,這是本文的核心主張,而挑戰(zhàn)的大小則取決于異語言群體及其語言和文化的可見性。解決數(shù)字語言多樣性問題的核心障礙是,它所依靠的理論和實(shí)踐間存在高度割裂。本節(jié)主要通過六個(gè)視角來探討數(shù)字語言多樣性怎樣以及在哪些方面成為DH的焦點(diǎn):(1)“全球DH”的爭論和提議;(2)DH中的地理語言團(tuán)體;(3)語言技術(shù)及相關(guān)實(shí)踐和研究;(4)現(xiàn)代語言領(lǐng)域;(5)關(guān)于互聯(lián)網(wǎng)多語言的社會(huì)語言學(xué)研究;(6)多語言DH的基礎(chǔ)設(shè)施。(1)嵌入了對全球分歧的更廣泛分析,(2)是由地理文化及語言所處的地位所決定,(3)(4)(5)分別以語言、文化和多語主義為研究對象,(6)的關(guān)注重點(diǎn)則是努力在數(shù)字生態(tài)系統(tǒng)中促進(jìn)地理語言和文化的多樣性。本文在此提出的一系列不同尋常的視角,使得此話題在討論范圍和術(shù)語使用上都極具挑戰(zhàn)性。但我們堅(jiān)信,要分析語言多樣性的未來意義,就必須全面考慮這六個(gè)角度。


2.1

視角一:全球DH

正如我們所見,DH領(lǐng)域?qū)Φ乩碚Z言多樣性的關(guān)注較少,且主要集中在內(nèi)部的學(xué)術(shù)交流上。國際數(shù)字人文機(jī)構(gòu)也沒有相關(guān)措施來促進(jìn)和提升這種多樣性。到目前為止,數(shù)字人文組織聯(lián)盟(ADHO)的多語言和多元文化委員會(huì)所舉辦的活動(dòng),僅限于用多語種翻譯其數(shù)字人文年會(huì)的論文征集令。倒是GODH組織帶來了語言意義上的轉(zhuǎn)變,除了上文提及的翻譯工具包之外,他們還推進(jìn)了“DH耳語者”(DH Whisperers)倡議,以鼓勵(lì)DH活動(dòng)中的非正式翻譯。其他地方也有類似的項(xiàng)目,如數(shù)字人文翻譯網(wǎng)絡(luò)“RedHD in Translation”,旨在提供西班牙語DH學(xué)術(shù)的快速翻譯。


這些活動(dòng)使得全球多語言數(shù)字學(xué)術(shù)近來得到了更多形式的體現(xiàn),如Force 11旗下的“開放、多語言和全球?qū)W術(shù)交流”工作組(Open, Multilingual and Global Scholarly Communication)。該工作組對全球?qū)W術(shù)交流界發(fā)起挑戰(zhàn),試圖更開放更公平地建立、發(fā)展跨越文化、語言、宗教、地域、邊界、學(xué)科和世界觀的跨文化翻譯關(guān)系;同時(shí)開發(fā)了“Open Methods”平臺(tái),采用以語言為重點(diǎn)的方式來選擇、維護(hù)DH研究方法和工具,從而支持DH中的多語言和多文化身份。這些新的舉措催生了相應(yīng)的工具包,這些工具包需要在追求普適性和側(cè)重區(qū)域性之間進(jìn)行取舍,這取決于其產(chǎn)生背景。


2.2

視角二:地理語言團(tuán)體

區(qū)域性的DH專業(yè)協(xié)會(huì)與語言身份認(rèn)同有著千絲萬縷的聯(lián)系,但目前這種聯(lián)系總體來說是內(nèi)隱而非公開的,至少在涉及ADHO的正式成員組織時(shí)是如此。在ADHO網(wǎng)站目前列出的十個(gè)成員組織中,只有加拿大數(shù)字人文協(xié)會(huì)(CSDH/SCHN)、歐洲數(shù)字人文協(xié)會(huì)(EADH)、法語區(qū)數(shù)字人文協(xié)會(huì)(Humanistica)和日本數(shù)字人文學(xué)會(huì)(JADH)在其網(wǎng)站的“關(guān)于”頁面中明確提到了語言多樣性,其他組織僅僅提及了當(dāng)?shù)鼗颉氨就痢敝R(shí)。并且只有成立于2014年的法語區(qū)數(shù)字人文協(xié)會(huì)將語言作為重點(diǎn)。該專業(yè)學(xué)會(huì)通過創(chuàng)辦法語期刊《數(shù)字人文》(Humanités numériques)等一系列活動(dòng),團(tuán)結(jié)并促進(jìn)所有法語區(qū)的DH研究,無論其所在地理位置。在歐洲這一層次,還有一個(gè)德語區(qū)組織——德語區(qū)數(shù)字人文協(xié)會(huì)(Digital Humanities im deutschsprachigen Raum)。不言而喻,這些地理語言團(tuán)體在某種程度上受到殖民主義或其他歷史潮流的影響,這種情況影響了他們對特定語言權(quán)力動(dòng)態(tài)的介入。


最近在非洲和歐洲發(fā)生了一系列事件,其中一些強(qiáng)烈關(guān)注地理語言,促使非洲數(shù)字人文網(wǎng)絡(luò)(Network for Digital Humanities in Africa)于2020年形成。在荷蘭烏得勒支舉行的2019年國際數(shù)字人文年會(huì)上,一個(gè)由多位非洲研究人員組成的小組強(qiáng)調(diào)了將非洲語言置于全球數(shù)字景觀中的挑戰(zhàn);而后在2020年國際數(shù)字人文年會(huì)上(線上舉辦),一個(gè)后續(xù)成立的論壇試圖在促進(jìn)非洲D(zhuǎn)H學(xué)術(shù)研究的更廣闊的運(yùn)動(dòng)中鞏固這一點(diǎn)——通過倚借語言團(tuán)體之力,尋求促進(jìn)機(jī)制,以在非洲更廣泛地獲取非洲的及其他語言的數(shù)據(jù)。

像這樣由地理語言團(tuán)體主導(dǎo)的新倡議(以及來自資助者和其他DH組織的必要戰(zhàn)略支持)無疑為解決DH中的語言多樣性問題提供了一種非常有效的路徑。下面我們來談?wù)勔哉Z言、文化和多語主義為研究對象的方法。


2.3

視角三:語言技術(shù)

在討論作為研究對象的數(shù)字多語言時(shí),語言技術(shù)(從學(xué)術(shù)研究和專業(yè)實(shí)踐上來看)是一個(gè)顯而易見的出發(fā)點(diǎn)。我們不希望低估其在促進(jìn)數(shù)字語言多樣性方面將發(fā)揮的重要作用。就歐洲層次而言,數(shù)字多語言的學(xué)術(shù)和商業(yè)基礎(chǔ)設(shè)施的宏偉愿景,如CLARIN的語言資源總匯和歐洲語言網(wǎng)格項(xiàng)目(European Language Grid project),可以在那些高資源語言環(huán)境中提供有效的回應(yīng)。但在往往被先進(jìn)的計(jì)算方法邊緣化的低資源語言環(huán)境中,語言技術(shù)方法需要考慮語音技術(shù)、適應(yīng)性自然語言處理(NLP)策略、圖形/多模態(tài)界面的重要性,以及在識(shí)字率低、書面數(shù)據(jù)可用性差和缺乏語言標(biāo)準(zhǔn)化或沒有文字地區(qū)的群體參與問題。


2.4

視角四:基于現(xiàn)代語言的DH

本文的一個(gè)關(guān)鍵參考點(diǎn)是針對現(xiàn)代語言/現(xiàn)代外國語言(ML/MFL)領(lǐng)域和數(shù)字文化之間互動(dòng)的新興研究,以及西婭?皮特曼(Thea Pitman)和克萊爾?泰勒(Claire Taylor)在2017年發(fā)表于《數(shù)字人文季刊》的文章中提出的“基于現(xiàn)代語言的DH”(“ML-inflected Digital Humanities”,或者“DHML”)概念。作為正在進(jìn)行的研究的一部分,我們還將在別處繼續(xù)探討DHML概念,但在我們看來,這一討論的一個(gè)基礎(chǔ)要素是“由文化、語言差異和他者所形成的肥沃的差異土壤”。艾莉森?菲普斯(Alison Phipps)和邁克?岡薩雷斯(Mike Gonzalez)認(rèn)為,現(xiàn)代語言等領(lǐng)域或許在這個(gè)關(guān)鍵之處有潛力進(jìn)行更多理論研究。當(dāng)DH和ML的合作涉及埃利卡?奧特加(élika Ortega)所說的“文化碰撞和文化混合的敘事”(narratives of cultural encounter and cultural mixing),或揭示出跨國、跨境動(dòng)態(tài)時(shí),它們是最富有成效的,這顯然對多語言(和跨語言)敏感度提出了要求。這種觀點(diǎn)在我們與數(shù)字方法和生態(tài)系統(tǒng)的接觸中,引發(fā)了更寬泛的“文化和文化表現(xiàn)”概念。廣義地說,這個(gè)話題突出的是語言教育和研究的文化面,但DH領(lǐng)域?qū)Υ说幕貞?yīng)(通常集中在狹窄的技術(shù)層面或以語言學(xué)方面為主)顯示出這一面相的缺失。這就是保羅?斯彭斯(Paul Spence)和娜奧米?韋爾斯(Naomi Wells)的“數(shù)字現(xiàn)代語言”(Digital Modern Languages)項(xiàng)目所要應(yīng)對的挑戰(zhàn)。該項(xiàng)目包括系列研討會(huì)、系列博客、一個(gè)擁有400多名成員的討論列表,以及利物浦大學(xué)的開放獲取平臺(tái)“Modern Languages Open”中的“出版區(qū)”(publication section)。


本文在此并不是說現(xiàn)代語言領(lǐng)域是有關(guān)翻譯和跨文化動(dòng)態(tài)的唯一知識(shí)庫,而只是認(rèn)為該領(lǐng)域?qū)?huì)越來越多地作用于幫助DH應(yīng)對未來的跨語言和跨文化挑戰(zhàn),并有助于應(yīng)對本文所言范圍之外的其他挑戰(zhàn),如“國際課堂”、多語言教學(xué)法等。


2.5

視角五:對互聯(lián)網(wǎng)多語言的社會(huì)語言學(xué)研究

目前對互聯(lián)網(wǎng)多語主義的研究大多是由社會(huì)語言學(xué)家進(jìn)行的,主要研究的是人們在線上和線下實(shí)踐中的語言表現(xiàn)、身份認(rèn)同和社會(huì)文化生產(chǎn)之間的關(guān)系。如果DH能與這一研究領(lǐng)域更緊密地合作,必將受益良多。該領(lǐng)域在很多方面有著重要成果,DH領(lǐng)域在闡述自己的多語言框架時(shí)可以有效加以借鑒,包括:多語言者在不同場景中的語言選擇;數(shù)字生態(tài)系統(tǒng)中的多語言負(fù)擔(dān)和障礙;在單語言主題下開展的“多語言實(shí)踐”;數(shù)字媒體公司對多語言的構(gòu)想和實(shí)施方案;以及多語言帶來的不同思想、技術(shù)和社會(huì)實(shí)踐。


2.6

視角六:多語言DH

在英語國家,盡管圍繞多語言DH的討論還主要集中在數(shù)字人文全球展望小組(Global Outlook:Digital Humanities)的活動(dòng)上,但近年來,諸如“多語言DH網(wǎng)絡(luò)”(Multilingual DH network )、“從右至左書寫的語言和文化研討會(huì)”(workshops for Right-to-Left languages and cultures)和“非拉丁文字研討會(huì)”(Non-Latin Script workshops)等嘗試已經(jīng)開始探索數(shù)字研究中的地理語言多樣性問題,以應(yīng)對具有主題性及實(shí)際性的挑戰(zhàn),尤其是在數(shù)字文化水平、腳本/文本表示、光學(xué)字符識(shí)別(OCR)、數(shù)據(jù)整理、NLP和可視化等領(lǐng)域。雖然這些嘗試目前仍向高資源語言傾斜,但它們?yōu)橥苿?dòng)DH領(lǐng)域的跨語言研究提供了可喜的動(dòng)力。


更詳細(xì)的案例探討將在下文中呈現(xiàn)。在本節(jié)末尾,我們想強(qiáng)調(diào)一點(diǎn):討論DH的語言敏感性和多樣性不可避免地會(huì)涉及觀念、社會(huì)和技術(shù)等多重角度,這些應(yīng)該分步來解決。首先,更清晰地認(rèn)識(shí)到挑戰(zhàn)的范圍;其次,為多語言研究或是對語言敏感的研究設(shè)計(jì)新模式并加以闡述;再次,應(yīng)用對語言敏感的研究方法并啟用相關(guān)基礎(chǔ)設(shè)施;接下來,聯(lián)合踐行地理語言多樣化的團(tuán)體;最后,闡明DH領(lǐng)域在打擊數(shù)字研究里的“語言漠視”方面起到的具體作用。


走向以語言為中心的DH議程

3.1

提升對數(shù)字研究中語言多樣性動(dòng)態(tài)的理解

與許多來自英語世界的人所預(yù)設(shè)的相反,單語制才是世界上的例外,而且可能會(huì)在某一天被視為歷史上的“怪事”。人類沖突、經(jīng)濟(jì)移民、流散群體及信息和通信實(shí)踐當(dāng)中的新發(fā)展都印證了這一觀點(diǎn),這些變化促進(jìn)了跨國和跨語言的人類關(guān)系日益加深。然而,當(dāng)語言實(shí)踐越來越受到“超多樣性”(superdiversity)的影響時(shí),全球語言多樣性遭受到?jīng)_擊,低資源語言正處于瀕臨滅絕的險(xiǎn)境。這里需要注意的是,雖然英語的主導(dǎo)地位無疑是最主要的威脅,但它也是更廣泛的語言多樣性動(dòng)態(tài)中的一部分。我們不應(yīng)該以國家為界限去預(yù)設(shè)一種規(guī)范性的單一語言,但并非只是英語世界在煽動(dòng)這種錯(cuò)誤預(yù)設(shè),我們也可以觀察到阿布拉姆?德?斯瓦恩所說的“超級(jí)中心”(supercentral)語言(如西班牙語、法語、阿拉伯語和漢語普通話)的地位在全球范圍內(nèi)日益鞏固,而英語則是“超中心”(hypercentral)語言,這種現(xiàn)象將日益成為DH領(lǐng)域和整個(gè)學(xué)術(shù)交流的一個(gè)主要挑戰(zhàn)。所有這些都對DH如何處理語言多樣性和如何理解未來的知識(shí)流動(dòng)有重大影響,目前這些影響在DH以及廣義的數(shù)字領(lǐng)域中還未得到充分研究。


盡管數(shù)字平臺(tái)對這一問題越來越敏感,但總體而言,語言多樣性在數(shù)字環(huán)境中沒有得到很好的體現(xiàn)。可能只有幾百種語言被積極且大規(guī)模地用于網(wǎng)頁。有證據(jù)表明,在一些大眾/數(shù)字“媒體景觀”中,語言多樣性的地位更高,具體因不同的數(shù)字工具和媒體而異。就像丹尼爾?普拉多(Daniel Prado )指出的,非正式的媒體,如博客或聊天工具,比正式的數(shù)字媒體呈現(xiàn)出更高的語言多樣性。同樣,丹尼爾?坎利夫(Daniel Cunliffe)指出,社交媒體更貼近日常生活,這一性質(zhì)有利于低資源語言的使用。雖然這方面已經(jīng)有了一些做得很好的民族志定性工作,但相關(guān)研究和工具的缺乏,使我們難以了解數(shù)字媒體中語言多樣性的規(guī)模,有志于該研究的項(xiàng)目或行動(dòng)又總是難以獲得應(yīng)有的穩(wěn)定環(huán)境。這使得我們很難對數(shù)字通信中語言多樣性的總體程度得出實(shí)質(zhì)性結(jié)論。因此,至少現(xiàn)在來說,我們?nèi)匀狈﹃P(guān)于數(shù)字媒介知識(shí)生產(chǎn)中語言流動(dòng)的關(guān)鍵細(xì)節(jié)。但毫無疑問的是,大多數(shù)全球知識(shí)生產(chǎn)工具強(qiáng)烈偏愛英語,然后是少數(shù)高資源語言。鑒于這種情況,DH領(lǐng)域在未來幾年的一個(gè)關(guān)鍵挑戰(zhàn)是更好地理解和分析這些動(dòng)態(tài),然后設(shè)計(jì)相應(yīng)的策略來打破數(shù)字單語主義。


在藝術(shù)與人文研究委員會(huì)(AHRC)資助的項(xiàng)目“語言行為與世界建構(gòu)”(Language Acts & Worldmaking,2020年)中,我們對DH基礎(chǔ)設(shè)施中的語言覆蓋情況進(jìn)行了研究。作為該研究的一部分,我們調(diào)查了一系列DH項(xiàng)目和資源庫,研究了它們體現(xiàn)了語言的哪些特征以及如何體現(xiàn)關(guān)于語言的信息。自DH誕生以來,基于語言的研究一直是其核心的一部分。但盡管以語言為重點(diǎn)的項(xiàng)目占了顯著比例(據(jù)我們調(diào)查,在目前已停用的DH Commons門戶網(wǎng)站上列出的794個(gè)項(xiàng)目中有84個(gè)以語言為重點(diǎn)),我們發(fā)現(xiàn),與其他同源學(xué)科(如英語或歷史)相比,它們之間的關(guān)系略顯模糊,沒有得到充分闡釋。目前,雖然基于語料庫的研究基礎(chǔ)設(shè)施(如CLARIN)開展了有價(jià)值的工作,但總體而言,在網(wǎng)上想從DH研究的語言焦點(diǎn)里窺探其性質(zhì)和程度并非易事,即便是其他優(yōu)秀的、看似語言豐富的資源也是如此,比如EADH (The European Association for Digital Humanities 2019)項(xiàng)目列表——我們研究發(fā)現(xiàn),雖然列表上的項(xiàng)目通常都有不錯(cuò)的多語言覆蓋率(尤其是語言導(dǎo)向的研究),但整體的實(shí)際語言覆蓋似乎只偏向于極少數(shù)語言。列表里共有197個(gè)可訪問項(xiàng)目,其中72%使用英語,19.8%為德語,此外只有三種其他語言覆蓋率達(dá)到5%以上。因此,首先要做的就是在整個(gè)DH領(lǐng)域中落實(shí)對多語言資源和方法的更大認(rèn)可,并進(jìn)行更好地組織,DH研究的資助者、學(xué)術(shù)機(jī)構(gòu)和專業(yè)協(xié)會(huì)都可以為此做出貢獻(xiàn)。


雖然在領(lǐng)域內(nèi)的學(xué)術(shù)交流實(shí)踐中關(guān)注語言多樣性很重要,但同樣重要的是,DH應(yīng)將語言多樣性作為一個(gè)研究課題,以為之做出更大貢獻(xiàn)。DH可以在許多地方發(fā)揮更大的作用,其中之一就是為低資源語言分析并設(shè)計(jì)重要的基礎(chǔ)設(shè)施。事實(shí)上,尼克?蒂博格(Nick Thieberger)于2017年在《數(shù)字人文學(xué)刊》(Digital Scholarship in the Humanities)上發(fā)表的一篇文章認(rèn)為,讓世界上的小語種信息更容易被免費(fèi)獲取,這應(yīng)該成為一個(gè)DH項(xiàng)目——我們可以增強(qiáng)語言庫的可見度,開展措施融合瀕危語言資源,提高口述材料的價(jià)值等。


DH學(xué)者已經(jīng)在一些保護(hù)瀕危、低資源或遺產(chǎn)性語言的重大項(xiàng)目中表現(xiàn)活躍。墨西哥的許多項(xiàng)目試圖維護(hù)前西班牙時(shí)期語系的豐富性,如納瓦特爾語、薩波特克語和瑪雅語。像CLARIN的“語言多樣性和語言文獻(xiàn)知識(shí)中心”(CLARIN Knowledge-Centre for linguistic diversity and language documentation)這樣的設(shè)施則提供了關(guān)于數(shù)據(jù)、方法和工具的專業(yè)知識(shí),帶來大量的數(shù)字研究機(jī)會(huì)。然而,世界上許多最瀕危的語言是口頭傳統(tǒng)的,或者缺乏有意義的書面記錄,這種情況對以文本為基礎(chǔ)的DH工具集構(gòu)成了特別的挑戰(zhàn)。即使是那些具有強(qiáng)大文字傳統(tǒng)的大型語言,現(xiàn)有的工具也往往只能提供有限的語言支持,而且基本上都是基于歐洲語言的范式。


此外,那些帶有“語言”維度的措施,主要集中在“數(shù)字”如何改變“語言”,暗示了語言是在不可避免地、單向地被“數(shù)字破壞”。我們認(rèn)為,現(xiàn)在迫切需要從相反的角度探討“數(shù)字”和“語言”之間的關(guān)系,即更好地了解數(shù)字研究項(xiàng)目是如何被特定的語言文化背景所塑造(和破壞)的。因此,舉例來說,要對語言在DH中的作用有一個(gè)更全面的認(rèn)識(shí),就必須對語言/文化多樣性如何挑戰(zhàn)數(shù)字研究生態(tài)系統(tǒng)有更深入和更細(xì)致的了解。


我們對數(shù)字研究環(huán)境中語言差異的理解還遠(yuǎn)未成熟,但簡單的調(diào)查就足以證明影響這種差異的一系列要素,其中包括語言、文化、技術(shù)和學(xué)術(shù)等方面。例如,我們從實(shí)踐的角度來看看托馬斯?穆蘭尼(Thomas Mullaney)進(jìn)行的一項(xiàng)對比:西歐和美國的數(shù)字媒介環(huán)境充滿活力,即便非專業(yè)用戶也能下載現(xiàn)成的分析平臺(tái)和數(shù)據(jù)語料庫,進(jìn)入新的、前沿的研究領(lǐng)域進(jìn)行探險(xiǎn);而在亞洲,DH研究的許多最基本要素仍然不發(fā)達(dá),甚至不存在。


如前文所述,在應(yīng)用語言學(xué)和社會(huì)語言學(xué)領(lǐng)域里有著廣泛的互聯(lián)網(wǎng)多語言研究,這為數(shù)字多語言的討論提供了有用的社會(huì)學(xué)和語言學(xué)背景。盡管如此,這些研究并不涉及支撐DH研究的各種方法、重要基礎(chǔ)設(shè)施和內(nèi)容。能使DH領(lǐng)域受益的,比如說,是探討以下問題的研究:是什么影響了DH研究對特定工具和生態(tài)系統(tǒng)的文化偏好?或者,不同地區(qū)的官方和非官方媒體渠道的使用差異如何影響DH研究人員在特定情況下對語言的選用?


我們把目光轉(zhuǎn)向以語言為重點(diǎn)的學(xué)術(shù)領(lǐng)域與DH的互動(dòng)方式。特定領(lǐng)域的數(shù)字學(xué)術(shù)形式被其自身的歷史、文化和認(rèn)識(shí)論及其主要的研究對象牢牢塑造。舉幾個(gè)例子(在英語背景下),我們看到:在以數(shù)字為媒介的拉丁美洲研究中對視覺藝術(shù)和社會(huì)爭論的某種強(qiáng)調(diào);中國研究中的DH強(qiáng)調(diào)文化遺產(chǎn)和建設(shè)歷史數(shù)據(jù)庫的傳統(tǒng);意大利研究中的DH則關(guān)注跨藝術(shù)和跨領(lǐng)域研究;而亞洲研究中,DH聚焦數(shù)字媒介的政治、社會(huì)和文化面向。這并不是說以上所舉是“數(shù)字”與語言、文化在各領(lǐng)域進(jìn)行配對的唯一表現(xiàn)形式,但領(lǐng)域之間的確存在差異,而且在某種程度上,一個(gè)特定領(lǐng)域歷史和當(dāng)下的定位、歸屬(例如是屬于“現(xiàn)代語言研究”還是“區(qū)域研究”,是屬于人文科學(xué)還是社會(huì)科學(xué))對其身份和構(gòu)成有明顯的影響。


全面客觀地闡明所面臨的挑戰(zhàn)遠(yuǎn)遠(yuǎn)超出了本文的范圍,哪怕只是關(guān)于那些世界上最廣泛使用的語言。但我們需要具備一定規(guī)模和深度的研究,比如,2007年布倫達(dá)?達(dá)內(nèi)(Brenda Danet)和蘇珊?赫林(Susan C. Herring)編輯的《多語言互聯(lián)網(wǎng)》(The Multilingual Internet)一刊致力于描述語言、文化和網(wǎng)絡(luò)交流的狀況;NetLang的出版物《走向多語言賽博空間》(Towards the Multilingual Cyberspace)所載研究在2012年調(diào)查了多語言技術(shù)、數(shù)字空間、包容性和互聯(lián)網(wǎng)治理。對“多語言DH”現(xiàn)狀進(jìn)行深入檢視將大大有助于推動(dòng)DH中的語言敏感性和多樣性議題,這樣的工作可能包括按語言或語系進(jìn)行的案例研究、對塑造我們交流實(shí)踐的基本數(shù)字基礎(chǔ)設(shè)施的景觀研究、對DH工具的“多語言準(zhǔn)備度”的評(píng)估、多語言DH平臺(tái)設(shè)計(jì)的實(shí)踐、多語言數(shù)據(jù)動(dòng)態(tài)的分析,及設(shè)計(jì)語言兼容性方案競賽。


在考慮了數(shù)字生態(tài)系統(tǒng)中語言本身和語言學(xué)科的一些基本動(dòng)態(tài)之后,本文將提出一些實(shí)際的方法,以在DH的研究議程中推進(jìn)語言多樣性,并思考這些方法可以如何重塑DH的研究實(shí)踐。


3.2

闡明“對語言敏感”的DH研究框架

我們?nèi)绾侮U明一個(gè)廣義的概念框架來有效處理DH中的語言敏感性和多樣性問題?這個(gè)領(lǐng)域的正式理論和實(shí)踐工作都相對較少,但語言文獻(xiàn)和少數(shù)族群語言研究領(lǐng)域提供了寬泛的框架,可以作為有用的出發(fā)點(diǎn)?!皻W洲多語言技術(shù)聯(lián)盟卓越網(wǎng)絡(luò)”(Multilingual Europe Technology Alliance,META-NET)在歐洲范圍內(nèi)對語言技術(shù)進(jìn)行了廣泛的調(diào)查,以促進(jìn)歐洲多語言信息社會(huì)的技術(shù)基礎(chǔ)。其32卷《語言白皮書》系列研究了歐洲語言的數(shù)字準(zhǔn)備情況,包括小眾語言;并就機(jī)器翻譯、語音處理、文本分析和語音及文本資源對不同歐洲語言的支持程度進(jìn)行了跨語言比較。雖然自2012年白皮書發(fā)布至今,狀況難免發(fā)生了一定程度的改變,但有些事情依然如故,比如該系列概要所證實(shí)的——以英語為代表的一些語言,享有高度的、整體性的數(shù)字支持,而其他大多數(shù)語言獲得的支持則弱得多。


在數(shù)字環(huán)境中獲取語言使用的指示性數(shù)據(jù),也是一個(gè)眾所周知的挑戰(zhàn)。但更好地理解各類動(dòng)態(tài)如何影響語言使用,顯然有益于在數(shù)字研究中開展具有語言意識(shí)的研究方法,而理想狀態(tài)下,這需要一套通用標(biāo)準(zhǔn)。丹尼爾?皮米恩塔(Daniel Pimienta)在丹尼爾?普拉多等人早期工作的基礎(chǔ)上,對互聯(lián)網(wǎng)上的語言和文化進(jìn)行了分析,考慮六個(gè)關(guān)鍵指標(biāo)(互聯(lián)網(wǎng)用戶、內(nèi)容、互聯(lián)網(wǎng)使用、流量、界面/翻譯的可得和信息社會(huì)指數(shù)),以指導(dǎo)四項(xiàng)總體的宏觀指標(biāo),從而掌握互聯(lián)網(wǎng)語言的現(xiàn)狀。另外,還有一個(gè)“數(shù)字語言多樣性項(xiàng)目”(Digital Language Diversity Project),旨在推動(dòng)歐洲的地方語言和少數(shù)族群語言在數(shù)字世界中的可持續(xù)性。該項(xiàng)目提供了一套分析和培訓(xùn)工具,并輔以項(xiàng)目建議書、“數(shù)字語言生存工具包”(Digital Language Survival Kit)和“數(shù)字語言多樣性路線圖”(roadmap to digital language diversity),目標(biāo)人群為政策制定者和其他利益相關(guān)者。項(xiàng)目提議分為三個(gè)方面:“數(shù)字能力”(數(shù)字素養(yǎng)、字符編碼及輸入輸出方法、語言資源的可得),“數(shù)字存在與使用”(電子通信的使用、社交媒體的使用、互聯(lián)網(wǎng)媒體的可得、維基百科等),“數(shù)字性能”(互聯(lián)網(wǎng)服務(wù)的可得,社會(huì)網(wǎng)絡(luò)本地化,軟件本地化:包括操作系統(tǒng)和基本軟件、機(jī)器翻譯服務(wù)、專用的互聯(lián)網(wǎng)頂級(jí)域名等)。還有一個(gè)有趣的案例研究是關(guān)于巴斯克語的數(shù)字健康報(bào)告(考慮到在歐洲范圍內(nèi)使用該語言的人相對較少,其健康狀況一般來說是非常樂觀的),該報(bào)告提出了12條建議,包括對其內(nèi)容的關(guān)注、技術(shù)發(fā)展的規(guī)劃、數(shù)字媒體的本地化、對于開放知識(shí)的宣傳和政策。這些例子給我們提供了幾個(gè)指針用以思考數(shù)字語言多樣性的監(jiān)測框架,但是要更完善地針對DH領(lǐng)域,必須借鑒基于語言學(xué)/語言文獻(xiàn)資源所進(jìn)行的更多研究,比如CLARIN虛擬語言觀察站(Virtual Language Observatory)、語言數(shù)據(jù)聯(lián)盟(Linguistic Data Consortium)、歐洲語言資源協(xié)會(huì)的語言資源目錄(ELRA Catalogue of Language Resources)等。


評(píng)估DH學(xué)科的語言多樣性需要什么樣的框架?這些框架或?qū)⒊霰疚乃O(shè)想的范圍,但相關(guān)研究人員在研究低資源語言(包括庫爾德語和蘇格蘭的蓋爾語)的數(shù)字狀況時(shí),提出了一種基于“基本語言資源包”(Basic Language Resource Kit)的方法,以搭建資源較少語言和少數(shù)族群語言團(tuán)體的“DH準(zhǔn)備”。這個(gè)框架包括六個(gè)基本部分:DH研究的成熟度(在特定的目標(biāo)群體中)、DH教育的狀況、數(shù)字媒體的狀況、語言的數(shù)字可見度和可計(jì)算性、DH工具和數(shù)字化資源的存在情況。


這種方法仍然強(qiáng)調(diào)語言的“數(shù)字準(zhǔn)備度”。我們怎樣才能顛覆這種模式,去評(píng)估DH的“語言準(zhǔn)備度”?一個(gè)更廣泛的DH語言多樣性框架應(yīng)該是怎樣的,它需要涵蓋哪些領(lǐng)域?在我們看來,這樣一個(gè)框架需要自下而上的措施,吸收在地理方面、語言方面及主題方面有代表性的聲音。在這里我們初步地指出一些戰(zhàn)略性領(lǐng)域,在這些領(lǐng)域,DH團(tuán)體可以在其研究實(shí)踐中促進(jìn)語言多樣性。


● 分析和監(jiān)測DH地理語言多樣性。如前文所述,為了在任何嚴(yán)肅意圖上正確地研究全球知識(shí)流動(dòng),DH研究需要提高對這種多樣性如何在內(nèi)容、發(fā)現(xiàn)機(jī)制、工具和群體等關(guān)鍵指標(biāo)方面運(yùn)作的理解。對此,一套基準(zhǔn)化術(shù)語連同定期對研究現(xiàn)狀進(jìn)行調(diào)查會(huì)非常有用。這就需要分析對語言多樣性動(dòng)態(tài)有激勵(lì)和阻礙作用的社會(huì)因素和技術(shù)因素——數(shù)字學(xué)術(shù)在不同的地方受到不同力量的影響。深入分析在這一領(lǐng)域已經(jīng)開展的工作將有助于在研究設(shè)計(jì)中提高多語言意識(shí),并有助于DH領(lǐng)域在明確數(shù)字研究生態(tài)中反霸權(quán)模式的要求方面做出貢獻(xiàn)。


● 促進(jìn)DH研究中對語言敏感和多語言的實(shí)踐。雖然已經(jīng)有了一些有趣的多語言主義嘗試,但DH還可以做更多的工作來推進(jìn)多語言實(shí)踐,例如在其學(xué)術(shù)交流中積極推廣多語模式,或者支持多語期刊和傳播實(shí)踐。我們經(jīng)常聽到DH的研究人員提到,一些非英語母語者喜歡用英語交流以接觸更多的受眾。這固然不錯(cuò),但并不是大部分研究人員的切身經(jīng)驗(yàn),他們并不在這種預(yù)設(shè)之中,而且這也忽略了因?yàn)榫唧w平臺(tái)的不同或因社會(huì)技術(shù)的激勵(lì)/阻礙而產(chǎn)生的語言行為差異。2014年,羅斯?珀林(Ross Perlin)在一篇題為 “互聯(lián)網(wǎng)——語言葬身之地?”(The Internet, where languages go to die?)的文章中認(rèn)為,網(wǎng)絡(luò)世界里幾乎只存在單一的文化,是地球上少數(shù)主流文化相互交談的回聲室。DH如何挑戰(zhàn)這種觀點(diǎn)?更加明確且上進(jìn)地推動(dòng)“語言”議程將有助于確保DH不會(huì)成為單語主義或超中心語言霸權(quán)的附庸。


● 與以語言為重點(diǎn)的領(lǐng)域進(jìn)行雙向合作。DH為基于語言的研究設(shè)計(jì)提供了新的范式,但與現(xiàn)代(外國)語言學(xué)、社會(huì)語言學(xué)的多語言研究、翻譯研究或語言教學(xué)法等領(lǐng)域的語言研究相比,目前DH的理論化程度仍然不足。加強(qiáng)與現(xiàn)代語言和其他以語言為重點(diǎn)的研究者/實(shí)踐者的合作,將有助于糾正前文所描述的DH與以語言為基礎(chǔ)的學(xué)術(shù)議程之間的單向主導(dǎo)關(guān)系。解決這個(gè)問題的方法有很多,包括資助者的政策(增加對語言及語言多樣性的關(guān)注)、DH專業(yè)協(xié)會(huì)的戰(zhàn)略,以及研究界本身的作為(提出自下而上的措施)。


● 指導(dǎo)、案例研究和培訓(xùn)。我們認(rèn)為,可見度是DH和整個(gè)數(shù)字研究處理語言問題的關(guān)鍵挑戰(zhàn)。問題是,許多研究人員目前沒有時(shí)間和精力去做額外的努力,以實(shí)現(xiàn)更高的語言包容性。為DH研究人員提供指導(dǎo)、案例研究和(簡單為主的)培訓(xùn),將在一定程度上幫助他們跨越這個(gè)“學(xué)術(shù)文化”障礙。


3.3

作為DH研究內(nèi)容的多語言

到此為止,我們已經(jīng)考慮了一些使DH科學(xué)更加“語言敏感”和語言多樣化所需的一般條件。在最后一節(jié)中,我們將集中討論DH在研究方面的兩個(gè)傳統(tǒng)優(yōu)勢領(lǐng)域:基礎(chǔ)設(shè)施設(shè)計(jì)的重要手段和數(shù)字方法。


目前,我們已經(jīng)提出DH面對的關(guān)鍵挑戰(zhàn)是:(1)對其自身的多語言實(shí)踐發(fā)展出更強(qiáng)的批判敏感性;(2)設(shè)計(jì)框架以促進(jìn)其學(xué)術(shù)交流和研究中的地理語言多樣性。在此,我們將重點(diǎn)討論針對多語言DH而提出的措施,這些措施正在生成顛覆性的模式,以克服DH實(shí)踐中的數(shù)字單語主義。我們還將指出其對未來DH研究方向的潛在影響。


3.3.1

DH中的多語言和基礎(chǔ)設(shè)施

即使懷著最好的意愿,目前DH基礎(chǔ)設(shè)施也無疑嚴(yán)重偏向英語研究和英文內(nèi)容。鄧布羅夫斯基(Quinn Dombrowski)在即將發(fā)表的文章中認(rèn)為,英語在數(shù)字文化中的普遍性往往意味著,對于大多數(shù)在英語國家的學(xué)者來說,英語和其他語言之間的差異幾乎都被無視了。


目前,就全世界的語言而言,DH學(xué)科的研究方法和基礎(chǔ)設(shè)施給予的支持非常欠缺,對于非拉丁文常常失效。在烏特勒支舉行的2019年國際數(shù)字人文年會(huì)上,一個(gè)研討會(huì)將多語言DH實(shí)踐者聚集在一起,專注于涉及非拉丁字母(NLS)的研究。這一領(lǐng)域近年來取得了明顯的進(jìn)展,但其影響在整個(gè)英語DH界卻鮮為人知。研討會(huì)討論了眾多領(lǐng)域面對的挑戰(zhàn),包括多語言數(shù)據(jù)整理、OCR、字符/符號(hào)識(shí)別、數(shù)字研究生態(tài)系統(tǒng)設(shè)計(jì)、標(biāo)注、元數(shù)據(jù)、數(shù)據(jù)/文本挖掘、命名實(shí)體識(shí)別(NER)和機(jī)器翻譯。這可以視作DH研究人員與圖書館/文化遺產(chǎn)部門合作伙伴之間對話的一部分,目的是提高對數(shù)字學(xué)術(shù)基礎(chǔ)設(shè)施設(shè)計(jì)和維護(hù)方面的NLS挑戰(zhàn)的認(rèn)識(shí),并與聚焦“從右到左”(RTL)的語言文化的數(shù)字研究一起,代表了擴(kuò)大先進(jìn)DH研究中語言覆蓋范圍的持續(xù)嘗試。


受2019年非拉丁字母研討會(huì)的啟發(fā),最近成立的“多語言數(shù)字人文網(wǎng)絡(luò)”是一次新的嘗試,其目的是解決“缺乏穩(wěn)定的非拉丁語腳本工具”問題,消除DH基礎(chǔ)設(shè)施中對非英語語言的普遍偏見。該網(wǎng)絡(luò)展現(xiàn)出由團(tuán)體主導(dǎo)的、以匯集“處理多語言、多文字?jǐn)?shù)據(jù)的良好實(shí)踐”為目標(biāo)的努力,它提供了多語言和一些特定語言的資源、用于多語言NLP的GitHub項(xiàng)目,和即將出版的“富有生命力的”非拉丁語DH手冊。


諸如此類的項(xiàng)目,既有助于提高非英語在英語區(qū)DH中的可見度,也為未來的多語言發(fā)展提供了實(shí)用支架,但更廣義而言,它們?yōu)镈H基礎(chǔ)設(shè)施帶來了哪些指導(dǎo)呢?首先,這些項(xiàng)目向我們強(qiáng)調(diào)了,在挑戰(zhàn)單一語言預(yù)設(shè)、更深入理解其對DH方法和基建的影響方面,DH需要得到更多支持。第二,它們闡明了深化跨語言合作的潛力。即使是在歐洲層面,該領(lǐng)域有大量的政策支持,也難掩DH中語言技術(shù)的分化,這條路仍任重道遠(yuǎn)——我們需要維持不同語言的DH基礎(chǔ)設(shè)施,使現(xiàn)有的DH工具更容易適應(yīng)英語以外的語言,并且提高非英語工具在全球DH環(huán)境中的可見度。第三,這些項(xiàng)目向我們強(qiáng)調(diào)了在基礎(chǔ)設(shè)施中添加語言標(biāo)簽的必要性。“班德規(guī)則”(Bender Rule)建議那些使用英語的研究者“說明所研究的語言的名稱,即使它是英語”,發(fā)起人艾米莉?班德(Emily Bender)認(rèn)為這是擴(kuò)大語言學(xué)覆蓋面的關(guān)鍵因素(她所用的案例屬于自然語言處理領(lǐng)域)。受該規(guī)則影響,鄧布羅夫斯基表明了在DH中將語言使用加以體現(xiàn)的重要性,這對基礎(chǔ)設(shè)施尤為重要。一個(gè)特定的基礎(chǔ)設(shè)施是用什么語言運(yùn)作的?一個(gè)特定的工具能用于哪些語言?目前,這兩類信息在數(shù)字研究生態(tài)系統(tǒng)中幾乎鮮有提及,致使語言多樣性在DH研究設(shè)計(jì)中不那么容易實(shí)現(xiàn)。最后,這些項(xiàng)目也展示了可發(fā)聲的團(tuán)體能發(fā)揮不可或缺的作用。在馬丁?本雅明(Martin Benjamin)對數(shù)字語言多樣性的“價(jià)值主張”(value proposition)更廣闊的評(píng)論中,他認(rèn)為非常重要的一點(diǎn)是研究人們對多語言的態(tài)度和行為,以促進(jìn)這種多樣性,并確??砂l(fā)聲團(tuán)體中的利益相關(guān)者在語言基礎(chǔ)設(shè)施設(shè)計(jì)中發(fā)揮更大的作用。DH領(lǐng)域?qū)⑹芤嬗谔接懠?lì)和阻礙基礎(chǔ)設(shè)施多樣化的因素這類研究,因?yàn)槠鋵τ谡Z言流動(dòng)的形態(tài)有明顯影響。


3.3.2

置DH于多語言研究和討論中

所有這一切對未來的DH研究意味著什么?艾倫?劉(Alan Liu)在關(guān)注多樣性時(shí)簡析了DH所面臨的多語言挑戰(zhàn),提出“多樣性的技術(shù)”(the techne of diversity)或許是DH對文化批評(píng)的“獨(dú)特的、而非后續(xù)的”(unique, as opposed to follow-on, contribution)貢獻(xiàn)。他認(rèn)為,我們需要支持多樣性的“新范式”和“平臺(tái)”。在文章的擴(kuò)展稿中,他提議用“多樣性堆?!保╠iversity stack)來取代對DH的“大帳篷隱喻”(big tent metaphor),這是一種對多樣性的多層面處理方法,它在未削弱社會(huì)和文化維度的前提下,為DH中多語言、多媒體、基于語料庫、時(shí)間類型及與身份相關(guān)的多樣性挑戰(zhàn),提供高度技術(shù)性的方案。如果我們接受這一呼吁,建立一個(gè)新的、融合的“技術(shù)-意識(shí)形態(tài)裝置……可以用來完成迫切需要的工作”,那么在關(guān)于語言和地理文化上的缺陷與分歧的辯論中,我們?nèi)绾稳ピO(shè)想讓DH做出更實(shí)質(zhì)性的回應(yīng)?這樣的回應(yīng)有什么獨(dú)特的“數(shù)字人文式”的特點(diǎn)?


艾倫?劉對多語言DH的處理凸顯了目前有效開展跨語言研究的困難。他借鑒了以往在英語/拉丁語主題建模方面的工作,也參考了“多語言主題模型”和神經(jīng)網(wǎng)絡(luò)翻譯生成的“因特語”(一種由機(jī)器生成的新興的過渡語言形式,是一種純粹的比較主義)作為計(jì)算驅(qū)動(dòng)方法的例子。這些方法將使我們能夠有效地查詢混合語言集合,并在同時(shí)構(gòu)建能夠挖掘異同性的數(shù)學(xué)模型??缯Z言的DH研究仍然比較少見,但在以下方面有了很好的發(fā)展:文學(xué)文本的跨語言語料庫建設(shè),以“收集、處理和可視化跨語言數(shù)據(jù)的探索性模型”為基礎(chǔ)的面向譯介文化生產(chǎn)的跨語言“遠(yuǎn)讀、深讀和近讀”方法,以及通過文本和視覺證據(jù)研究重大事件的跨語言方法。


正如艾倫?劉所說,“數(shù)字人文需要解決語言問題”。我們更進(jìn)一步認(rèn)為,雖然先進(jìn)的計(jì)算模型肯定能為應(yīng)對語言挑戰(zhàn)做出重要貢獻(xiàn),但我們不應(yīng)忘記,數(shù)字人文對此的有效回應(yīng)需要包括社會(huì)、文化和技術(shù)三方動(dòng)態(tài)的結(jié)合,這應(yīng)該由語言學(xué)科和專業(yè)性的計(jì)算視角來推動(dòng)。我們尤其認(rèn)為,數(shù)字人文如果能在這個(gè)時(shí)代與語言相關(guān)的文化問題上發(fā)揮更重要的作用,它將受益匪淺。DH作為一個(gè)整體,在面對文化爭論時(shí)明顯失聲,就比如語言文化領(lǐng)域中“人工翻譯VS.機(jī)器翻譯”或者“人類語言VS.計(jì)算語言”的辯論。這些文化爭論背后都有套路化的二元對立在運(yùn)作。它們往往由一個(gè)簡單化的話語驅(qū)動(dòng)——“技術(shù)導(dǎo)致的破壞無法避免”,這一話語試圖掩蓋比如不均衡的數(shù)字語言支持、語言的口頭性、文化視角等問題的復(fù)雜性。不過,可以認(rèn)為,DH具有相當(dāng)?shù)臐摿?,為?shù)字架構(gòu)、方法和內(nèi)容提供一種替代性的、多語言主義的重新定向。


羅皮卡?里薩姆(Roopika Risam )在《其他世界,其他DH——注意DH的“口音”》(“Other worlds, other DHs: Notes towards a DH accent”)中指出,一個(gè)關(guān)鍵問題是去承認(rèn) “DH中地方特殊性和全球一致性并存”。她在《新數(shù)字世界》(New Digital Worlds)中進(jìn)一步探討了這個(gè)問題。在該書中,她用后殖民視角來審視代碼研究、界面設(shè)計(jì)和內(nèi)容管理,并呼吁我們抵制數(shù)字普遍主義的邏輯和動(dòng)力。普里尼?賽索(Priani Saisó)運(yùn)用了這一批判,來捍衛(wèi)區(qū)域認(rèn)識(shí)論(他以拉美為例)在DH實(shí)踐中的重要性。這種以群體為基礎(chǔ)的實(shí)踐,在本土化的人機(jī)交互(HCI)之中有重要表現(xiàn)。埃斯科瓦爾?瓦雷拉(Escobar Varela)認(rèn)為,我們需要采取一種“主位”(emic)方法,通過用戶界面(UI)在DH研究中構(gòu)建用戶體驗(yàn)(UX),這些用戶界面嵌入了特定文化群體的修辭、姿態(tài)和視覺慣例,特別是在文化主體缺乏代表的情況下?!拔覀兡転榭缥幕涣髟O(shè)計(jì)主位界面嗎?”——埃斯科瓦爾?瓦雷拉提出的這個(gè)問題十分引人注目。


在分析(和影響)新技術(shù)的地理語言支持能力和為多語言(和翻譯)內(nèi)容設(shè)計(jì)計(jì)算工具方面,數(shù)字人文都可以發(fā)揮重要作用。明確DH對這些問題的具體回應(yīng)是有必要的,所以我們與娜奧米?韋爾斯一起組織了“消解數(shù)字單語主義”研討會(huì)(Disrupting Digital Monolingualism,2020年6月)。關(guān)于這次活動(dòng),將單獨(dú)另作報(bào)告。我們相信數(shù)字多語言性將是DH領(lǐng)域在未來幾年的一大關(guān)鍵挑戰(zhàn)。


結(jié)論

伊莎貝爾?加里納?拉塞爾在她關(guān)于DH領(lǐng)域的地理和語言多樣性的研究中指出,關(guān)于英語國家的DH在該領(lǐng)域的學(xué)術(shù)交流中占主導(dǎo)地位的論點(diǎn),缺乏確鑿數(shù)據(jù)支持。她認(rèn)為這阻礙了有效的標(biāo)準(zhǔn)化分析的可能性,因而難以提出切實(shí)的解決方案。同時(shí),DH中的“語言和文化”(復(fù)數(shù))往往沒有得到充分的闡述,并且被不同的學(xué)科視角所割裂。


本文提出了創(chuàng)建一個(gè)廣泛的框架來研究DH中的地理語言多樣性的步驟,主張將其與圍繞“語言敏感性”的討論聯(lián)系起來——把結(jié)合以語言為重點(diǎn)的領(lǐng)域及其方法作為途徑。我們提出了幾種方式,使得DH可以參與當(dāng)代學(xué)術(shù)和公眾關(guān)于語言、文化、群體和技術(shù)之間關(guān)系的討論。這是一個(gè)很廣泛的議題,因此本文難以囊括所有角度。例如,我們并未探討DH的多語言教學(xué)、跨文化能力的作用或國際課堂。但我們提出了有戰(zhàn)略前景的案例,我們相信這將促進(jìn)DH學(xué)科中有價(jià)值、有意義的多語言互動(dòng)。


在本文中,我們將關(guān)于DH的多語言身份的討論建立在更廣泛的數(shù)字語言多樣性研究的基礎(chǔ)上。我們甄別出了能發(fā)揮作用的多個(gè)學(xué)科的角度,也提出了思考以下問題的一般框架:DH多語言政策,提升語言敏感性,將語言多樣性納入基礎(chǔ)設(shè)施建設(shè),以及參與更大范圍內(nèi)有關(guān)語言和數(shù)字文化之間關(guān)系的當(dāng)代辯論。


數(shù)字人文面臨的一個(gè)關(guān)鍵挑戰(zhàn)是,既要就其與數(shù)據(jù)、方法、工具和基礎(chǔ)設(shè)施相關(guān)的多語言實(shí)踐形成一種全面的批判意識(shí),又要打造一種相反的模式,把語言和地理文化上的位置性(Positionality)和包容性(inclusivity)具現(xiàn)化。我們需要啟用對語言敏感的新的數(shù)字學(xué)術(shù)模式——從設(shè)計(jì)伊始就使其如此,來取代單語假設(shè)及將英語作為“默認(rèn)設(shè)置”。





《數(shù)字人文研究》2022年第3期目錄及摘要


本文由數(shù)字人文研究(ID:rucdh2019)授權(quán)轉(zhuǎn)載。


轉(zhuǎn)載來源:數(shù)字人文研究

轉(zhuǎn)載編輯:楊淞幄

數(shù)字人文中的語言敏感性和多樣性的評(píng)論 (共 條)

分享到微博請遵守國家法律
贺州市| 朝阳县| 清涧县| 金门县| 谢通门县| 鄂托克旗| 肇东市| 斗六市| 吴江市| 青浦区| 宝兴县| 密云县| 沂南县| 泰安市| 惠东县| 东乌珠穆沁旗| 额尔古纳市| 云阳县| 罗山县| 汽车| 绵竹市| 荆州市| 郧西县| 河西区| 周至县| 闽侯县| 禄丰县| 永州市| 安阳市| 兰坪| 慈利县| 丘北县| 隆昌县| 荥阳市| 登封市| 长岛县| 北川| 江阴市| 河北省| 炉霍县| 金门县|