譯學(xué)文獻(xiàn)|這枚CAI,治愈了我的口譯學(xué)習(xí)內(nèi)耗?
IERC公眾號(hào)全新版塊——“IS下午茶”
#形式
每月一次的學(xué)術(shù)論文分享
IS, short for Interpreting Studies
#內(nèi)容
像分享下午茶小點(diǎn)般
為你送上最有意思的口譯研究文獻(xiàn)推薦
有最經(jīng)典的學(xué)術(shù)著作
有最前沿的研究工作
還有書海拾貝的論文研讀
來嘆IS下午茶
口譯研究超好玩!
歡迎大家到文末留言區(qū)討論交流~
IS下午茶 · 第19篇
○
有了CAI工具,
老師再也不用擔(dān)心我的口譯了?
Σ(っ °Д °;)っ
那么如果使用了這樣的工具,數(shù)字口譯的準(zhǔn)確率就會(huì)有明顯提升嗎?
今天就讓我們順著上次的茶香余韻,品品這杯關(guān)于自動(dòng)語(yǔ)音識(shí)別(Automatic Speech Recognition, ASR)工具輔助數(shù)字同傳(Defrancq & Fantinuoli,2021)的下午茶。
1. 從人體工學(xué)、準(zhǔn)確率和時(shí)延(latency)這三個(gè)角度來看,ASR工具能否為譯員提供可靠的ASR產(chǎn)出?2. 在同傳箱內(nèi)提供ASR工具能否提高譯員表現(xiàn)?3. 譯員在同傳箱內(nèi)的ASR使用情況和使用體驗(yàn)如何?
俗話說“工欲善其事,必先利其器”,現(xiàn)在市面上有不少ASR軟件,小到聊天app自帶的語(yǔ)音識(shí)別轉(zhuǎn)文字功能大到專門的語(yǔ)音識(shí)別app,那選文作者使用了哪款軟件?其選擇標(biāo)準(zhǔn)又是啥呢?
選文作者對(duì)計(jì)算機(jī)輔助口譯(Computer-assisted Interpreting, CAI)工具提出了三點(diǎn)要求:
1. 提供的信息要非常準(zhǔn)確;
2. 信息的視覺呈現(xiàn)應(yīng)符合人體工學(xué),便于閱讀;
3. 工具的時(shí)延應(yīng)該盡量短(這里的時(shí)延指源語(yǔ)開始說出數(shù)字到數(shù)字被ASR工具轉(zhuǎn)寫完畢的耗時(shí),應(yīng)在1.5秒到2秒之間)。
選文所用軟件:InterpretBank
這款計(jì)算機(jī)輔助口譯工具,可以進(jìn)行術(shù)語(yǔ)管理和術(shù)語(yǔ)翻譯,支持自動(dòng)語(yǔ)音識(shí)別,實(shí)時(shí)轉(zhuǎn)寫發(fā)言人講話。選文僅使用了該工具的ASR功能。
ps: 選文的第二作者Fantinuoli就是這款軟件的創(chuàng)始人,軟件官網(wǎng)可以下載14天的免費(fèi)試用版哦!
InterpretBank的ASR功能提供三種輸入數(shù)據(jù)分析和可視化的模式,選文選用了模式一(呈現(xiàn)整個(gè)轉(zhuǎn)寫文稿,可以將數(shù)字等特定文本字體放大并標(biāo)紅,如圖1,但轉(zhuǎn)寫稿填滿轉(zhuǎn)寫區(qū)后需手動(dòng)翻頁(yè))。
圖1. InterpretBank ASR Model 1產(chǎn)出示意圖(ibid., 7)
初步測(cè)試發(fā)現(xiàn),InterpretBank的實(shí)驗(yàn)版每隔5分半分鐘就需重新啟動(dòng)ASR功能,源語(yǔ)語(yǔ)速過快會(huì)導(dǎo)致系統(tǒng)過載,出現(xiàn)數(shù)字漏轉(zhuǎn)、正確率下降的情況。
所以實(shí)驗(yàn)需將源語(yǔ)時(shí)長(zhǎng)控制在5分鐘內(nèi),篇幅長(zhǎng)度在650詞左右,發(fā)言人語(yǔ)速需調(diào)整到每分鐘105-122詞。
研究方法:實(shí)驗(yàn)+問卷
實(shí)驗(yàn)設(shè)計(jì)※受試:6名來自同一學(xué)校會(huì)議口譯專業(yè)、母語(yǔ)為荷蘭語(yǔ)的學(xué)生譯員,受試此前都未接受過在同傳箱內(nèi)使用ASR的培訓(xùn)。
※工作語(yǔ)言和工作模式:英譯荷同傳
※實(shí)驗(yàn)材料:4份現(xiàn)場(chǎng)發(fā)言的源語(yǔ)材料。受試分為3人兩組,第一組在材料②和材料④時(shí)使用ASR,而材料①和材料③時(shí)不使用,第二組反之。
選文將材料涉及的字類型分為正整數(shù)、小數(shù)和日期,還將數(shù)字復(fù)雜程度從易到難劃分為1-4級(jí)。將數(shù)字同傳的類型分為準(zhǔn)確譯出、近似譯出、相關(guān)替代、不相關(guān)替代和漏譯。
1. 譯員使用ASR的情況;
2. 譯員認(rèn)為ASR可用性如何;
3. 譯員對(duì)ASR準(zhǔn)確率的評(píng)估;
4. ASR干擾口譯任務(wù)的程度;
5. 譯員對(duì)ASR產(chǎn)出呈現(xiàn)形式的偏好;
6. 對(duì)ASR的其他評(píng)價(jià)。
研究結(jié)果
??Q1:從人體工學(xué)、正確率和時(shí)延(latency)這三個(gè)角度來看,ASR工具能否為譯員提供可靠的ASR產(chǎn)出?人體工學(xué)InterpretBank ASR Model 1基本符合人體工學(xué)。受試對(duì)該工具的可使用性都比較滿意,不僅參考了轉(zhuǎn)寫的數(shù)字,有時(shí)還參考了一同被轉(zhuǎn)寫的文字。
受試也指出該工具還存在一些問題,比如滾動(dòng)式轉(zhuǎn)寫稿和呈現(xiàn)形式不斷變化的數(shù)字(如下圖)會(huì)讓譯員分心。
圖2. 該工具轉(zhuǎn)寫數(shù)字 “300,000”的過程(ibid., 13)
整體來看,ASR轉(zhuǎn)寫速度可以跟上發(fā)言人的語(yǔ)速。
研究中只有一小部分?jǐn)?shù)字的轉(zhuǎn)寫結(jié)束時(shí)延超過了1.5秒,選文作者認(rèn)為如果譯員的平均耳口差(EVS)都保持在2.5秒到3秒內(nèi),那么ASR就能在譯員產(chǎn)出數(shù)字前把數(shù)字完整轉(zhuǎn)寫出來。
轉(zhuǎn)寫錯(cuò)誤主要由講者自我修正、正字法轉(zhuǎn)寫(e.g. 2002轉(zhuǎn)寫成2000 and 2)和同音異義詞(e.g. 2轉(zhuǎn)寫成to)導(dǎo)致。
ASR的數(shù)字轉(zhuǎn)寫正確率高于以往實(shí)驗(yàn)或語(yǔ)料庫(kù)研究中譯員的數(shù)字口譯準(zhǔn)確率,選文作者認(rèn)為ASR可以幫助譯員提高數(shù)字同傳準(zhǔn)確率。
??Q2:在同傳箱內(nèi)提供ASR能否提高譯員表現(xiàn)?
有ASR輔助后,數(shù)字同傳準(zhǔn)確率由無ASR輔助的67.7%提高到90.2%,數(shù)字漏譯率由15.8%下降至3.5%。
卡方檢驗(yàn)也顯示,在有、無ASR輔助的情況中,數(shù)字同傳的類型存在顯著性差異(X2=54.258, p<0.001)。有ASR時(shí),數(shù)字準(zhǔn)確譯出的比重會(huì)增加,漏譯及其他類型的比重會(huì)減少。
研究者還發(fā)現(xiàn),在有ASR輔助但ASR突然失靈的情況下,數(shù)字同傳的準(zhǔn)確率比無ASR輔助的準(zhǔn)確率還要低。如果ASR轉(zhuǎn)寫出錯(cuò),一些受試也會(huì)照著ASR產(chǎn)出錯(cuò)誤的數(shù)字,說明受試可能過于依賴ASR。
在有、無ASR的情況下,小數(shù)的同傳準(zhǔn)確率存在顯著差異(p<0.001),日期的同傳準(zhǔn)確率不存在顯著差異,說明有ASR會(huì)提高小數(shù)的同傳準(zhǔn)確率。
??Q3:譯員在同傳箱內(nèi)的ASR使用情況和使用體驗(yàn)是怎樣的?
根據(jù)研究者觀察,在4名受試中,她們使用ASR的比例為55%左右。
卡方檢驗(yàn)顯示,從數(shù)字類型和數(shù)字復(fù)雜程度來看,只有遇到小數(shù)(X2=4.870, p=0.02),譯員使用ASR的頻率才會(huì)顯著增多。
ASR的使用頻率并不高可以反映出譯員不熟悉箱內(nèi)ASR工具,所以有譯員在問卷中表示自己需要接受ASR使用培訓(xùn)。
研究者的發(fā)現(xiàn)和展望
1. InterpretBank的ASR功能可以幫助研究中的多數(shù)學(xué)生譯員提高數(shù)字同傳準(zhǔn)確率。
未來可以換一批受試,看看職業(yè)譯員能否同樣受益。
2. 受試使用ASR的頻率不高,也不太會(huì)根據(jù)數(shù)字的特點(diǎn)或難易程度使用ASR。
可能是因?yàn)樗齻儧]有接受過ASR使用培訓(xùn);也可能是因?yàn)槭褂肁SR會(huì)讓原本就高的認(rèn)知負(fù)荷雪上加霜,滾動(dòng)式ASR產(chǎn)出也會(huì)讓受試分心。
未來可以研究有ASR使用培訓(xùn)的效果,還可以改變ASR產(chǎn)出的視覺呈現(xiàn)形式,比如只呈現(xiàn)數(shù)字。
3. 每位受試使ASR的程度也各不相同,似乎受試的整體表現(xiàn)越好,越少用ASR。
研究者猜想可能是自身表現(xiàn)夠好的譯員意識(shí)到ASR作用有限,所以選擇不用ASR。
這對(duì)ASR在口譯中的應(yīng)用前景可能是一個(gè)問題,有可能職業(yè)譯員因?yàn)樽约旱臄?shù)字口譯準(zhǔn)確率本來就高,不愿使用ASR。
4. 不管受試有無使用ASR,僅僅是ASR的存在就提高了數(shù)字同傳準(zhǔn)確率。
選文作者猜測(cè)這可能是ASR的存在起到了心理暗示作用,減少了受試的壓力,這需要后續(xù)研究驗(yàn)證。
研究者指出的研究局限
1. 樣本量過小。
研究者想盡可能模擬真實(shí)教學(xué)環(huán)境,在口譯實(shí)驗(yàn)室作現(xiàn)場(chǎng)發(fā)言,找背景高度一致的受試,所以這也限制了能找到的樣本量。
對(duì)我們學(xué)術(shù)小白來說,這或許可以說明實(shí)證研究樣本量小也不一定就不行,但我們要說清楚樣本量小的客觀原因+有能力把有限的數(shù)據(jù)分析出花兒來。
2. 只分析了同傳中的數(shù)字,沒有分析數(shù)字單位和整體同傳表現(xiàn)。
因?yàn)榕c數(shù)字口譯相關(guān)的認(rèn)知負(fù)荷也會(huì)影響數(shù)字單位的口譯,還有可能受試在實(shí)驗(yàn)中就是更關(guān)注數(shù)字,沒有注重整體表現(xiàn),所以分析整體表現(xiàn)還是很有必要滴。
這些展望和局限都可以成為未來的選題呀,感興趣的童靴還不趕緊去多了解了解?。?!
專欄手記
本月這杯下午茶不算苦澀,帶我們看了自動(dòng)語(yǔ)音識(shí)別在數(shù)字同傳中的初步應(yīng)用情況,其中也有一些問題值得我們說道說道:
1. 該研究需要借助同傳箱內(nèi)的攝像頭查看譯員同傳時(shí)是否有看向屏幕的動(dòng)作,但匯報(bào)結(jié)果時(shí)卻說有一個(gè)箱內(nèi)攝像頭的方向不對(duì),所以這個(gè)箱內(nèi)的錄像就用不上了。導(dǎo)致選文一會(huì)兒匯報(bào)的是基于所有受試的數(shù)據(jù),一會(huì)兒匯報(bào)的又只是4名受試的數(shù)據(jù)。這也說明我們?cè)谧鰧?shí)驗(yàn)前一定要有一個(gè)SOP,保證實(shí)驗(yàn)設(shè)計(jì)盡量完備,不要做完實(shí)驗(yàn)之后才發(fā)現(xiàn)這兒有漏洞那兒有差錯(cuò)。而且僅憑錄像中譯員的動(dòng)作就判定譯員有無參考ASR轉(zhuǎn)寫的數(shù)字也不盡合理,未來或許可以將眼動(dòng)技術(shù)和ASR使用情況結(jié)合起來考察。
2. 選文作者計(jì)算了每篇源語(yǔ)中ASR數(shù)字轉(zhuǎn)寫的時(shí)延,認(rèn)為如果譯員的EVS都保持在平均2.5秒到3秒內(nèi),那么ASR就能在譯員開口前把數(shù)字完整轉(zhuǎn)寫出來。但這個(gè)EVS范圍只是前人研究的結(jié)果,選文并未匯報(bào)該實(shí)驗(yàn)中轉(zhuǎn)寫時(shí)延和EVS的時(shí)間差,會(huì)不會(huì)存在譯員已經(jīng)說到數(shù)字但ASR還未將數(shù)字轉(zhuǎn)寫完畢的情況呢?
但如今考察CAI工具對(duì)口譯質(zhì)量影響的研究仍然有限,所以選文作為一個(gè)探索性的實(shí)證研究,也有著重要的實(shí)踐和科研意義。就該工具而言,選文發(fā)現(xiàn)了一些可用性問題,如ASR功能每隔五分多鐘需要重啟、必須手動(dòng)翻頁(yè)、視覺呈現(xiàn)不夠友好等,這些問題都需要研發(fā)人員解決。改善這些問題后,這個(gè)功能或許才能真正用于口譯實(shí)踐,輔助譯員。 從科研角度看,選文對(duì)ASR似乎最能發(fā)揮其特長(zhǎng)的數(shù)字同傳做了探索性研究,那ASR對(duì)同傳的其他方面有何影響呢?ASR應(yīng)用于交傳的效果又會(huì)如何呢?選文使用的是InterpretBank ASR這款軟件,那其他ASR軟件輔助口譯的效果如何呢?使用不同軟件的結(jié)果會(huì)有很大差異嗎?有沒有一款最適合口譯員的ASR軟件呢?這些都是選文帶給我們的思考,可供我們繼續(xù)鉆研。所以,對(duì)于想要研究自動(dòng)語(yǔ)音識(shí)別輔助口譯的同學(xué)而言,選文算是一杯不容錯(cuò)過的香茶?
選文文獻(xiàn):
Defrancq, B., & Fantinuoli, C. (2021). Automatic speech recognition in the booth: Assessment of system performance, interpreters’ performances and interactions in the context of numbers. Target. International Journal of Translation Studies, 33(1), 73-102.
總審核 | 許藝
專欄作者 | 譚詩(shī)憶
排版丨侯臻柔
特別說明:本文僅用于學(xué)術(shù)交流,如有侵權(quán)請(qǐng)后臺(tái)聯(lián)系小編刪除。
- END -
轉(zhuǎn)載來源:廣外高翻 口譯教育與研究中公眾號(hào)
轉(zhuǎn)載編輯:王琳
關(guān)注VX公眾號(hào)“翻譯技術(shù)教育與研究”、“語(yǔ)言服務(wù)行業(yè)”,了解更多語(yǔ)言服務(wù)行業(yè)與翻譯技術(shù)相關(guān)的資訊和洞察~