最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

技術(shù)科普 | BCC漢語(yǔ)語(yǔ)料庫(kù):多領(lǐng)域語(yǔ)料數(shù)據(jù)庫(kù)

2022-09-13 21:29 作者:翻譯技術(shù)點(diǎn)津  | 我要投稿

以下文章來(lái)自:翻譯學(xué)習(xí)共同體
聲明:轉(zhuǎn)載僅供參考,如有侵權(quán)請(qǐng)聯(lián)系刪除。


1. 工具簡(jiǎn)介
BCC漢語(yǔ)語(yǔ)料庫(kù)是由北京語(yǔ)言大學(xué)語(yǔ)言智能研究院研發(fā)的通用單語(yǔ)語(yǔ)料庫(kù)。漢語(yǔ)語(yǔ)料庫(kù)總字?jǐn)?shù)95億字,涵蓋了報(bào)刊、文學(xué)、對(duì)話、微博、科技、綜合和古漢語(yǔ)等多領(lǐng)域語(yǔ)料,是可以全面反映當(dāng)今社會(huì)語(yǔ)言生活的大規(guī)模熟語(yǔ)料庫(kù)。BCC語(yǔ)料庫(kù)包括了生語(yǔ)料、分詞語(yǔ)料、詞性標(biāo)注語(yǔ)料和句法樹(shù),已對(duì)現(xiàn)代漢語(yǔ)的語(yǔ)料進(jìn)行詞性標(biāo)注。BCC漢語(yǔ)語(yǔ)料庫(kù)頁(yè)面清晰簡(jiǎn)潔,功能豐富,檢索分為詞典與漢語(yǔ)兩個(gè)版塊,在詞典檢索版塊,呈現(xiàn)詞典釋義、搭配拓展、義項(xiàng)頻率,在漢語(yǔ)搜索版塊具有簡(jiǎn)單檢索、歷時(shí)檢索、自定義檢索、對(duì)比檢索四大功能;檢索結(jié)果呈現(xiàn)方式清晰明了,或柱狀圖、折線圖、餅狀圖,直觀反映數(shù)據(jù)結(jié)果,方便使用者的后續(xù)研究與對(duì)比。
官網(wǎng):http://bcc.blcu.edu.cn/lang/zh

2. 圖文教程
進(jìn)入BCC漢語(yǔ)語(yǔ)料庫(kù)官網(wǎng)頁(yè)面后,使用者會(huì)看到如下圖所示的的界面,該界面的上方菜單欄從左到右依次是:[詞典]檢索功能版塊、[漢語(yǔ)]檢索功能版塊、[登錄](méi)鍵、[注冊(cè)]鍵、[幫助]鍵;界面下方從左到右依次是[新聞]區(qū)、[搜索示例]區(qū)、[下載]區(qū),以便使用者更好了解BCC語(yǔ)料庫(kù),更加高效地利用檢索式搜索到所需內(nèi)容。




2.1 詞典檢索功能
戶點(diǎn)擊初始界面左上方的[詞典]鍵,就會(huì)進(jìn)入如下界面。



在該界面可以看到上方呈現(xiàn)搜索框,下方呈現(xiàn)漢語(yǔ)、拼音、筆畫、部件查詢模塊,呈現(xiàn)各部分的統(tǒng)計(jì)信息圖,如下圖所示:



在詞典查詢框旁,用戶可以選擇按字查詢或按拼音查詢。用戶選擇按字查詢后,可以根據(jù)自己的檢索需求輸入漢字,輸入后,點(diǎn)擊[檢索]鍵,頁(yè)面就會(huì)呈現(xiàn)檢索結(jié)果。需要注意的是,在使用按字檢索功能時(shí),下方的查詢模塊必須勾選漢字模塊,否則檢索結(jié)果出現(xiàn)錯(cuò)誤。比如在搜索框輸入“和”這個(gè)漢字,含有"和"的詞典條目就會(huì)顯示,如下圖所示:



點(diǎn)擊塊狀區(qū)域跳轉(zhuǎn)到具體條目,呈現(xiàn)詞語(yǔ)的詞典釋義、搭配拓展、義項(xiàng)頻率,在搭配拓展區(qū)域的左上角處,可以選擇詞語(yǔ)的左鄰詞與右鄰詞,以及具體的名詞、動(dòng)詞、形容詞,在搭配拓展區(qū)域以及義項(xiàng)頻率區(qū)域的右上角處,可以選擇切換為數(shù)據(jù)視圖、折線圖、柱狀圖,并可以進(jìn)行保存。在本次示例中,選擇“和平”這一條目,其詞典釋義、搭配拓展、義項(xiàng)頻率具體如下:



用戶選擇按拼音查詢后,可以根據(jù)自己的檢索需求輸入漢字拼音,聲調(diào)用“1-5”表示,輸入后,點(diǎn)擊[檢索]鍵,頁(yè)面就會(huì)呈現(xiàn)檢索結(jié)果。如在檢索框輸入“he2”后,含有"he2"的詞典條目就會(huì)顯示,點(diǎn)擊塊狀區(qū)域跳轉(zhuǎn)到具體條目,如圖所示:



選擇“和”這一條目,界面就會(huì)呈現(xiàn)其詞典釋義、搭配拓展、義項(xiàng)頻率,同樣在搭配拓展區(qū)域的左上角處,可以選擇詞語(yǔ)的左鄰詞與右鄰詞,以及具體的名詞、動(dòng)詞、形容詞,在搭配拓展區(qū)域以及義項(xiàng)頻率區(qū)域的右上角處,可以選擇切換為數(shù)據(jù)視圖、折線圖、柱狀圖,并可以進(jìn)行保存,具體如下:




2.2 漢語(yǔ)檢索功能
用戶點(diǎn)擊初始界面左上方的[漢語(yǔ)]鍵,就會(huì)進(jìn)入如下界面。


在漢語(yǔ)檢索版塊,語(yǔ)料來(lái)源豐富多樣,包括多領(lǐng)域、文學(xué)、報(bào)刊、古漢語(yǔ)、對(duì)話、篇章檢索等分區(qū),用戶可以根據(jù)自身檢索需求進(jìn)行分區(qū)的選擇;漢語(yǔ)檢索版塊的檢索功能包括簡(jiǎn)單檢索、歷時(shí)檢索、自定義檢索、對(duì)比檢索。1)簡(jiǎn)單檢索進(jìn)入漢語(yǔ)檢索版塊后,無(wú)需進(jìn)行勾選,直接在搜索框輸入檢索目標(biāo),點(diǎn)擊[搜索]鍵,界面就會(huì)呈現(xiàn)簡(jiǎn)單檢索結(jié)果,結(jié)果上方從左到右依次是[統(tǒng)計(jì)]鍵(統(tǒng)計(jì)符合檢索式的語(yǔ)言片段出現(xiàn)的頻次)、[篩選]鍵(對(duì)檢索結(jié)果進(jìn)一步剔除或者僅僅保留符合篩選檢索式的實(shí)例)、[下載]鍵(下載檢索或統(tǒng)計(jì)結(jié)果,登錄用戶可以下載10000條,非登錄用戶下載1000條)、[高級(jí)]鍵(設(shè)置檢索結(jié)果的顯示形式,控制上下文字?jǐn)?shù)),在每條檢索結(jié)果的最左方有[查看]按鈕,可以查看出處和更多上下文。以高大的n為例,具體結(jié)果如下:





2)歷時(shí)檢索進(jìn)入漢語(yǔ)檢索版塊后,用戶點(diǎn)擊[歷時(shí)檢索]按鈕,進(jìn)入以下界面。


進(jìn)入該界面后,用戶在搜索框輸入檢索目標(biāo)或檢索式,頁(yè)面就會(huì)呈現(xiàn)搜索結(jié)果,點(diǎn)擊圖中柱狀區(qū)域可查看實(shí)例,點(diǎn)擊搜索按鈕右側(cè)的對(duì)比按鈕可對(duì)比兩個(gè)查詢式的檢索結(jié)果,對(duì)于給出的檢索式歷年的出現(xiàn)頻次和頻率,在右上角處,可切換為柱狀圖、折線圖兩種顯示方式,也可以轉(zhuǎn)化為數(shù)據(jù)視圖,并進(jìn)行保存。以高大的n為例,具體結(jié)果如下:



3)自定義檢索進(jìn)入漢語(yǔ)檢索版塊后,用戶點(diǎn)擊[自定義]按鈕,進(jìn)入以下界面。


進(jìn)入該界面后,用戶可以搜索具體書著中的某句語(yǔ)料,即在最上方搜索框輸入檢索目標(biāo)或檢索式,并在下方搜索框中輸入具體著作的名字;或者在報(bào)刊、文學(xué)、多領(lǐng)域、古漢語(yǔ)四個(gè)語(yǔ)料中根據(jù)搜索需求進(jìn)行選擇,選擇完成后,點(diǎn)擊[搜索]按鈕,頁(yè)面就會(huì)根據(jù)不同的語(yǔ)料呈現(xiàn)不同的搜索結(jié)果,其中結(jié)果上方從左到右依次是[統(tǒng)計(jì)]鍵(統(tǒng)計(jì)符合檢索式的語(yǔ)言片段出現(xiàn)的頻次)、[篩選]鍵(對(duì)檢索結(jié)果進(jìn)一步剔除或者僅僅保留符合篩選檢索式的實(shí)例)、[下載]鍵(下載檢索或統(tǒng)計(jì)結(jié)果,登錄用戶可以下載10000條,非登錄用戶下載1000條)、[高級(jí)]鍵(設(shè)置檢索結(jié)果的顯示形式,控制上下文字?jǐn)?shù)),在每條檢索結(jié)果的最左方有[查看]按鈕,可以查看出處和更多上下文。以《駱駝祥子》的祥子v為例,具體結(jié)果如下:



4)對(duì)比檢索進(jìn)入漢語(yǔ)檢索版塊后,用戶點(diǎn)擊[搜索]按鈕旁的[對(duì)比]按鈕,呈現(xiàn)以下界面。


對(duì)比檢索有兩種語(yǔ)料來(lái)源,一種是單一來(lái)源,另一種是兩個(gè)來(lái)源。用戶按序在呈現(xiàn)的界面選擇[單一預(yù)料中],并根據(jù)自身檢索需求選擇語(yǔ)料,在本次示例中,選擇了[多領(lǐng)域]選項(xiàng),在兩個(gè)文本框中輸入[和平的n]與[穩(wěn)定的n],最后點(diǎn)擊[對(duì)比]按鈕,呈現(xiàn)搜索結(jié)果,結(jié)果有兩種呈現(xiàn)方式,分別為詞云顯示與列表顯示,在詞云顯示中,漢字字體較大的結(jié)果為高頻詞,在列表顯示中,會(huì)呈現(xiàn)具體頻數(shù),高頻詞位居前列,具體情況如下:


用戶回到[對(duì)比]呈現(xiàn)界面,點(diǎn)擊[兩個(gè)來(lái)源中]選項(xiàng),之后根據(jù)自身檢索需求選擇兩個(gè)語(yǔ)料來(lái)源,在本次示例中,選擇了[多領(lǐng)域]與[報(bào)刊]選項(xiàng),在一個(gè)文本框中輸入[穩(wěn)定的n],最后點(diǎn)擊[對(duì)比]按鈕,呈現(xiàn)搜索結(jié)果,結(jié)果有三種呈現(xiàn)方式,分別為詞云顯示、列表顯示以及柱狀圖顯示,在詞云顯示中,漢字字體較大的結(jié)果為高頻詞;在列表顯示中,會(huì)呈現(xiàn)具體頻數(shù),高頻詞位居前列;在柱狀圖顯示中,呈現(xiàn)檢索式在兩個(gè)語(yǔ)料來(lái)源中的頻率分布,具體情況如下:




3. 學(xué)習(xí)心得
就翻譯實(shí)踐而言,BCC漢語(yǔ)語(yǔ)料庫(kù)具有多重好處。首先,BCC 漢語(yǔ)語(yǔ)料庫(kù)擁有豐富語(yǔ)料資源,涵蓋了報(bào)刊、文學(xué)、對(duì)話、微博、科技、綜合和古漢語(yǔ)等多領(lǐng)域語(yǔ)料,為翻譯實(shí)踐提供多種語(yǔ)料來(lái)源與文章語(yǔ)境,方便譯者的翻譯實(shí)踐操作;其次,BCC漢語(yǔ)語(yǔ)料庫(kù)擁有海量數(shù)據(jù),如歷時(shí)檢索結(jié)果的海量數(shù)據(jù)可以驗(yàn)證術(shù)語(yǔ)準(zhǔn)確性;最后,BCC漢語(yǔ)語(yǔ)料庫(kù)功能豐富,通過(guò)多種功能的語(yǔ)料庫(kù)檢索, 能夠驗(yàn)證詞匯的搭配組合的典型性, 發(fā)現(xiàn)合適的搭配詞匯,避免譯者的主觀性推斷,有助于提高翻譯質(zhì)量。經(jīng)過(guò)本次學(xué)習(xí),筆者更加深刻地了解到了BCC漢語(yǔ)語(yǔ)料庫(kù)的優(yōu)勢(shì)與特點(diǎn),在后續(xù)的翻譯學(xué)習(xí)與翻譯實(shí)踐中將繼續(xù)使用BCC漢語(yǔ)語(yǔ)料庫(kù)輔助翻譯實(shí)踐,提高翻譯質(zhì)量與效率,提升譯文的可讀性。

關(guān)注VX公眾號(hào)“翻譯技術(shù)教育與研究”、“語(yǔ)言服務(wù)行業(yè)”,了解更多語(yǔ)言服務(wù)行業(yè)與翻譯技術(shù)相關(guān)的資訊和洞察~

技術(shù)科普 | BCC漢語(yǔ)語(yǔ)料庫(kù):多領(lǐng)域語(yǔ)料數(shù)據(jù)庫(kù)的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
扎赉特旗| 宿州市| 潮州市| 额敏县| 日照市| 徐闻县| 思南县| 特克斯县| 福贡县| 屏边| 思茅市| 墨竹工卡县| 安阳县| 华容县| 巴中市| 宣威市| 宁武县| 抚宁县| 紫云| 贞丰县| 大新县| 芜湖市| 顺义区| 清涧县| 正定县| 大埔区| 平果县| 西乌珠穆沁旗| 武清区| 阳新县| 景谷| 迁西县| 奈曼旗| 高陵县| 临海市| 四会市| 滕州市| 拉萨市| 策勒县| 江源县| 鹤山市|