巧用COCA,語料庫武力值UP!
1.介紹
美國當(dāng)代英語語料庫(Corpus of Contemporary American English)是由美國楊伯翰大學(xué) (Brigham Young University) 的Mark Davie教授開發(fā),美國最新當(dāng)代英語單語語料庫,是當(dāng)今世界上最大的英語平行語料庫。官網(wǎng):https://www.english-corpora.org/coca2.頁面詳解
2.1 主頁面
List:列表視圖Chart:用于比較檢索項(xiàng)在五種領(lǐng)域和不同時(shí)段內(nèi)的頻次
Collocates:用于研究詞語搭配
Compare:用于比較兩個(gè)詞的搭配現(xiàn)象,研究在其意義和用法上有何不同
KWIC:Keyword In Context,通過對(duì)檢索項(xiàng)相鄰的左邊或右邊若干個(gè)詞排序,研究檢索詞的用法
2.2 高級(jí)功能
Sections:條件檢索,能夠指定要檢索的時(shí)間段等
Texts/Virtual:基于COCA內(nèi)的語料創(chuàng)建自己的語料庫
Sort/Limit:設(shè)置結(jié)果排序規(guī)則,可以按頻率、相關(guān)性和英文字母三種方式排序。設(shè)置最低頻率,最小互信息值
Options:其他設(shè)置
3.Search功能
在“Search”頁面下選擇“List”一欄,并在搜索框中搜索,以“expect”一詞為例:4.Chart功能
在“Search”頁面下選擇“Chart”一欄進(jìn)行檢索,就可以通過柱狀圖直觀統(tǒng)計(jì)檢索的詞條在不同文體和不同年份中的詞頻情況,這樣有利于更恰當(dāng)?shù)氖褂迷摍z索詞。如下圖所示?5.Collocates功能
Collocates功能下有兩個(gè)搜索欄:- Word/phrase:在這里鍵入短語中的核心詞
- Collocates:鍵入搭配的介詞、冠詞等內(nèi)容,如不知道核心詞后應(yīng)搭配哪個(gè)介詞或冠詞,或者想限定詞性進(jìn)行檢索,可以在兩個(gè)搜索欄后面的[POS](Part of Speech,詞性)中鍵入想限定的詞性即可
2.在“Collocates”搜索欄鍵入“_i*”表示查詢與介詞的搭配,如要查詢名詞則把其中的“i”替換為“n”即可,其他詞性同理;注:個(gè)別詞性規(guī)則:名詞:[n*];動(dòng)詞:[v*];形容詞:[j*];副詞:[r*];代詞:[p*];連詞:[c*]。
3.在搜索欄下面的數(shù)字部分進(jìn)行選擇;
6.Compare功能
當(dāng)對(duì)比兩個(gè)近義詞或同義詞,但不知道它們各自如何搭配時(shí),可以使用Compare功能,比如對(duì)比work和job分別與哪些動(dòng)詞搭配使用。
在兩個(gè)搜索欄分別鍵入“work”和“job”,在“collocates”部分鍵入動(dòng)詞詞性,同時(shí)調(diào)整數(shù)字部分,見下圖?;
點(diǎn)擊“Compare words”后,在跳轉(zhuǎn)的“Frequency”頁面就會(huì)顯示結(jié)果
其中“W1”表示與“work”搭配的某一動(dòng)詞的詞頻;“W2”表示與“job”搭配的某一動(dòng)詞的詞頻;右側(cè)表格正好相反
在跳轉(zhuǎn)的“WORD”頁面看到結(jié)果如下圖?
7.Browse功能
(1)在“Browse”頁面下可以查詢?cè)~的使用情況、排名、詞性等信息。同樣以“l(fā)ook”為例:
在“Search”頁面下點(diǎn)擊“Browse”,即可進(jìn)入該頁面,見下圖?
搜索結(jié)果如下?:
(2)在“Browse”頁面下可以查詢以某個(gè)前綴或后綴開頭或結(jié)尾的單詞,以“-ism”為例,見下圖?:
注:切勿忘記輸入“*”,“*”在此代表所有以“-ism”結(jié)尾的詞
搜索結(jié)果如下?:
(3)在“Browse”頁面下可以查詢6萬詞范圍內(nèi)的詞匯的使用排名,比如在“Range”搜索欄中輸入“1-500”,即可查詢?cè)~庫中常用的前500個(gè)都是哪些詞匯,見下圖?:
搜索結(jié)果如下?:
8.KWIC功能
KWIC(Keyword in Context)也叫語境共現(xiàn)(Concordance),以檢索詞為中心,可以看到檢索詞所處的上下文語境以及一些詞性。以“expect”為例:
搜索結(jié)果如下?:
注:不同顏色代表不同詞性。藍(lán)色:名詞;紫色:動(dòng)詞;綠色:形容詞;棕色:副詞;灰色:代詞;黃色:介詞。
9.通配符使用
(1)比如想要搜索organization前搭配的動(dòng)詞有哪些,就可以在“SEARCH”頁面的搜索欄中輸入“[*v] organization”。(*可代替任意數(shù)量字母)
在跳轉(zhuǎn)的頁面就可以看到與“organization”搭配的動(dòng)詞的使用頻率,搜索結(jié)果如下圖?:
同理,如要查詢搭配的其它詞性的詞,詞性規(guī)則與“Collocates功能”中用到的相同。
(2)搜索近義詞:在搜索欄中輸入“[=develop]”,表示和develop意思詳盡的所有形容詞:
如要查詢與“a strategy”搭配且與“develop a strategy”意義相近的類似詞組,也是同理,在搜索欄輸入“[=develop] a strategy”即可得到結(jié)果。見下圖?:
(3)如想查詢某種詞性且此種帶有部分帶有某些字母的形式,比如要查詢以u(píng)n-開頭、-ed結(jié)尾的所有形容詞的所有形式,輸入“un*ed.[*j]”即可查詢(.[*j]表示詞性是形容詞)。見下圖?
(4)若想查詢動(dòng)詞+任何詞+ground的所有詞組,在搜索欄輸入“[vv*] * [ground]”即可得到結(jié)果(方括號(hào)中間有空格)。
前者用來查詢?cè)~匯,后者用來查詢特定詞性的搭配
(5)如要搜索以s開頭、第三個(gè)字母是n的任意單詞,則可以輸入“s?n*”進(jìn)行查詢。(?可代替一個(gè)字母)
本期分享到此結(jié)束,希望大家可以通過此次分享有所收獲~
特別說明:本文僅供學(xué)習(xí)交流,如有不妥歡迎后臺(tái)聯(lián)系小編。
- END -
翻譯技術(shù)教育與研究——搜索煮譯專題小組致力于普及搜商概念、推廣搜索資源、傳播搜索方法、讓搜索成為每一位譯者的習(xí)慣,從而提高譯者的工作效率。專題小組目前的主要方向是探索搜索資源、搜索內(nèi)容、搜索技巧、信息甄別、文本操控、碎片知識(shí)管理等相關(guān)知識(shí)。小組成員經(jīng)由老師指導(dǎo),通過定期會(huì)議及討論的形式確定選題,并以推文的形式分享探索結(jié)果。歡迎大家積極留言以及對(duì)搜索煮譯專題小組提供建設(shè)性意見!
原文作者:田貝西
推文編輯:賈銳