最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

技術(shù)科普 | COCA:世界上最大的在線免費英語語料庫

2022-10-04 10:32 作者:翻譯技術(shù)點津  | 我要投稿



1. 工具簡介

美國當代英語語料庫(Corpus of Contemporary American English),簡稱COCA。2008年,美國楊伯翰大學語言學教授Mark Davies教授創(chuàng)立了美國當代英語語料庫,它是當今世界上最大的在線免費英語平衡語料庫,能夠幫助語言學習者了解單詞、短語以及句子結(jié)構(gòu)的使用頻率及相關(guān)信息。美國當代英語語料庫具有四大特色。第一個特色是其語料均衡分布在電影字幕、媒體對話、小說、雜志、報紙以及學術(shù)期刊等文體中;第二個特色是它能夠隨著時間的推移,比較不同時間點出現(xiàn)的同一詞匯;第三個特點是提供詞匯出現(xiàn)的頻率與相關(guān)字比較的功能;第四個特點是其涵蓋西班牙文和葡萄牙文語料庫。除此之外,美國當代英語語料庫十分注重語料庫內(nèi)容的時效性,它以每年2000萬字的速度更新和擴充。
官網(wǎng):https://www.english-corpora.org/coca/

2. 圖文教程
打開美國當代英語語料庫的網(wǎng)址,可以看到以下界面。


界面最上方的圖標從左至右分別代表語料庫簡介、語料庫數(shù)據(jù)下載、分析文本、學術(shù)詞匯表、隨機選擇的詞匯、登錄、收藏、虛擬語料庫、查詢歷史和幫助;在這些圖標下方的四個按鈕分別是搜索、詞頻、語境和概述;頁面的左側(cè)的四個藍色按鈕分別是列表、圖表、單詞和瀏覽;藍色按鈕的下方是搜索框,可以搜索單詞和詞組。
2.1 語料庫簡介


語料庫由485202個文本中的10多億個單詞組成,每年語料庫都會更新單詞以保持其時效性。語料庫均衡分布在電視和電影字幕、口語、小說、流行雜志、報紙和學術(shù)期刊、博客和網(wǎng)頁方面。
2.2 語料庫數(shù)據(jù)下載


通過點擊藍色單詞即可跳轉(zhuǎn)網(wǎng)頁以購買語料庫,購買后方可進行下載使用。
2.3 分析文本


在輸入文本之前,可以選擇輸入的文本類型,比如小說、雜志、新聞和學術(shù)論文等。輸入文本后,就可以根據(jù)COCA中的數(shù)據(jù)查看文本中有關(guān)單詞和短語的有用信息。


以新聞這個文本類型為例,搜索后的界面將突出顯示文本中所有的高頻詞、中頻詞和低頻詞,并創(chuàng)建這些詞的列表,這個頻率數(shù)據(jù)可以幫助語言學習者關(guān)注生詞。除此之外,使用者還可以點擊文本中的單詞,查看任何單詞的詳細信息。


以單詞“rearrange”為例,以上界面包括單詞的定義、同義詞、語音、圖像和視頻鏈接、相關(guān)主題、搭配和集群等。
2.4 學術(shù)詞匯表


《學術(shù)詞匯表》包含了學術(shù)英語的前3000個單詞,使用者可以免費下載該列表。對于那些對學術(shù)英語感興趣的人來說,這是一個很好的選擇。有兩種不同的方式查看列表中的單詞,一種是通過詞元查看單詞,另一種是通過詞族進行查看。
2.5 搜索選擇搜索下的列表一欄,并在搜索框中搜索單詞,以“jump”為例。


搜索后就會出現(xiàn)以上界面,界面中包含了動詞“jump”的各種形式,以及各種形式單詞出現(xiàn)的頻次。除此之外,還可以使用通配符來查找一些單詞或句子的用法。比如搜索*break*和 more * than 就會出現(xiàn)以下兩個界面。


第一個界面是在語料庫中所有涵蓋“break”的單詞,第二個界面是在語料庫中所有涵蓋“more...than”的詞組以及這些單詞和詞組出現(xiàn)的頻次數(shù),這對于語言學習者是十分有幫助的。選擇搜索下的圖表一欄,并在搜索框中搜索單詞,以“l(fā)aptop”為例。


搜索后,圖表會顯示每個部分的總頻率,還可以按子類型和年份查看單詞出現(xiàn)的頻次和頻率。


除此之外,還可以點擊語境按鈕,查看單詞“l(fā)aptop”在不同年份和不同類型文本中出現(xiàn)的次數(shù)以及具體的上下文內(nèi)容。值得注意的是,通過點擊頁面上的小喇叭和翻譯圖標可以打開百度翻譯的界面,能夠讀出文本的內(nèi)容并進行翻譯,這對于教師和語言學習者是十分方便的。



3. 學習心得
美國當代英語語料庫是當今世界上最大的在線免費英語平衡語料庫,可以稱得上是廣大語言學習者的知識寶庫。該語料庫界面設(shè)計簡潔明了,對于使用者非常友好。通過使用該語料庫可以充分了解單詞、短句以及句子結(jié)構(gòu)的信息,其中包括單詞、短語以及句子結(jié)構(gòu)在不同類型文本中出現(xiàn)的時間以及出現(xiàn)的頻次,因此該語料庫對于語言學習者提高用詞水平和準確度方面具有重要的作用。該語料庫的功能強大,還有許多功能值得我們進行探索和學習。

本文轉(zhuǎn)載自:翻譯學習共同體

關(guān)注VX公眾號“翻譯技術(shù)教育與研究”、“語言服務(wù)行業(yè)”,了解更多語言服務(wù)行業(yè)與翻譯技術(shù)相關(guān)的資訊和洞察~


技術(shù)科普 | COCA:世界上最大的在線免費英語語料庫的評論 (共 條)

分享到微博請遵守國家法律
乐东| 清远市| 洛隆县| 芜湖县| 福鼎市| 襄城县| 辽中县| 永昌县| 彭山县| 鹰潭市| 武安市| 大新县| 肇东市| 轮台县| 西华县| 邢台市| 石阡县| 扎鲁特旗| 大邑县| 东乌珠穆沁旗| 大足县| 锡林浩特市| 嘉禾县| 凤台县| 岱山县| 丽江市| 河曲县| 成武县| 赤水市| 健康| 张家港市| 布拖县| 尖扎县| 原平市| 怀宁县| 洪江市| 隆安县| 宾川县| 彰化县| 土默特右旗| 新巴尔虎左旗|