Sketch Engine探索第一彈來襲!
2023-03-20 10:40 作者:翻譯技術(shù)點(diǎn)津 | 我要投稿
本文約 3600 字,預(yù)計(jì)閱讀時(shí)間 25 分鐘
01Sketch Engine 簡介
Sketch Engine 是由 Lexical Computing CZ s.r.o. 于 2003 年開發(fā)的一個(gè)語料庫管理和文本分析軟件。它的目的是使研究語言行為的人(詞典編纂者、語料庫語言學(xué)研究者、翻譯者或語言學(xué)習(xí)者)能夠根據(jù)特定動(dòng)機(jī)的查詢來搜索大型文本集。幫助大家探索單詞在不同語料庫中的用法和上下文。其庫容十分龐大,現(xiàn)已有高達(dá)包含 101 種語言的語料,自帶語料庫 724 個(gè),最大的語料庫 English Web 2020 (enTenTen20) 含365億字符。在種種強(qiáng)大功能的加持下,Sketch Engine 可以用于各種不同的語言學(xué)研究和教學(xué)場景,例如語言學(xué)習(xí)、語言教學(xué)、語言翻譯、語言對(duì)比和語言分析等。



02如何進(jìn)入?
官網(wǎng):https://www.sketchengine.eu/
首先可以進(jìn)入學(xué)校的電子資源庫看看是否訂購了 Sketch Engine,隨后通過校園網(wǎng)或者校外訪問的方式即可進(jìn)入。還可以在登錄頁面通過搜索自己的學(xué)校來進(jìn)行登錄:



首先,Sketch Engine的名字來源于它的一個(gè)主要功能——詞匯素描(Word Sketch):將檢索詞的語法和搭配行為總結(jié)在同一個(gè)頁面上。
在詞匯素描頁面的查詢欄中輸入 maintenir 這個(gè)詞目(lemma),可以得出該詞在對(duì)應(yīng)語料庫中所有的語法和搭配信息,詞目(lemma)就是單詞的基本形式,而在搜索結(jié)果中囊括了該單詞的所有變形形式,例如以 go 為例,會(huì)得到包含 goes、went、going 等形式的結(jié)果。此處,從圖中可以看到搜索結(jié)果有 152 萬余條,為了使得搜索結(jié)果的呈現(xiàn)更加直觀清晰,我們可以調(diào)整展示視角(Change view options)以顯示詞頻(Show frequencies)。除了詞頻之外,此處還可以設(shè)置是否顯示搭配案例(Show collocation examples)、關(guān)聯(lián)度(Show scores)和文本類型(Show text types),也可以指定排序條件。

在詞匯素描頁面的查詢欄中輸入 maintenir 這個(gè)詞目(lemma),可以得出該詞在對(duì)應(yīng)語料庫中所有的語法和搭配信息,詞目(lemma)就是單詞的基本形式,而在搜索結(jié)果中囊括了該單詞的所有變形形式,例如以 go 為例,會(huì)得到包含 goes、went、going 等形式的結(jié)果。此處,從圖中可以看到搜索結(jié)果有 152 萬余條,為了使得搜索結(jié)果的呈現(xiàn)更加直觀清晰,我們可以調(diào)整展示視角(Change view options)以顯示詞頻(Show frequencies)。除了詞頻之外,此處還可以設(shè)置是否顯示搭配案例(Show collocation examples)、關(guān)聯(lián)度(Show scores)和文本類型(Show text types),也可以指定排序條件。
如果選定另外一個(gè) Cluster similar items(類似項(xiàng)詞叢),則會(huì)根據(jù)我們?cè)O(shè)定的值聚合意義相近的搭配項(xiàng)目,當(dāng)設(shè)定的值越接近 0,堆在一起的詞叢就會(huì)越多,其覆蓋的意義范圍也就越大,詞和詞之間的關(guān)聯(lián)會(huì)越松散;相反,當(dāng)設(shè)定值接近1時(shí),聚合在一起的詞叢就會(huì)越少,叢內(nèi)的詞語意思也會(huì)相對(duì)更加接近。
當(dāng)我們不勾選這兩個(gè)選項(xiàng)時(shí),就會(huì)得到了圍繞這個(gè) maintenir 動(dòng)詞多列展示,這也是最常規(guī)的操作:
按照展示結(jié)果依次是:和 maintenir 搭配的賓語、主語、副詞、代詞、動(dòng)詞不定式、介詞、并列使用的動(dòng)詞以及一些常用案例。根據(jù)其出現(xiàn)頻率,我們可以了解到這個(gè)動(dòng)詞置于不同于語境下的各類高頻搭配,以此為據(jù)可以判斷自己的用詞是否地道。值得注意的是,有些分類是需要進(jìn)一步篩選甄別的,如果對(duì)某一個(gè)條目感興趣或者有疑問,可以直接點(diǎn)擊 Concordance 或者條例數(shù) 277 來查看所選中的語料詳情:

2 - 指定子語料庫(在父語料庫信息詳情中可見);
3 - 指定最小的語料關(guān)聯(lián)度和詞頻數(shù)(低于設(shè)定值的搭配將不會(huì)被顯示);
4 - 指定另一個(gè)語料庫后,輸入指定詞目進(jìn)行詞匯素描,兩個(gè)詞的檢索結(jié)果會(huì)并列展示,如圖為法語和英語中對(duì)于“維持”這個(gè)單詞的部分搜索結(jié)果展示:
例如:repair shop比antique shop更具典型性;
? 圓圈大小代表了該搭配的頻率。例如:gift shop比bike shop更高頻;
? 圓圈的顏色表示它們所屬的語法關(guān)系(主語、賓語、修飾成分等);
? 餅圖上每個(gè)部分大小表示搜索結(jié)果中不同語法關(guān)系之間的比例大小。
以上就是對(duì) Sketch Engine 第一個(gè)板塊的探索啦,剩余的板塊敬請(qǐng)期待!
以上就是對(duì) Sketch Engine 第一個(gè)板塊的探索啦,剩余的板塊敬請(qǐng)期待!
參考資料:葛曉華.Sketch Engine的核心功能和應(yīng)用前景[J].外語電化教學(xué),2017(04):23-30.https://www.sketchengine.eu/https://en.wikipedia.org/wiki/Sketch_Engine
聲明:本公眾號(hào)轉(zhuǎn)載此文章是出于傳播行業(yè)資訊、洞見之目的,如有侵犯到您的合法權(quán)益,請(qǐng)致信:chongchong@lingotek.cn,我們將及時(shí)調(diào)整處理。謝謝支持!
聲明:本公眾號(hào)轉(zhuǎn)載此文章是出于傳播行業(yè)資訊、洞見之目的,如有侵犯到您的合法權(quán)益,請(qǐng)致信:chongchong@lingotek.cn,我們將及時(shí)調(diào)整處理。謝謝支持!
本文轉(zhuǎn)載自:翻譯技術(shù)教育與研究
轉(zhuǎn)載編輯:Pickey