劉世界:6節(jié)語料庫專題課,從入門到精通
AIGC時代人工智能蓬勃發(fā)展,為語料庫研究注入了新的動力,語料庫建設(shè)與應用成為當前學界關(guān)注的熱點話題。
本次專題課將采用講師講解、案例驅(qū)動、實踐操作相結(jié)合的方式,全面介紹語料庫的核心概念、基礎(chǔ)知識與研究方法,探討語料庫完整的建設(shè)流程,以案例驅(qū)動的方式引導學員學習語料庫分析工具的應用。
同時探索基于編程的語料數(shù)據(jù)應用,幫助學員在實踐中掌握如何利用編程技術(shù)進行語料數(shù)據(jù)的復雜處理和多元分析,旨在輔助高校外語師生掌握語料庫建設(shè)與研究方法、技術(shù)及理念,更加深入地借助語料庫開展語言數(shù)據(jù)驅(qū)動的相關(guān)研究。
1.授課主題
AIGC時代的語料庫建設(shè)與應用專題課程:基礎(chǔ)與進階
2.招生對象
翻譯學/語言學相關(guān)專業(yè)的師生
采納語料庫驅(qū)動范式的研究者
從事語料文本挖掘相關(guān)研究者
3.課程安排
(1)第一講:語料庫核心概念與基礎(chǔ)知識
語料庫的定義、作用與分類
語料庫相關(guān)概念梳理與辨析
語料數(shù)據(jù)加工處理基本流程
語料庫應用與研究常用工具
(2)第二講:語料庫建設(shè)流程與實操演示
語料的采集與清洗
語料的對齊與轉(zhuǎn)換
常用標注工具實操
常用檢索工具實操
(3)第三講:案例驅(qū)動的語料庫分析工具應用(一)
案例驅(qū)動的AntConc應用與實操
案例驅(qū)動的WordSmith Tools應用與實操
案例驅(qū)動的LancsBox應用與實操
案例驅(qū)動的Sketch Engine應用與實操
(4)第四講:案例驅(qū)動的語料庫分析工具應用(二)
案例驅(qū)動的Wmatrix應用與實操
案例驅(qū)動的Coh-Metrix應用與實操
案例驅(qū)動的COCA應用與實操
案例驅(qū)動的BNC應用與實操
(5)第五講:基于編程的語料數(shù)據(jù)應用探索與實踐(一)
ChatGPT輔助Python編程入門
編程輔助下的語料預處理實操
詞頻統(tǒng)計與關(guān)鍵詞提取
詞匯密度/復雜度計算
語料數(shù)據(jù)視圖化方法
(6)第六講:基于編程的語料數(shù)據(jù)應用探索與實踐(二)
詞向量訓練
文本分類與情感分析
信息抽取與命名實體識別
LDA(Latent Dirichlet Allocation)主題建模
文本聚類分析
4.專題課程收獲
全面梳理語料庫核心概念與基礎(chǔ)知識
輕松掌握語料庫建設(shè)流程與重要工具
熟練運用語料分析工具解決實際問題
探索編程輔助的語料數(shù)據(jù)處理及分析
5.授課講師
劉世界
上海海事大學外國語學院工學博士在讀,《翻譯搜索指南》副主編,在《外語教學》《上海翻譯》《外語電化教學》《外語教學理論與實踐》《北京第二外國語學院學報》《中國科技術(shù)語》及The Interpreter and Translator Trainer(SSCI,A&HCI)等期刊發(fā)表論文10余篇,參與國家級、省部級科研項目多項,主持在研項目1項(上海海事大學2022年研究生拔尖創(chuàng)新人才培養(yǎng)項目),擁有計算機軟著2項(含上海海事大學海事英語辭典檢索平臺),獲得美國項目管理協(xié)會(PMI)項目管理專業(yè)人士(PMP)資格認證。研究方向:海事術(shù)語抽取與文本挖掘、翻譯技術(shù)。
6.授課時間
小班教學,欲購從速,滿20人即開課(報名截止日期:8月25日)
7.報名鏈接:https://ulruj.xet.tech/s/2zang8
8.咨詢鏈接:https://xeaje.xet.tech/s/14NbYB