大數(shù)據(jù)時代下社會科學研究方法的拓展(南開管理評論2022)
題目:大數(shù)據(jù)時代下社會科學研究方法的拓展——基于詞嵌入技術的文本分析的應用
摘要:在大數(shù)據(jù)時代的背景下,基于大數(shù)據(jù)的分析處理技術為以“數(shù)據(jù)驅(qū)動”的社會科學研究創(chuàng)造了新的發(fā)展契機。其中,詞嵌入(Word Embeddings)技術借勢大數(shù)據(jù)浪潮,以其高效的詞表征能力和強大的遷移學習能力在文本分析領域受到越來越多的關注。不同于傳統(tǒng)的文本分析路徑,詞嵌入技術不僅實現(xiàn)了對非結(jié)構化文本數(shù)據(jù)的表征,還保留了豐富的語義信息,可以實現(xiàn)對跨時間、跨文化文本中深層次文化信息的挖掘,極大豐富了傳統(tǒng)的社會科學實證的研究方法。文章總結(jié)了詞嵌入技術的基本原理及特點,系統(tǒng)地梳理了詞嵌入技術的六大應用主題:社會偏見、概念聯(lián)想、語義演變、組織關系、文本情感和個體決策機制。隨后,文章歸納了詞嵌入技術的基本應用流程。詞嵌入技術還面臨文本數(shù)據(jù)的選擇、中文文本的分詞處理、單詞語義信息的表征層次三種挑戰(zhàn),文章歸納了相應的應對思路與方法。最后,基于詞嵌入技術的強大適應能力,未來研究可以進一步關注該技術在管理領域的應用前景,包括政策效應評估、用戶推薦系統(tǒng)、品牌管理、企業(yè)關系管理、組織內(nèi)部管理、中國傳統(tǒng)智慧與管理問題六個方面。
標簽: