【BanG Dream!】很有感情,很有精神——臺詞文本情感分析初探
寫在前面
????????人具有閱讀文本,分析其中所含情感,甚至其中潛臺詞的能力——冬天到了,請閱讀下面四句描述“下雪”的例句:
耶耶耶天哪天哪居然下雪了!!哇哇哇哇像撒上奶油般的街道真的好好看?。?/strong>
哇塞,居然下雪啦!開心誒,這不就又有雪景可以欣賞了嗎?
看窗外兄弟 / 姐妹,下雪了,開不開心?
下雪了。我很開心。真的。嗯。
????????雖然這四句話都描寫“下雪”這一事件,并且都含有“開心”這個關(guān)鍵詞,但說話人的情緒積極性,是從1到4逐句遞減。
????????1,常見于各大社交平臺,是看見雪這一“真實的魔法”時的狂喜;2,一般的開心,適用于日??谡Z交際;3,轉(zhuǎn)述下雪這一事實,只是個中性的問句;4,盡管有個“開心”,這個“開心”則可能是因為雪把說話人今天剛曬干的被子又弄濕了,可能是因為說話人的姐姐答應(yīng)Ta“當(dāng)且僅當(dāng)明天天晴,明天一起出去約會”——總之這個“開心”不是真心的。


????????話說回來,我們能讓電腦判斷文本中蘊含的情緒嗎?答案是——雖然在很多方面尚不能做得和人類一樣好——但是可以。事實上,通過程序判斷文本中情緒的積極性和消極性的技術(shù),目前已在電商、輿情分析等領(lǐng)域得到一定應(yīng)用。
????????本篇專欄將對用程序分析《BanG Dream!少女樂團(tuán)派對》中角色臺詞蘊含的情緒的方法做一個初探,并按照情緒積極性對角色進(jìn)行排序。

怎么用Python判斷文本中的情緒
????????textblob是一個Python包,內(nèi)置了可以分析英語文本中蘊含的情緒的程序。它通過判斷其中出現(xiàn)的描述情緒的詞語的數(shù)量、文本使用的句式、文本中出現(xiàn)的意象等方式,判斷文本中包含的情緒積極性。具體的工作原理較為復(fù)雜,在此不繼續(xù)做介紹了。
????????我們首先看到如下3句長度相等,但包含的情緒不同的英語段落(附中譯):
1. I really love Poppin'Party, their sweet sounds and powerful lyrics can always delight me and fulfill my heart with unlimited courage.(帶有積極情緒的一句話。中譯:我真的很喜歡Poppin'Party,她們那甜美的歌聲、有力的歌詞,總能讓我心情愉悅,同時使我心中充滿無限勇氣。)
2. It's widely known that the younger twin sister of that guitarist is the chairperson of the student council of the high school nearby.(在情緒上中性的一句陳述句。中譯:那位吉他手的雙胞胎妹妹是附近高中的學(xué)生會長,這是廣為人知的。)
3. Hina is sad, because she has to do?a pile of exhausting tasks now. Even worse, Sayo went for practice and will not be with her today.(帶有消極情緒的一句話。中譯:日菜很難過,因為她現(xiàn)在非要干一堆累人的活不可。更糟的是,紗夜出去練習(xí)了,今天不會陪著她了。)
? ? ????我們將這三句話輸入程序,將會返回介于-1與1之間的情感極性參數(shù)。其中,數(shù)值越大情感越積極,1為情感最積極,-1為情感最不積極。以下是程序代碼:
????????以下是程序的輸出結(jié)果:
????? ? 我們看到,帶有積極情緒的第1句返回了正值結(jié)果;在情緒上中性的第2句返回的結(jié)果接近0;帶有消極情緒的第3句返回了負(fù)值結(jié)果。三個返回結(jié)果都介于-1與1之間。

數(shù)據(jù)處理
????????textblob只支持分析英語文本,所以我們首先要取得各個角色臺詞的英語版本。臺詞獲取范圍是國際服截至2021年12月21日實裝的所有活動劇情、卡面小故事和回憶小故事、主線劇情和樂隊劇情。角色覆蓋范圍是35個主要角色、米歇爾和麻里奈,共37位。

????????然后用如下只有15行的代碼處理英語臺詞。
????????該代碼能將37個角色的臺詞的情感極性輸出到已事先準(zhǔn)備好的Result_SentiAna_En.xlsx這一Excel文件中。經(jīng)Excel排序、排版得到如下結(jié)果:


結(jié)論與分析
所有角色的臺詞,通過程序判定,都被認(rèn)為是偏向情緒積極的。
心、PAREO、育美、伊芙、香澄被認(rèn)為是臺詞情緒最積極的幾個角色。尤其是心,情感極性高出別的角色一大截。
有咲、瑠唯、蘭、美咲和米歇爾、紗夜的臺詞被認(rèn)為情緒沒有那么積極。
????????臺詞積極性高還是比較好解釋的。我們注意到積極性排名較高的角色,總的來講給人這樣兩個印象:①平時情緒就很高漲;②很少(不是從不?。┫萑霟喇?dāng)中。排名最前的五個角色,甚至附帶著往下位列第六的亞子,無一例外都是元氣系的角色。
????????臺詞積極性低的角色稍微難解釋一些。對于這些角色的特點,筆者通過觀察大致總結(jié)出以下幾個有待驗證的規(guī)律:①言語風(fēng)格冷淡;②傲嬌;③苦勞人。論言語風(fēng)格,蘭和瑠唯是不用說的“冰冷系”,有咲、美咲,甚至于往上幾位的紗夜、友希那、LAYER,都可歸為較冷淡,語言中情感透露少的一類。情感透露少,情感極性自然偏向中性,在“全員正值”的邦邦企劃則可能表現(xiàn)為情感極性數(shù)值低。論傲嬌,我們看到邦邦的幾個傲嬌擔(dān)當(dāng),除了CHU2排在中間位置,剩下的都靠后甚至在最后五名中?!鞍翄伞敝小鞍痢钡牟糠趾芸赡軙颓楦袠O性。至于苦勞人,我們看到苦勞人雙咲組在最后五名中都榜上有名。整天辛苦能有好氣么(■
