【PJSK】誰又是全Sekai最大的話癆?角色臺詞句數(shù)和總字數(shù)統(tǒng)計的繼續(xù),第一第二竟是…
寫在前面
????????本篇專欄統(tǒng)計了從開服至今(2021年10月27日,第38期活動“Revival my dream”開展期間)所有場景對話、活動劇情、卡牌故事、主線劇情中,26名主要角色的說話情況:包括說了幾句話,說了幾個字,其中幾個是漢字,幾個是假名等。

????????UP主黒鯨(黒鯨的個人空間_嗶哩嗶哩_bilibili)提供了用于本專欄的臺詞文本,向其表示誠摯的感謝。

統(tǒng)計說明
①什么是假名、平假名、片假名(已知道的讀者可以跳過)
????????日語的書寫形式是假名摻雜著漢字。漢字大家都很熟悉,而其中的假名就可以看作是日語的字母。
一歌はミクの歌が好きです。
(一歌喜歡Miku的歌。)
? ? ? ? 這句話中,“は”“です”“ミク”等不是漢字的部分就是所謂的“假名”。
? ? ? ? 假名又分平假名和片假名。像“あいうえお”這樣筆畫圓潤,像是草體字的就是平假名;像“アイウエオ”這樣筆畫筆直,像是楷體字的就是片假名。
? ? ? ? 一般來講書寫日語使用平假名。但是,專有詞、外來語等,一般用片假名拼寫。專有詞比如:ニーゴ(25,在劇情中用作指代“25時,在Nightcord”的簡稱)。外來語比如:ギター(Guitar)、ショー(Show)。
②“一個字”“一句話 / 一次發(fā)言”在本文中怎么判定
? ? ? ? 每說一個漢字、一個假名(無論是平假名還是片假名,無論是大的(あ、つ)還是小的(ぁ、っ)),就算是說了一個字。標點符號、特殊符號、阿拉伯數(shù)字和拉丁字母不算是字。
“Amiaはよく「てへっ☆」っと笑います?!?/strong>
(Amia經(jīng)?!罢O嘿☆”這樣笑起來。)
? ? ? ? 這句話在統(tǒng)計時只算12個字(“は”、“よ”、“く”、“て”、“へ”、“っ”、“っ”、“と”、“笑”、“い”、“ま”、“す”)。
????????在游戲界面中一次性顯示在文本框里的內(nèi)容,無論長短,無論是否換行,無論有幾個逗號 / 句號,均算作一句話,或者一次發(fā)言。
????????(2021.10.28更新)幼年期劇情也納入統(tǒng)計范圍。
????????(重要:2021.10.29更新)幼年期劇情也包括了小學時期、中學時期的臺詞。以“某某的聲音(○○の聲)”的形式出現(xiàn)的角色臺詞也納入統(tǒng)計范圍。25時的四人在Nightcord上使用網(wǎng)名相互交流的臺詞也納入統(tǒng)計范圍。

統(tǒng)計結果
????????其它字符包括了文本中除換行字符外,所有不屬于平假名、片假名、漢字中任何一類的字符,也就是上述“不算字”的字符。
????????總字數(shù)是平假名數(shù)、片假名數(shù)、漢字數(shù)的總和。漢字占%的計算公式為:漢字數(shù)÷總字數(shù)×100%。
????????角色從上到下按總字數(shù)從多到少排列。
????????較多的數(shù)據(jù)用紅色加粗表示,較少的數(shù)據(jù)用綠色加粗表示。




其它統(tǒng)計結果與分析
統(tǒng)計發(fā)現(xiàn)除MIKU以外的所有虛擬歌手,發(fā)言句數(shù)和總字數(shù)都偏低。這與各虛擬歌手在各Sekai的實裝情況(包括實裝與否、實裝順序)有關系。MIKU從一開始就在5個Sekai同時登場,因此是虛擬歌手中發(fā)言最多的。
統(tǒng)計發(fā)現(xiàn)句均字數(shù)最多的角色是神代類;句均字數(shù)最少的角色是朝比奈真冬。

關于上一條的原因,進一步統(tǒng)計發(fā)現(xiàn),神代類的臺詞有最高的長句比例,非幼年劇情中(算上符號)達到40、45、50個字的長句在所有臺詞中分別占21.4%、12.9%、6.9%,而所有角色的平均值分別是12.9%、7.1%、3.5%。而朝比奈真冬的臺詞中,有很多是非常簡短的句子,比如,“為什么?”“這樣嗎”。
全游戲的句均字數(shù)(平假名+片假名+漢字)是19.60個字。略少于同類的社交手游音游《BanG Dream! 少女樂團派對》在相同條件下統(tǒng)計得的24.28個字。
統(tǒng)計發(fā)現(xiàn),青柳冬彌、神代類、朝比奈真冬的臺詞中漢字占比最高;鏡音鈴、鳳笑夢、天馬咲希的臺詞中漢字占比最少。
全游戲的漢字百分比是17.64%,和《BanG Dream! 少女樂團派對》在相同條件下統(tǒng)計得的17.72%基本一致?!?/p>
每個角色的話加在一起已經(jīng)有1363138個字了,需要114本有30頁的20×20作文本才能全部抄完,而且里面還沒有標點符號?!?/p>