【數(shù)據(jù)分析】番劇評(píng)分,9.9分與9.8分的區(qū)別在哪里?
眾所周知,b站評(píng)分的參考價(jià)值是比較低的,但這并不代表它完全沒(méi)有用處。
低分番或多或少會(huì)有些問(wèn)題這不用多說(shuō),高分番(特別是達(dá)到9.5分的)一般都屬于值得一看的類型。換而言之,b站評(píng)分并未喪失排雷和推薦的作用。
既然推薦的效果存在,那么對(duì)于一些只想看好番的觀眾而言,高分番的評(píng)分準(zhǔn)確度至關(guān)重要。
由于一些原因,諸如《魔法少女小圓》等在其他地方獲得特大好評(píng)的番在b站這里是9.8分,而不是9.9分。于是,一些人便說(shuō):在b站,9.8以上的基本都是神作,這些作品之間的差距并不大。甚至還有“9.8分史詩(shī)神作,9.9分慎重觀看”這樣的迷惑說(shuō)法:

目前b站有60部9.9分的番,337部9.8分的番,365部9.7分的番。為什么9.8分番和9.7分番數(shù)量差不多,而9.9分番數(shù)量要少很多?9.9分與9.8分之間有區(qū)別嗎?

分?jǐn)?shù)差距從何而來(lái)?代表了什么?
首先很可惜的一點(diǎn)是,b站的評(píng)分顯示只保留小數(shù)點(diǎn)后一位。這在評(píng)分低一些的時(shí)候沒(méi)什么大問(wèn)題,然而在分?jǐn)?shù)達(dá)到9.8這一級(jí)別后,精確度就不能令人滿意了。
比如,9.90分和9.98分的番比較,前者的差評(píng)率大概是后者的5倍之多。即使拿“粉絲狂熱刷分”一點(diǎn)來(lái)說(shuō)事,5倍的好評(píng)/差評(píng)比不是這么好弄的,畢竟那些愛(ài)打低分的路人對(duì)這些9.9分番都一視同仁,直接1星。還有,每一部9.9分番都受到粉絲的熱愛(ài),又憑什么一些番會(huì)有更多粉絲愛(ài)刷高分呢?這樣的刷分意愿本身就是作品優(yōu)秀在某種方面的體現(xiàn),盡管它的客觀性確實(shí)會(huì)有所下降。
簡(jiǎn)而言之,在超高分番的評(píng)分世界里,只要沒(méi)有水軍,那么分?jǐn)?shù)高就是“粉絲熱愛(ài)”與“路人緣好”的共同體現(xiàn),兼具“粉絲強(qiáng)推”與“大眾接受”的評(píng)分標(biāo)準(zhǔn),這對(duì)沒(méi)看過(guò)番的路人而言有著獨(dú)特的推薦效果。
然后呢……之前一直在說(shuō)“好評(píng)”“差評(píng)”之類的,我們還是不要忘了稀有物種——2~4星評(píng)分的存在。
···在此插播一條公式,b站評(píng)分的計(jì)算方法應(yīng)該是這樣的:
分?jǐn)?shù) = 10 × (實(shí)星數(shù) ÷ 總星星數(shù))
總星星數(shù) = 實(shí)星數(shù) + 空星數(shù)
(1星評(píng)價(jià) = 1個(gè)實(shí)星 + 4個(gè)空星,2星評(píng)價(jià) = 2個(gè)實(shí)星 + 3個(gè)空星,以此類推)
一些比較苛刻的觀眾會(huì)仔細(xì)觀看作品并指出一些不太好的地方,從而打出2~4星評(píng)分。
我們可以用這么一個(gè)通用的式子將其轉(zhuǎn)化為5星和1星:
4個(gè)X星評(píng)價(jià) = (X-1)個(gè)5星評(píng)價(jià) + (5-X)個(gè)1星評(píng)價(jià)
(例如:4個(gè)3星評(píng)價(jià) = 2個(gè)5星評(píng)價(jià) + 2個(gè)1星評(píng)價(jià))
從式子中可以看出,每4個(gè)2、3、4星評(píng)價(jià)分別對(duì)應(yīng)3、2、1個(gè)1星評(píng)價(jià),剩下的用5星補(bǔ)足。這種視角可以讓我們順應(yīng)b站評(píng)分的"二極管"現(xiàn)狀,在效果上將所有評(píng)分都轉(zhuǎn)化為好評(píng)和差評(píng)。
通過(guò)觀察一些評(píng)分理由,我們可以發(fā)現(xiàn),當(dāng)作品某些部分做得特別好的時(shí)候,會(huì)有更多的觀眾不忍心打5星以外的評(píng)分,即“瑕不掩瑜”評(píng)分現(xiàn)象。例如“XX方面打6星,在XX方面扣1星”的5星評(píng)價(jià)。也就是說(shuō),高分番中較少的2~4星評(píng)價(jià)代表著作品很出彩,有特色。換而言之就是比較值得去看了。同時(shí),也體現(xiàn)在評(píng)分上,使得數(shù)據(jù)更高一些。

9.9和9.8的分界點(diǎn)在哪里?怎么知道高分番之間細(xì)微的評(píng)分差距?
從現(xiàn)在開(kāi)始才是真正的數(shù)據(jù)分析階段。為了讓人更好理解我是怎么做的,我先舉一個(gè)例子:

用瀏覽器(我用火狐)找到這個(gè)網(wǎng)頁(yè)
點(diǎn)擊“短評(píng)”
點(diǎn)擊鼠標(biāo)中鍵,然后將鼠標(biāo)往下移
掛機(jī)25分鐘,等待所有短評(píng)加載完畢
鍵盤敲擊ctrl-s,保存網(wǎng)頁(yè)
用記事本打開(kāi)保存的html文件,復(fù)制到input.txt
使用寫好的程序統(tǒng)計(jì)星星

對(duì)于番劇魔法少女小圓,我們得到如下結(jié)果:
空星數(shù):871
實(shí)星數(shù):87619
星星數(shù):88490
評(píng)分:9.902分(使用上面的公式)
搞到這里,各位可能會(huì)有許多問(wèn)號(hào)???為啥9.8分的番劇算下來(lái)是9.9分?
實(shí)不相瞞,當(dāng)時(shí)我也是有問(wèn)號(hào)的。
為了搞清楚這個(gè)算出來(lái)的數(shù)據(jù)與實(shí)際評(píng)分之間有什么關(guān)系,我對(duì)18部9.9分番劇和21部9.8分番劇進(jìn)行了上述操作,結(jié)果如下:




以上數(shù)據(jù),除了街角魔族第二季采集自7月5日外,時(shí)間都是7月10日。
藍(lán)色的那兩張,都是9.9分的番,在“短評(píng)估計(jì)”那一欄幾乎都超過(guò)了9.9,均值9.942。
接著,黃色的兩張是9.8分的番,同樣“短評(píng)估計(jì)”一欄幾乎都超過(guò)了9.8,均值9.866。而且,竟然有比9.9還高的,三月的獅子第二季居然算出了個(gè)9.94,為什么還是9.8分?
所謂的短評(píng)估計(jì),指的就是通過(guò)我剛才的方法,加載完所有短評(píng)然后數(shù)星星得到的結(jié)果。
實(shí)際上,b站的短評(píng)分兩種,一種有內(nèi)容,一種無(wú)內(nèi)容。

如果只打了星星,就是無(wú)內(nèi)容短評(píng);打完星星還寫了點(diǎn)字,就是有內(nèi)容短評(píng)。
以魔法少女小圓為例,其有內(nèi)容短評(píng)只有大約17700個(gè)。可是當(dāng)算上無(wú)內(nèi)容短評(píng)時(shí),數(shù)量是:

47300+個(gè)。
毋庸置疑,這個(gè)9.8肯定是通過(guò)這47300個(gè)評(píng)價(jià)綜合得出的,要是使用那17700個(gè)有內(nèi)容短評(píng)的數(shù)據(jù),或許確實(shí)有偏差。
但是問(wèn)題來(lái)了,偏差有這么大嗎?短評(píng)估計(jì)處算出9.9,實(shí)際得分卻是9.8,要如何解釋呢。
在討論解釋方法之前,讓我們先來(lái)回憶一下第一張圖上的內(nèi)容:

10.0分的作品真的不存在嗎?當(dāng)然不是。這里有我另一專欄的傳送門,看一眼就知道了:
10分是存在的,只要第一波評(píng)分所有人都打5星,就能出來(lái)。(然后這個(gè)10.0就會(huì)引來(lái)小鬼惡意評(píng)分,一個(gè)人就可以拉到9.9分)
其次,表格1上,高木同學(xué)第三季的短評(píng)估計(jì)是9.975分,就算實(shí)際評(píng)分低一些,也應(yīng)該能超過(guò)9.95,但b站的顯示依然是9.9。
這兩點(diǎn)說(shuō)明什么?說(shuō)明評(píng)分沒(méi)有四舍五入,小數(shù)點(diǎn)一位后的數(shù)據(jù)直接給截?cái)嗔恕?/p>
因此我們要將評(píng)分公式修改:
分?jǐn)?shù) =?(只保留一位小數(shù),后面的部分扔掉)(10 × (實(shí)星數(shù) ÷ 總星星數(shù)))
修改后的評(píng)分公式,使得9.89分的番劇會(huì)顯示成9.8分(這也解釋了小圓為什么會(huì)是9.8分),9.99分的番劇顯示成9.9分。而只要有個(gè)4星就低于10,因此10.0分的番劇自然就無(wú)法穩(wěn)定存在了。
接下來(lái)我們來(lái)關(guān)注短評(píng)估計(jì)的準(zhǔn)確性。
從上述分析可知,顯示9.9分與9.8分的界限在9.900……分這一處,但是有不少9.8分的番劇算出了高于9.9分的短評(píng)估計(jì),且低于9.8分的短評(píng)估計(jì)較少;對(duì)于9.9分番劇也是相似的,很少找得到低于9.9分的短評(píng)估計(jì)值。
也就是說(shuō),短評(píng)估計(jì)的那個(gè)分?jǐn)?shù)一般會(huì)偏高一點(diǎn)點(diǎn),通常偏差值在-0.01~+0.03。
舉個(gè)例子:當(dāng)我對(duì)一部9.8分的番劇進(jìn)行短評(píng)估計(jì),得到了9.85分時(shí),說(shuō)明它的實(shí)際分?jǐn)?shù)大概是9.82~9.86分,其中9.82和9.86的概率低一些。
除此之外,或許會(huì)有一些異常情況導(dǎo)致不準(zhǔn),可能是水軍發(fā)了過(guò)多的無(wú)內(nèi)容好評(píng)或差評(píng)。
……反正我是不清楚那個(gè)間諜過(guò)家家是發(fā)生了什么事,我算得9.696分但是顯示9.8分,測(cè)量數(shù)據(jù)過(guò)于異常了所以顯得格格不入。要不就把它剔除別分析了吧。