循環(huán)系數(shù)、區(qū)間完播率、總體完播率

一、完播率的概念
在廣義上,完播率是指:視頻播放的次數(shù)中,有多少是完整播完的。
在實(shí)際計(jì)算過(guò)程中,視頻網(wǎng)站約定俗成的完播率是指:視頻平均播放時(shí)長(zhǎng)在視頻總長(zhǎng)中的占比。或者說(shuō):完播率就是平均播放進(jìn)度。
?

B站的UP主后臺(tái)中也給出了這個(gè)數(shù)據(jù),我們并不知道B站在統(tǒng)計(jì)過(guò)程中是如何工作的。但是我們可以通過(guò)陳瑞《很高興遇見你》的報(bào)告中參考信息進(jìn)行計(jì)算:
?

視頻給出了平均播放時(shí)長(zhǎng)的定義:平均播放時(shí)長(zhǎng)?= 播放分鐘數(shù)÷播放次數(shù)
此時(shí),完播率,也就是平均播放進(jìn)度就有了計(jì)算方法:
完播率 = 平均播放時(shí)長(zhǎng) ÷ 視頻總分鐘數(shù) = 播放分鐘數(shù)?÷ 播放次數(shù) ÷ 視頻總分鐘數(shù)
二、區(qū)間完播率和總體完播率
通過(guò)概念的梳理,可以確定完播率是在某一個(gè)時(shí)間段內(nèi)視頻的平均播放進(jìn)度。
在通常情況下,完播率是從視頻投稿開始,到某個(gè)時(shí)間點(diǎn)的平均播放進(jìn)度情況。為了消歧,這個(gè)完播率我們會(huì)在下面稱作“總體完播率”。
而在區(qū)間統(tǒng)計(jì)的過(guò)程中,也有一個(gè)“完播率”用來(lái)描述數(shù)據(jù)的變化情況。它是在某段時(shí)間內(nèi)所產(chǎn)生的播放行為的平均播放進(jìn)度,也就是“區(qū)間完播率”。
三、完播率在周刊中的作用
周刊左下角顯示的就是“區(qū)間完播率”,通過(guò)視頻的區(qū)間完播率可以用來(lái)在本周的播放次數(shù)和播放分鐘數(shù)之間進(jìn)行直接換算。

?
除了數(shù)據(jù)展示以外,完播率數(shù)據(jù)還是后期播放時(shí)長(zhǎng)更迭預(yù)案的一部分。雖然無(wú)法獲取播放計(jì)數(shù)是一個(gè)非常非常小概率的事件,但是預(yù)案還是有相關(guān)的涉及:
首先是神話曲的成就評(píng)估預(yù)案:每周的周刊統(tǒng)計(jì)階段,還會(huì)顯示完播率均值和播放進(jìn)度均值。通過(guò)這個(gè)均值可以獲得一個(gè)合理的平均完播率。而這個(gè)完播率可以用來(lái)對(duì)成就系統(tǒng)進(jìn)行近似的換算。
舉個(gè)例子:目前統(tǒng)計(jì)的12期,完播率均值在47%~52%之間,平均時(shí)長(zhǎng)是1分45秒-2分之間。假如在數(shù)據(jù)充足的情況下我們聚類統(tǒng)計(jì)后,中心完播率為51%,中心播放時(shí)長(zhǎng)為1分48秒鐘。那么神話曲、傳說(shuō)曲、殿堂曲等播放量成就可以分別等效換算為一千八百萬(wàn)分鐘、一百八十萬(wàn)分鐘、十八萬(wàn)分鐘
?

其次是周刊公式的近似換算預(yù)案:對(duì)于如此大的改動(dòng),最簡(jiǎn)單直接的方式肯定是更換更合理的公式。但是年刊的制作和類似期刊的數(shù)據(jù)統(tǒng)計(jì)則沒(méi)有直接“重新開始”的機(jī)會(huì)。部分?jǐn)?shù)據(jù)缺失是必然的,為了補(bǔ)齊這些數(shù)據(jù),就需要一個(gè)“統(tǒng)計(jì)值”來(lái)折算不同換算式所產(chǎn)生的差異。區(qū)間完播率的持續(xù)計(jì)數(shù),則可以用來(lái)分析這一“統(tǒng)計(jì)值”。
?
四、非法完播率
完播率有幾個(gè)不同角度的定義,首先針對(duì)這些定義從意義角度上確認(rèn)下值域:
(1)視頻播放的次數(shù)中,有多少是完整播完的
這個(gè)定義是完整播放次數(shù)與總播放次數(shù)的比值。在意義上,完整播放的次數(shù)一定是小于總播放次數(shù)的。因此它的值域是[0,1]。
(2)視頻平均播放進(jìn)度。
任何性質(zhì)的“進(jìn)度”的值域一定是[0,1]的
因此,從定義上講,完播率的合法值域是0% ~ 100%。而超過(guò)100%的完播率都是非法完播率。
?
五、導(dǎo)致非法完播率的原因
既然有非法完播率,那么數(shù)據(jù)是不是真的異常呢?不是的。
從計(jì)算式上講播放分鐘數(shù)?÷ 播放次數(shù) ÷ 視頻總分鐘數(shù)可以改寫為播放分鐘數(shù)?÷ ( 播放次數(shù) × 視頻總分鐘數(shù) )。因?yàn)橐曨l總分鐘數(shù)是恒正的固定值,因此當(dāng)播放分鐘數(shù)和播放次數(shù)不受限時(shí),因此理論值域是[0,∞)。
那么就可以從這個(gè)計(jì)算式和值域的差異情況上討論一下導(dǎo)致非法完播率的原因:
首先,從計(jì)算式中可以輕易的獲知其值域關(guān)系:
播放分鐘數(shù)?≤ 播放次數(shù) × 視頻總分鐘數(shù) 時(shí) 值域是[0,1]
播放分鐘數(shù)?> 播放次數(shù) × 視頻總分鐘數(shù) 時(shí) 值域是(1,∞)
要知道,視頻總長(zhǎng)是固定的“視頻總分鐘數(shù)”,是恒定的。因此理論上播放次數(shù)每增加一,播放分鐘數(shù)的增加量最大不應(yīng)超過(guò)“視頻總分?jǐn)?shù)”。而當(dāng)出現(xiàn)非法完播率時(shí),一定是突破了這個(gè)“播放分鐘數(shù)的增加量”的最大值的。也就是說(shuō):在非法完播率情況下,播放次數(shù)每增加一,播放分鐘數(shù)的增加量超過(guò)了視頻的總分鐘數(shù)。
回到計(jì)算式上,造成以增加量超額原因,也就是導(dǎo)致非法完播率的原因就非常清晰了:
情況一:播放分鐘數(shù)計(jì)數(shù)有額外數(shù)據(jù)
情況二:播放次數(shù)計(jì)數(shù)缺少
六、B站的反刷、推廣與計(jì)分方式
有因必有果,導(dǎo)致非法完播率的原因也可以在B站的網(wǎng)站規(guī)則中尋找到痕跡。
首先,這些規(guī)則來(lái)自Github等網(wǎng)站的黑盒實(shí)測(cè)結(jié)果,不代表B站的具體代碼邏輯,也不代表未來(lái)B站不會(huì)修改相關(guān)規(guī)則。
首先是額外的播放分鐘數(shù):
B站的播放分鐘數(shù)是通過(guò)每5秒一次的播放器“心跳”同步來(lái)統(tǒng)計(jì)的,因此只要是在持續(xù)播放,那么這個(gè)分鐘數(shù)就會(huì)持續(xù)累加。但是由于沒(méi)有重新進(jìn)入頁(yè)面,所以播放次數(shù)不會(huì)發(fā)生變化。因此產(chǎn)生了超額的“播放分鐘數(shù)”
其次是缺少的播放次數(shù):
在充電計(jì)劃啟動(dòng)之后,為了防止部分UP主為了充電獎(jiǎng)勵(lì)惡意刷播放數(shù)據(jù),B站嚴(yán)格的打擊了播放計(jì)數(shù)刷取的情況,這些規(guī)則會(huì)移除一部分播放次數(shù),最終導(dǎo)致播放次數(shù)缺少。
最常觸發(fā)的規(guī)則就是5分鐘播放規(guī)則:視頻播放5分鐘內(nèi)刷新或者重新播放不計(jì)播放計(jì)數(shù)。
但是不計(jì)播放次數(shù)的行為并不影響播放分鐘數(shù)的統(tǒng)計(jì),因此導(dǎo)致了播放次數(shù)的缺少。
其他原因-推廣計(jì)劃:
部分視頻在購(gòu)買“推廣計(jì)劃”之后會(huì)出現(xiàn)同時(shí)產(chǎn)生上述兩種情況的現(xiàn)象。具體體現(xiàn)是部分稿件被引流進(jìn)入,但是觸發(fā)了數(shù)據(jù)刷取規(guī)則,部分播放沒(méi)有被計(jì)入。但是同時(shí)由于播放分鐘數(shù)是向上取整的,因此就算部分引流觀眾播放后沒(méi)有留存,也會(huì)向上取整播放分鐘數(shù)。最終導(dǎo)致的綜合結(jié)果就是:播放分鐘數(shù)增長(zhǎng)速度遠(yuǎn)超過(guò)播放次數(shù)。而這種增速倍數(shù)超過(guò)視頻分鐘數(shù)時(shí)就會(huì)觸發(fā)“非法完播率”,因此這個(gè)原因是“數(shù)學(xué)性”的,而不是“邏輯性”或者“惡意性”的
七、循環(huán)系數(shù)
非法完播率的存在,在B站現(xiàn)實(shí)面是存在的,而在邏輯面則是不應(yīng)該出現(xiàn)的。
除了“推廣計(jì)劃”這類特例以外,無(wú)論是播放計(jì)數(shù)的缺少還是播放時(shí)長(zhǎng)的額外累加,最終的結(jié)果都是非法完播率現(xiàn)象。
為了簡(jiǎn)化問(wèn)題的定義,假定“播放次數(shù)”是一定準(zhǔn)確的,那么這類非法完播率現(xiàn)象的原因就可以歸一為:觀眾在同一頁(yè)面不斷循環(huán)播放,導(dǎo)致了額外的播放分鐘數(shù)被統(tǒng)計(jì)。這類非法完播率現(xiàn)象可以稱為“類循環(huán)播放”
此時(shí),完播率 = ( 播放分鐘數(shù)?× 平均循環(huán)次數(shù) ) ÷ ( 播放次數(shù) × 視頻總分鐘數(shù) )
如果觀眾沒(méi)有進(jìn)行循環(huán)播放,那么平均循環(huán)次數(shù)為1,完播率不存在額外的播放時(shí)長(zhǎng)數(shù)據(jù)。
如果觀眾額外進(jìn)行了N次循環(huán)播放,那么平均循環(huán)次數(shù)就是(1+N),完播率存在額外的播放時(shí)長(zhǎng)數(shù)據(jù)N × 播放分鐘數(shù)
如果將剔除循環(huán)情況的完播率視作“基礎(chǔ)完播率”,則等式可以進(jìn)一步轉(zhuǎn)化為 完播率 = 基礎(chǔ)完播率 ?× 平均循環(huán)次數(shù) 。 這里面“平均循環(huán)次數(shù)”就是完播率的“循環(huán)系數(shù)”
?
八、區(qū)間完播率的循環(huán)系數(shù)顯示
由于數(shù)據(jù)缺失,從數(shù)學(xué)上完全的剔除循環(huán)顯然是不可能的,只能是近似的擬合。
從周刊數(shù)據(jù)角度上,完播率還可以寫作:
總體完播率<期號(hào)=n>=(區(qū)間播放分鐘數(shù)<期號(hào)=1> + 區(qū)間播放分鐘數(shù)<期號(hào)=2> + 區(qū)間播放分鐘數(shù)<期號(hào)=3> + ... + 區(qū)間播放分鐘數(shù)<期號(hào)=n-1> + 區(qū)間播放分鐘數(shù)<期號(hào)=n> ) ÷ ( (?區(qū)間播放次數(shù)<期號(hào)=1> + 區(qū)間播放次數(shù)<期號(hào)=2> + 區(qū)間播放次數(shù)<期號(hào)=3> + ... + 區(qū)間播放次數(shù)<期號(hào)=n-1> + 區(qū)間播放次數(shù)<期號(hào)=n> ) × 視頻總分鐘數(shù) )
由于“類循環(huán)播放”現(xiàn)象是不持續(xù)存在的,因此隨著統(tǒng)計(jì)區(qū)間量的累加,循環(huán)數(shù)據(jù)占總數(shù)據(jù)的比例會(huì)越來(lái)越低,總體完播率也會(huì)逐漸向基礎(chǔ)完播率的實(shí)際值逼近。越老的視頻總體完播率受“類循環(huán)播放”現(xiàn)象的影響越小,越趨近于真實(shí)的基礎(chǔ)完播率數(shù)據(jù)。
所以選擇視頻的總體完播率作為視頻的基礎(chǔ)完播率顯示是較為合適的,此時(shí)“區(qū)間完播率”以總體完播率 ?× 區(qū)間循環(huán)系數(shù)的格式顯示。
區(qū)間循環(huán)系數(shù)的值可以通過(guò) 區(qū)間完播率÷總體完播率 來(lái)計(jì)算獲得:
?

由于這個(gè)寫法是基于“近似”的邏輯,所以該表達(dá)式只能作為“區(qū)間完播率”的一種顯示格式。

不過(guò),這種顯示格式也是有一些額外的好處的:
(1)給出了視頻總體完播率,這是一個(gè)評(píng)價(jià)視頻整體留存情況的官方指數(shù)。
(2)評(píng)估視頻完播情況變化趨勢(shì):當(dāng)循環(huán)系數(shù)>1時(shí),完播率環(huán)比上升,說(shuō)明最近這個(gè)曲子的觀眾更多的留存,曝光率上升;當(dāng)循環(huán)系數(shù)=1時(shí),完播率不變,說(shuō)明曲子的觀眾播放情況沒(méi)有變化,不溫不火; 當(dāng)循環(huán)系數(shù)<1時(shí),完播率環(huán)比下降,觀眾相較于作品的平均順準(zhǔn)的關(guān)注和曝光率呈下降態(tài)勢(shì);
? (3)? 標(biāo)記可疑的視頻:當(dāng)循環(huán)系數(shù) > ( 5 / 總體完播率 ) 時(shí),需要重點(diǎn)關(guān)注是否有異常的數(shù)據(jù)干擾稿件成績(jī)。