【PJSK】Banner角色對100、1K、5K、10K檔線時速影響的進(jìn)一步探究,以及檔線的預(yù)測方法
前言
????????這很可能是我寫過的最晦澀難懂的專欄了。比起科普或者說同人創(chuàng)作,這篇文章的文字只是在證明“我找到了一種能不靠主觀感覺比較角色Banner是燙是冷的方法”。
????????好在本文的精髓并不在文字,而是在圖片上。不想閱讀大段文字的讀者,只看本文的圖片,也可以大致理解本篇專欄的內(nèi)容。


????????在CV19465470(見下卡片)中,筆者初步探討了Banner角色對檔線時速的影響。操作方法大致如下:將原始檔線時速數(shù)據(jù)排除①活動類型(馬拉松/5v5)、②是否為箱活、③玩家人數(shù)與卡組配置的增長趨勢三個要素的影響,再按Banner角色取算術(shù)平均,即得到相應(yīng)角色的“活動熱度”指標(biāo)。
????????上述數(shù)據(jù)處理方法有以下兩點不足之處:①沒有考慮到節(jié)假日、寒暑春假對檔線的影響;②玩家人數(shù)與卡組配置的增長趨勢采用線性擬合即一次函數(shù)擬合,實際可能存在更合適的擬合方案。
????????本篇專欄①對以上兩點不足之處做出了完善;②基于本系列專欄的發(fā)現(xiàn)提出了新的檔線預(yù)測方法;③引入100、1K、10K檔線數(shù)據(jù),繪制了四種檔線下的角色活動熱度指標(biāo)柱狀圖。


節(jié)假日、寒暑春假對檔線的影響
????????在CV20489092(見下卡片)中,筆者已經(jīng)證明以下三點:①休息日、寒暑春假的分布會影響檔線增速;②休息日是一般的周六日還是法定節(jié)假日這一點,對于檔線增速沒有明顯影響;③每天深夜28時(凌晨4時)是檔線增速最慢的時刻?;谶@三點可以研究節(jié)假日、寒暑春假對檔線的影響。
????????我們以深夜4點為界把活動劃分為多個區(qū)間,把每個區(qū)間,包括活動開始~當(dāng)天28時,以及最后一天4時~活動結(jié)束,都定為“一天”。這樣的“一天”就游戲時間分為活動開始日、活動中間日、活動結(jié)束日3類,就現(xiàn)實時間分為工作日(平時)、工作日(寒暑春假)、節(jié)假日3類,兩兩組合共有3×3=9類。
????????日本沒有調(diào)休,所以所有的周六周日都是休息日,故在日本,任意連續(xù)的6天當(dāng)中,至少有一天是休息日。一期活動至少是8天,掐頭去尾正好還剩6天,所以每期活動中都至少有一天是“活動中間日&節(jié)假日”。我們以這樣的一天(24小時)作為對比的標(biāo)準(zhǔn),比照其它的“一天”的檔線增量,相當(dāng)于多少個“標(biāo)準(zhǔn)天”的檔線增量,就可以確定各種類型的“一天”,相對與“活動中間日&節(jié)假”的檔線增速系數(shù)。
????????具體計算流程如下:
獲取原始數(shù)據(jù),包括至今(截至第83期)每期活動期間的所有實時檔線和最終檔線數(shù)據(jù)。數(shù)據(jù)均來自sekai.best。
進(jìn)行數(shù)據(jù)篩選。僅選用這樣的數(shù)據(jù),在一個活動期間內(nèi),各檔線數(shù)據(jù)完整且無跳躍值。
對選出的數(shù)據(jù)中的每一期活動:遍歷該期活動的每一個“一天”,對這樣的“一天”逐個分類為以上提到的9類中的一類。以“活動中間日&節(jié)假日”類的“一天”的檔線增加量的平均值為基準(zhǔn)“1”,將其它類型的“一天”(如果在這期活動中有的話)的檔線增加量的平均值的相對大小,作為該類型“一天”的檔線增速系數(shù)的1個有效測量值。
對除了“活動中間日&節(jié)假日”類的剩下8個類型:將該類型的所有檔線增速系數(shù)有效測量值取算術(shù)平均,即得所需結(jié)果。
節(jié)假日以日本相關(guān)法律法規(guī)和修正案為準(zhǔn)。每年的暑假取7月20日~8月20日(含頭尾,下同),寒假取12月24日~次年1月7日,春假取3月25日~4月7日。既是寒暑春假又是節(jié)假日的日子,記為節(jié)假日。
????????最新的計算結(jié)果(截至第83期)如下:


對增長趨勢的更優(yōu)擬合,以及檔線預(yù)測方法介紹
????????本專欄考慮擬合檔線隨時間增長的趨勢的最簡單的一種方法,即多項式擬合。但如何找出多項式擬合的最優(yōu)階數(shù)呢?讓各個階數(shù)相互“比較一下本領(lǐng)”就是了。
????????既然我們可以分析活動類型、是否是箱活、活動期數(shù)、假期分布、Banner角色對檔線增速的影響,那么我們也可以反過來,在已知活動類型、是否是箱活、活動期數(shù)、假期分布、Banner角色的情況下反推檔線增速。這就是本專欄提出的檔線預(yù)測方法的原理,它可以在只知道歷史檔線數(shù)據(jù)的情況下,對尚未開始的活動的檔線高低做出預(yù)測。
????????為了找出多項式擬合的最優(yōu)階數(shù),筆者做了以下一件事情:
假定多項式擬合的最優(yōu)階數(shù)N在1~10之間。
對于1~10之間的每一個N,進(jìn)行以下操作:對74≤m≤83范圍內(nèi)的所有正整數(shù)m重復(fù)進(jìn)行如下操作:僅給出第1~(m-1)期活動的歷史活動數(shù)據(jù),令程序根據(jù)上述思路預(yù)測第m期活動的檔線,并在檔線時速-活動期數(shù)的多項式擬合中使用N階擬合,隨后計算檔線與實際檔線的誤差大小。直到所有的m被遍歷。
比較各個N的預(yù)測誤差情況,取表現(xiàn)最好(總體上誤差最?。┑腘為多項式擬合的最優(yōu)階數(shù)。
????????通過以上操作得出的多項式擬合最優(yōu)階數(shù)是4。此時,對100、1K線的平均預(yù)測相對誤差在20%以內(nèi),對5K、10K線的平均預(yù)測相對誤差在10%以內(nèi)。


檔線分析結(jié)果
????????下面給出經(jīng)過本專欄內(nèi)容完善的,對100線、1000線、5000線、10000線的歷史檔線數(shù)據(jù)的分析結(jié)果,柱狀圖中柱子的顏色對應(yīng)活動Banner角色的代表色。■





程序代碼和數(shù)據(jù)
1.活動分析程序(部分)
2.各類日期的休息日等價量的計算代碼
3.活動記錄.xlsx文件獲取
鏈接:https://pan.baidu.com/s/10Rn2MUkCN_hLdkzzEhVIRA?pwd=zdcw?
提取碼:zdcw