【LL SIF】國服7周年大富翁活動策略及收益精算

????????前言:前幾次的大富翁活動我都做過計(jì)算,把之前的各個部分重新整合了一下,結(jié)合最新的價值體系搬到b站來??傮w來看這次策略和以往差不多。

【目錄】
1.???? 大富翁游戲規(guī)則及蒙特卡洛????模擬
2.???? 常見策略模擬結(jié)果
3.???? 活動收益構(gòu)成與分析(一次投料模型)
4.???? 不同情況下的策略選擇及收益總覽
5.???? 兩次投料的策略選擇及收益總覽
6.???? 策略討論與分析
7.???? 總結(jié)
8.???? 附件

1.???? 大富翁游戲規(guī)則及蒙特卡洛模擬
????????大富翁是玩家們喜聞樂見的活動,具有高趣味性、高收益的特點(diǎn)。活動簡要介紹如下:

?????? 玩家位于上述的棋盤中。有兩種骰子,一種叫隨機(jī)骰子,另一種叫指定骰子。骰子在往期活動中也叫紅包、音符,如果本文出現(xiàn)紅包音符其意就是骰子。隨機(jī)骰子可以隨機(jī)前進(jìn)1-3步,指定骰子可以在1-3中前進(jìn)指定的步數(shù)。一開始玩家位于start的位置,每走一步可以獲得1pt,踩到藍(lán)色pt點(diǎn)可以再額外+3pt,踩到黃色禮物點(diǎn)可以獲得1顆心,或1個50%糖罐,或1個100%糖罐,三者等概率發(fā)生。踩指的是正好落到這一格上,路過不算。踩到7號位的大禮物點(diǎn),相當(dāng)于踩兩次黃色禮物點(diǎn),可以一次性獲得兩次禮物獎勵。棋盤中會有熒光棒隨機(jī)出現(xiàn),踩中熒光棒后將會獲得該熒光棒,下一個熒光棒會出現(xiàn)在當(dāng)前格子的后7-11格之中。獲得的熒光棒可以額外兌換其他獎勵。每走一圈,可以額外獲得1心。隨機(jī)骰子每天免費(fèi)贈送三個,過期不候必須當(dāng)天用完;指定骰子每日簽到以及任務(wù)會送一些,根據(jù)以往來推測大概8-12個,本屆目測9個。更多需要每額外消耗25愛心獲得一個,指定骰子可以攢。
?????? 上述綠色部分為根據(jù)以往游戲規(guī)律的總結(jié)和推測,并非官方告知的明確的游戲規(guī)則。下文會根據(jù)這些綠色的信息進(jìn)行后續(xù)推導(dǎo),但如果這些信息不準(zhǔn),會較大影響結(jié)論,因此予以標(biāo)注。
?????? 于是,根據(jù)上述這些信息,我們寫出下述模擬代碼。該代碼固定隨機(jī)骰子數(shù)為60(不考慮隨機(jī)骰子必須當(dāng)日用完),指定骰子數(shù)從8到150,每2為一個步進(jìn)單位,每次每種策略模擬20w局,得出該情況下通過該策略能獲得pt、愛心、熒光棒的期望值。為求計(jì)算簡便,我們不對糖罐及心進(jìn)行區(qū)分,默認(rèn)50%糖=0.5心,100%=1心,并且后續(xù)評估收益時可以將獲得的心再次投入大富翁。主要是我懶得重新改代碼,而且上次大富翁時已經(jīng)把各種策略的期望都跑好了,這次只需要根據(jù)獎勵更新收益函數(shù)即可。重新改代碼就得重新跑,感覺沒太大必要……

?????? 通過手動修改上述代碼的策略處,就可以輕松得出各策略下獲得的pt、熒光棒和愛心數(shù)量。上述代碼是策略1的,限于篇幅,不展示其余策略的代碼。上述代碼輸出結(jié)果如下:

????????相應(yīng)行數(shù)代表指定骰子數(shù)的數(shù)量。比如,當(dāng)隨機(jī)骰子為60,指定骰子為16時,采取策略1,最終可獲得pt195.49點(diǎn),熒光棒16.49個,愛心39.07個。表格最多列到150行。

2.???? 常見策略與模擬結(jié)果
????????接下來,我們將手動設(shè)置各種策略,得出各種策略下獲得資源的期望數(shù)。根據(jù)前幾次的集思廣益,我們將驗(yàn)證下述13種策略。

?????? 根據(jù)歷屆活動的經(jīng)驗(yàn),最佳策略需要根據(jù)自己所能獲得的指定骰子數(shù)進(jìn)行調(diào)整,并不存在一個所有情況都能通吃的策略,因此每種策略都需要計(jì)算。我們將13種策略編為相應(yīng)代碼,將跑出的結(jié)果集中于下表:

?????? 但是,不同策略獲得的pt、熒光棒、愛心數(shù)量各不相同,有的pt多熒光棒少,有的熒光棒多pt少,到底哪種策略更好很難互相比較。因此,我們下一步將建立活動收益與pt、熒光棒、愛心的函數(shù)關(guān)系,從而對13種策略通過一個數(shù)值進(jìn)行比較。

3.???? 活動收益構(gòu)成與分析(一次投料模型)
????????本研究采用的價值體系為7.0經(jīng)驗(yàn)本位制體系,具體詳見https://tieba.baidu.com/p/7112019333。大致定價如下:

????????心的定價為初始4級,1/4/15/80的box,對應(yīng)實(shí)例是維納斯。由于8周年box不一定常駐,因此本研究不以8周年box(約58左右)來定價心、綠券的價值。
????????另外,我們?nèi)藶槎▋r個人寶石的價值為1800。個寶收藏意義遠(yuǎn)高于強(qiáng)度意義,1800只是人為隨意定的一個數(shù)值,并沒什么道理。
????????近半年來,可以明顯感覺到經(jīng)驗(yàn)的獲取速度顯著的加快了,因此心的價值在不斷上升,但經(jīng)驗(yàn)還是經(jīng)驗(yàn)沒有變,彩貼由于普U獲取途徑的增多貶值了。目前從國服進(jìn)度來看,這套價值體系還是站得住腳的。

????????通過大富翁活動,我們可以獲得pt、熒光棒、愛心。Pt達(dá)到固定值后可以直接領(lǐng)取pt獎勵,超出部分每7pt獲取一張機(jī)票,收益如下所示:

????????由于60個隨機(jī)骰子打底,pt最低也低不到哪里去,我們將穿獎前的pt固定收益從150pt起,到235pt,擬合為函數(shù),得:


????????下文以此函數(shù)計(jì)算pt穿獎前收益,而不是分為多個檔,這樣更方便計(jì)算,擬合的結(jié)果更平滑。穿獎后按每pt獲得136/7計(jì)算價值。

????????再看熒光棒:

????????在一次投料模型中,默認(rèn)兌換順序?yàn)?span id="s0sssss00s" class="color-pink-03">先技能券再愛心,在熒光棒50以前,每個產(chǎn)生290收益,50以后,每個產(chǎn)生217.5,是個分段函數(shù)。

?????????最后是愛心,直接按每個43.5折為相應(yīng)收益。

????????嚴(yán)格來說,獲得的愛心和熒光棒兌換的愛心,可以再次投入大富翁活動產(chǎn)出pt、熒光棒、愛心。但考慮到大部分玩家并不會在大富翁期間耗竭所有資源,具體抽多少更取決于自己的抽卡規(guī)劃,所以我們先計(jì)算一次投料的收益。對于指定骰子極少,難以穿獎的玩家,將熒光棒優(yōu)先兌換為愛心再次投料產(chǎn)出pt來穿獎,可能更為劃算,這部分我們放最后計(jì)算,而且計(jì)算多次投料時會用到一次投料的結(jié)論。
????????由此,我們得到了熒光棒、pt、愛心分別各自和收益的函數(shù)關(guān)系式,接下來我們將這三個相互不盡相同的資源統(tǒng)一化為收益,通過比較收益的大小決定具體選用的策略。

4.???? 不同情況下的策略選擇及收益總覽
????????于是,我們得到了下表,在指定骰子數(shù)固定后,即可看到對應(yīng)的最佳策略以及獲得資源期望。

?????? 可見,在指定骰子>54時,策略8全面勝出;22-52時,策略4勝出。其中夾雜了兩個策略1,是因?yàn)檎镁奂诖┆劸€附近,所以有一點(diǎn)變動,但1和4的差距極小,完全可視作全部采用策略4。在指定骰子極少的情況下,一次投料模型給出的結(jié)論是采用策略10。但這種情況下往往會將熒光棒兌換為心,加上直接獲得心再次投入大富翁,所以我們繼續(xù)計(jì)算二次投料模型。

5.???? 兩次投料的策略選擇及收益總覽
????????出于計(jì)算簡便,我們僅計(jì)算到兩次投料,即第一次產(chǎn)出的熒光棒兌換的愛心,和直接獲得的愛心,再次投入大富翁產(chǎn)出熒光棒和愛心,這個過程只循環(huán)一次,不考慮第二次產(chǎn)出的資源再投入。事實(shí)上,二次投料和三次投料相差無幾。
????????熒光棒在一次投料時,毫無疑問應(yīng)該優(yōu)先選擇技能券,但在2次投料時,可能不再是這樣。第四節(jié)數(shù)據(jù)顯示,pt穿獎后,約每心額外獲得7.07收益,因此,愛心在多次投料的價值為43.5+7.1=50.6(如果愛心直接用于本次八周年box,則約為65,此時5心>2技能券)。如果玩家能穩(wěn)定穿獎,則仍然優(yōu)先兌換技能券。如果玩家①不能穩(wěn)定穿獎,以及②全部愛心僅用于本次大富翁覆蓋的八周年box時,此時熒光棒可優(yōu)先兌換愛心并再次投料。我們?nèi)匀灰?3.5來計(jì)算心的價值,但分別計(jì)算熒光棒優(yōu)先兌換技能券(收益1)和優(yōu)先兌換愛心(收益2)的收益。
????????愛心稍微復(fù)雜一點(diǎn),以策略1為例,我們將第五節(jié)數(shù)據(jù)中,以指定骰子數(shù)為x,熒光棒、pt、愛心分別為y,行線性回歸,得到的系數(shù)/25代表的就是每多投入一個愛心,可以額外產(chǎn)出資源的數(shù)量,他們的r2都非常的高,線性趨勢極佳。結(jié)果是,如果以策略1進(jìn)行游戲,每多投入一個愛心,可以額外獲得0.126pt,0.012熒光棒,0.023愛心。我們將這部分疊加在一次投料直接獲得的資源上面。所以,在二次投料模型中,玩家用于二次投料的愛心數(shù)=一次投料直接獲得的愛心+一次投料獲得的熒光棒兌換的愛心,后者需要分別計(jì)算優(yōu)先兌換技能券和優(yōu)先兌換愛心的兩種情況。最終獲得的pt=一次投料pt+(二次投料愛心數(shù))*系數(shù);熒光棒及愛心計(jì)算方式同理。然后計(jì)算總收益。值得注意的是,愛心仍然按照43.5計(jì)算,不能按51計(jì)。如果按51計(jì)的話,則不能疊加二次投料的pt、熒光棒、愛心。對13種策略重復(fù)該操作,最終得到下表:

????????對于部分優(yōu)先pt的策略,當(dāng)指定骰子數(shù)非常多時,一旦隨機(jī)骰子用完,就會在3-6-9-12進(jìn)行循環(huán),只要熒光棒沒有隨機(jī)在這幾個格子上,之后就永遠(yuǎn)吃不到了。這部分策略的熒光棒數(shù)到一定數(shù)量后,不再會隨指定紅包數(shù)而進(jìn)一步增加。對這部分策略,熒光棒的回歸范圍為平臺期之前,會對平臺期前更為可靠(例如穿獎前),但會高估平臺期之后,不過這部分策略本身就是為穿獎前考慮的,因此不影響結(jié)論。
????????在指定骰子多少個,應(yīng)該采取策略幾,應(yīng)該優(yōu)先兌換愛心還是技能券(最佳策略為小數(shù)說明熒光棒優(yōu)先兌換愛心,否則優(yōu)先熒光棒),都一目了然。

????????將指定骰子數(shù)和最大總收益作圖:

????????可見,曲線分為兩段,穿獎前收益是最可觀的,穿獎后收益放緩。由于多次投料時,5心價值和2技能券十分接近,因此兩者沒有明顯的分界點(diǎn),線性趨勢良好。

6.???? 策略討論與分析

????????不論二次投料還是一次投料,策略基本一致。縱觀13種策略,僅有策略10(適用于指定紅包≤20)、策略4(22≤指定紅包≤54)、策略8(>54)可用,其余均敗走。

????????策略1是絕大部分玩家最直覺的策略,然而計(jì)算表明,僅在極少情況下可略微勝出策略4,但兩者差距極小,簡潔起見,可以統(tǒng)一使用策略4,而且策略4pt更多,和策略1相比,以少拿1-2個棒子的代價,在臉黑時候優(yōu)先確保穿獎。
????????策略2或策略3是指定骰子極少時的,大部分玩家直覺的策略。然而計(jì)算表明,策略2或3均遠(yuǎn)遠(yuǎn)不如策略10。在指定紅包不足20時,最優(yōu)策略是3/3,并將熒光棒優(yōu)先換為愛心再次投料。原因在于,60個隨機(jī)骰子的步數(shù)期望是恒定的,120,這種情況下,盡可能讓指定骰子全扔3是最好的,讓指定骰子扔1來獲取特定的道具步數(shù)上很虧。而且熒光棒可以兌換愛心再次投料,因此用3/3策略,稍微兼顧一下熒光棒,比只顧pt的0/1-3收益更高。
????????在指定骰子極其富余時,大部分玩家直覺的策略是策略4-7,兼顧pt和紅包。但實(shí)際計(jì)算表明策略8才是最強(qiáng)的,其原因和策略10一致,盡可能讓指定骰子走出最大步數(shù),強(qiáng)行走1或2來補(bǔ)刀一個pt點(diǎn)并不值得。策略8和策略9十分巧妙,通過檢測和下一個熒光棒的距離,選擇使用隨機(jī)或用指定全部走3的倍數(shù),萬不得已再補(bǔ)刀,這種策略下基本可以使指定骰子都走出最大步數(shù),而且不漏熒光棒。策略8和策略9相比,策略9隨機(jī)紅包消耗的更少,很容易出現(xiàn)指定用完了但隨機(jī)還有的局面,沒法合理搭配使用兩種骰子,因此全面落敗策略8。

7.???? 總結(jié)
①??? 如果你現(xiàn)有資源難以穿獎,熒光棒優(yōu)先兌換愛心,獲得的愛心再次投入大富翁以圖更高pt;如果你打算在大富翁覆蓋期間耗竭自己所有的心來抽8周年box,此時也優(yōu)先兌換愛心,因?yàn)?周年box的每心收益+二次投料收益將大于技能券。其余情形均優(yōu)先兌換技能券,其次愛心。這個兌換順序其實(shí)隨性即可,我的計(jì)算只是基于我的定價體系,不同道具的價值對不同玩家本就是不一樣的。
②??? 穿獎后,每消耗一心,可額外獲得約7.3點(diǎn)收益。所以說298=250心性價比低于5紅券+21技能券+21糖。
③??? 在資源難以穿獎時(指定骰子≤18),建議選用策略10并優(yōu)先兌換愛心再次投料。
④??? 對于大部分玩家(20≤指定紅包≤54),建議選用策略4
⑤??? 對于土豪玩家(>54),建議選用策略8
⑥??? 極限穿獎所需最少心數(shù):175(需要指定16個-送的9個),采用策略10并兌換愛心再次投料,最終pt237。不過這種策略會因指定骰子不足而漏掉大量熒光棒,自然情況下兼顧熒光棒穿獎需要指定骰子20-22個(策略4),折合心數(shù)300-350。

8.???? 附件
????????本研究的表格匯總文件、模擬文件、以及一個簡易計(jì)算器,均附贈下載。格式都是xlsm。


????????大富翁pt音符計(jì)算器說一下,這個文件可以自行輸入當(dāng)前的位置和狀態(tài),然后雙擊任意單元格即可開始模擬計(jì)算,模擬了七種最常用的策略,并輸出每種策略的五分位數(shù)和平均數(shù),以供參考和策略調(diào)整,是個十分實(shí)用的小工具。核心代碼不變,但具體計(jì)算方式略有不同,具體詳見文件內(nèi)的說明區(qū)。每種策略模擬5w次生成一個5w個數(shù)的數(shù)組,對7個這樣的數(shù)組排序后才能輸出五分位數(shù),排序是整個程序最消耗算力的步驟。試錯時用冒泡插入慢的很,快排要溢出,最終采取堆排快了很多?;倦p擊單元格等幾秒就能出結(jié)果了。

鏈接:https://pan.baidu.com/s/1LTnKfG22XENpY_cA6qIIvw
提取碼:w9nk
?

大概就這些內(nèi)容了,歡迎指正、討論~
