春時(shí)覓寶最優(yōu)路線的原理

這個(gè)圖相信大多數(shù)人都看過,但該策略和很多人最開始的想法并不一致,下面通過計(jì)算說明一下為什么是這個(gè)圖
此外還有基于這個(gè)路線,加上后期收尾方案計(jì)算出的理論最優(yōu)解,見https://bbs.nga.cn/read.php?tid=34122595
有很多人看到這個(gè)路線,會(huì)產(chǎn)生主要的兩個(gè)疑問
內(nèi)圈收益更高,為什么開局不投一個(gè)6走內(nèi)圈
為什么在部分情況下,不去定向到20積分的格子,反而去投隨機(jī)使得有概率錯(cuò)過20積分
下面計(jì)算怎樣操作使得消耗相同魂玉時(shí)獲得的平均積分更高
一、計(jì)算全隨機(jī)時(shí)平均消耗
首先給每個(gè)位置進(jìn)行編號(hào)

核心思想就是通過迭代的方法計(jì)算處于每一個(gè)位置時(shí),到終點(diǎn)平均消耗的魂玉和這一圈平均還能再獲得的積分,全隨機(jī)時(shí),每走一步消耗一個(gè)骰子,對(duì)應(yīng)1.2魂玉,先算內(nèi)圈再算外圈
處于位置30時(shí),投任何結(jié)果都直接到終點(diǎn),消耗1.2魂玉,獲得30積分
處于位置29時(shí),有1/6的概率投1到30,5/6的概率直接到重點(diǎn),平均消耗1.4魂玉,獲得30積分
處于位置26A時(shí),有1/6的概率投到29,此時(shí)需要再花平均1.4魂玉到終點(diǎn),獲得額外的10積分;有1/6的概率投到30,需要再花1.2魂玉;2/3的概率直接到終點(diǎn)
因此處于26A時(shí)到終點(diǎn)的平均消耗為1.2+1.4/6+1.2/6=1.633,平均獲得的積分為30+10/6=31.667
以此類推,處于25A時(shí)平均消耗為1.2+1.633/6(投1)+1.4/6(投2)+1.2/6(投3)+0*3/6(投456)=1.906,平均獲得的積分為(10+31.667)/6[投1]+(10+30)/6[投2]+30/6[投3]+30*3/6[投456]=33.611
后面的計(jì)算過程不再詳細(xì)贅述,直到位置6
處于位置6時(shí),平均消耗為1.2+(處于7A時(shí)平均消耗+處于8A時(shí)平均消耗+處于9A時(shí)平均消耗+處于10A時(shí)平均消耗+處于11A時(shí)平均消耗+處于12A時(shí)平均消耗)/6,約為8.457
平均獲得積分為 處于7A時(shí)平均積分/6+(處于8A時(shí)平均積分+10)/6+處于9A時(shí)平均積分/6+(處于10A時(shí)平均積分+20)/6+處于11A時(shí)平均積分/6+(處于12A時(shí)平均積分+10)/6,約為66.358
接下來計(jì)算外圈,計(jì)算方法和內(nèi)圈一樣,只有兩個(gè)地方有區(qū)別
投到位置16時(shí)會(huì)立即傳送到位置22并獲得10積分,因此位置16的平均消耗和平均積分不按照迭代公式計(jì)算,直接按位置16的平均消耗和平均積分=位置22的平均消耗和平均積分計(jì)算
投到位置6時(shí)會(huì)走內(nèi)圈,因此位置6的平均消耗和平均積分不按照外圈的迭代公式計(jì)算,而是代入前面算內(nèi)圈時(shí)位置6的平均消耗和平均積分
最終得到起點(diǎn)(位置0)時(shí),全隨機(jī)走到終點(diǎn)平均消耗為10.576魂玉,平均獲得積分為66.151,平均1魂玉能獲得6.255的積分

二、分析什么地方用定向更優(yōu)
由于到達(dá)終點(diǎn)的30積分不需要經(jīng)過就一定能拿到,因此跑較多圈時(shí)可以大致認(rèn)為平均每前進(jìn)一格就能有1積分(外圈31步,內(nèi)圈29步),下面記為“跑圈積分”
因此進(jìn)行一次隨機(jī)時(shí),能獲得平均3.5的“跑圈積分”,另外根據(jù)后面6格的積分分布,還能獲得(后面6格積分之和/6)的積分,該部分積分記為"獎(jiǎng)勵(lì)積分"
(1)若定向X步到10積分格,相當(dāng)于獲得了X的跑圈積分和10的獎(jiǎng)勵(lì)積分。若隨機(jī)則獲得平均3.5的跑圈積分和Y/6的獎(jiǎng)勵(lì)積分(Y為后6格總積分,至少為10)。此時(shí)定向比隨機(jī)多花的2魂玉,平均多獲得了X+10-3.5-Y/6,最多為10.83(此時(shí)X=6,Y=10),相當(dāng)于多花2魂玉的收益不超過10.83元,低于全隨機(jī)的1魂玉6.25積分
因此除極端情況外(如離目標(biāo)只需要10分且只剩下1個(gè)骰子),定向到10積分的格子一定是虧的
(2)若定向X步到20積分格,用同樣的算法,多花2魂玉平均多獲得了X+20-3.5-Y/6=X+16.5-Y/6的收益,最低為9.17(X=1,Y=50),最高為19.17(X=6,Y=20),平均多消耗1魂玉的收益在4.585-9.585之間,因此定向到20積分的格子收益和隨機(jī)相比需要看情況,走的步數(shù)越多,后面6格積分越少則更傾向定向,反之傾向隨機(jī)
(3)若定向X步到終點(diǎn),由于X不超過6,因此即便是后面這一段全隨機(jī),平均要投的次數(shù)也不會(huì)超過2次,也就是隨機(jī)直到終點(diǎn)的平均消耗不超過2.4,低于一次定向需要的3.2,再加上全隨機(jī)還有概率額外獲得后面幾格的積分獎(jiǎng)勵(lì)
因此除極端情況外(如離目標(biāo)還需要的積分剛好為30,且只剩下1個(gè)骰子),定向到終點(diǎn)一定是虧的
(4)若定向X步到16號(hào)位置(山兔位),相當(dāng)于額外跑了6格并獲得10積分,相當(dāng)于獲得X+6的跑圈積分和10的獎(jiǎng)勵(lì)積分。由于10-15號(hào)位置的后面6格積分都為30-40,再加上隨機(jī)到16號(hào)位也能額外獲得6的跑圈積分,因此定向到16號(hào)位多花的2魂玉的額外平均積分為X+6+10-3.5-Y/6-6/6,最高為12.5(X=6,Y=30),因此定向到16號(hào)位平均1魂玉的額外積分不超過6.25,剛好等于全隨機(jī)。
由于最優(yōu)策略平均收益一定是高于全隨機(jī)的,因此除極端情況外,定向到16號(hào)位(山兔格)一定是虧的
(5)若開局定向6步到木牌位強(qiáng)制走內(nèi)圈,假設(shè)后面全隨機(jī),根據(jù)前面的表格,走一圈平均消耗11.657魂玉,獲得66.358積分。和隨機(jī)相比,額外消耗1魂玉多,但只多了0.2分,巨虧。后面部分格子用定向后該數(shù)值會(huì)有變化,但很難改變開局走6巨虧的結(jié)論,后面還會(huì)再次計(jì)算驗(yàn)證一下
三、在定向可能最優(yōu)的位置計(jì)算定向收益
前面的計(jì)算說明,只從積分考慮,定向骰子只有定向到20積分的格子才有可能是最優(yōu)的。因此在后面6格有20積分的格子分別計(jì)算定向的收益
計(jì)算時(shí)需要從后往前計(jì)算,后面計(jì)算的結(jié)果若定向更優(yōu),則對(duì)策略進(jìn)行更新,前面格子的平均消耗和平均積分也會(huì)因此調(diào)整
還是先算內(nèi)圈,內(nèi)圈最后面的20積分格子為24A,因此從23A開始往前計(jì)算
處于位置23A時(shí),若定向1格到24A,根據(jù)前面的表格,平均消耗為2.223+3.2=5.423,平均積分為34.213+20=54.213;若隨機(jī),平均消耗為2.594,平均積分為38.248。因此在23A定向1平均多消耗5.423-2.594=2.829,平均多獲得積分為54.213-38.248=15.965,平均每多消耗1魂玉,獲得5.64的額外積分,低于目前的整圈平均收益6.25,因此隨機(jī)
處于位置22A時(shí),用相同的計(jì)算方法,定向2格和隨機(jī)相比,平均每多消耗1魂玉獲得6.09積分,仍低于6.25,因此隨機(jī)
處于21A時(shí),定向3和隨機(jī)相比每多消耗1魂玉的額外積分為6.20,仍然隨機(jī)
處于20A時(shí),定向4和隨機(jī)相比每多消耗1魂玉的額外積分為6.27,比6.25高了0.02,按理說應(yīng)該先把這一格的策略改為定向,但大概率最終的整圈平均收益會(huì)高于6.27,因此在后面的步驟中大概率還是會(huì)把這一步的策略調(diào)整回隨機(jī),因此暫且將該位置的策略定為隨機(jī)
處于19A時(shí),定向5和隨機(jī)相比每多消耗1魂玉的額外積分為7.58,相比目前的整圈平均收益提升較大,因此將19A的策略改為定向5。調(diào)整之后,對(duì)前面的格子平均消耗和平均積分都有影響,因此需要對(duì)表格進(jìn)行更新,如下圖

此時(shí)19A前面的格子平均消耗和平均積分都有變化,整圈平均收益由6.255提升到了6.273,已經(jīng)高于了20A定向4的收益,因此在20A處應(yīng)該隨機(jī)
繼續(xù)計(jì)算18A,定向6相比隨機(jī),平均多消耗1魂玉獲得的額外積分為8.77,高于目前的整圈平均收益6.273,因此將18A的策略更改為定向6。更改策略后再次進(jìn)行更新,更新后的整圈平均收益增加為6.293。然后再檢查一下此時(shí)的整圈收益是否超過了之前計(jì)算的定向格子的平均收益,若超過了則將超過的格子策略改回隨機(jī)并再次更新策略(實(shí)際未超過,無需調(diào)整)
然后從后往前依次計(jì)算每個(gè)6格內(nèi)有20積分的格子,判斷定向收益是否高于此時(shí)的整圈平均收益,若超過該數(shù)值則調(diào)整為定向,并對(duì)策略進(jìn)行更新且計(jì)算新的整圈平均收益,再檢查新的整圈平均收益是否高于之前的定向收益,若超過了則將超過的格子改回隨機(jī)并再次更新策略
對(duì)于個(gè)別后面6格有兩個(gè)20積分格子時(shí),分別計(jì)算定向到這兩格的平均收益,選取較高的那一個(gè)和整圈平均收益進(jìn)行對(duì)比
計(jì)算完內(nèi)圈后計(jì)算外圈,方法相同不再寫了
所有格子計(jì)算完成后,得到最終的每一格的平均消耗和平均積分

該結(jié)果即為最前面那個(gè)圖
最后再驗(yàn)證一下開局定向投6走內(nèi)圈的收益
若在起點(diǎn)隨機(jī),則消耗13魂玉,獲得84.94積分;若定向6則消耗10.49+3.2=13.69,獲得積分為80.75
結(jié)果顯而易見,若開局投一個(gè)6,相比隨機(jī)花的錢更多不說,獲得的積分還變少了,絕對(duì)是巨虧的
后面進(jìn)行了幾個(gè)小試驗(yàn),計(jì)算了一下內(nèi)圈收益到底有多少和開局投6虧多少,下面只放結(jié)果
(1)若開局投6,則整圈平均收益僅為5.898,需要多花10%左右的錢,巨虧
(2)若去掉內(nèi)圈,即把6號(hào)位的木牌去掉,改為什么都沒有的格子,此時(shí)整圈平均收益為6.456,僅僅少了1.2%的收益
(3)若去掉內(nèi)圈,即把6號(hào)位的木牌去掉,并且在6號(hào)位放一定的積分作為補(bǔ)償。結(jié)果放4分時(shí),整圈平均收益為6.535,和有內(nèi)圈的收益一樣。也就是說,走到6號(hào)位的木牌走內(nèi)圈的收益實(shí)際上只有4分,開局額外花一個(gè)定蹤券投6,相當(dāng)于定向到了一個(gè)只放了4分的格子,再次說明該方案巨虧!
(4)若保留木牌,即走到6號(hào)位仍然走內(nèi)圈,并且在6號(hào)位放一定的積分作為補(bǔ)償,則需要在6號(hào)位放12分,開局投6的收益才開始高于隨機(jī),又一次說明開局投6是一個(gè)超級(jí)吃虧的方案!