最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

網(wǎng)絡麻將實力的評價方法

2021-08-21 11:47 作者:連鎖  | 我要投稿

1.引言

麻將是運氣游戲。成熟的競技項目只需要很短的對局數(shù)就可以保證實力稍強一線的選手有可觀的概率贏下比賽。以乒乓球為例,馬龍生涯974戰(zhàn)839勝,勝率86%[1],而他的對手也多是訓練了數(shù)萬小時的職業(yè)運動員。能夠精確地敏感地反映實力差,強者就能經(jīng)常地在賽會制比賽中取得好名次,訓練量差距就能直觀的反映到成績上,項目本身就能夠順利競技化、職業(yè)化。

麻將不是這樣的項目。數(shù)理麻將研究者Meaning曾做過如下模擬:給定日本麻將(以下日麻)網(wǎng)絡平臺《天鳳》的對局者的等級分(Rating,簡稱R)差距和對局數(shù),觀測兩人間的直接勝負[2]。如圖1[3],等級分相差400左右(相當于約6段位差)的二人,單局的勝負在六四開,等級分相差80左右(相當于約1段位差)的二人,單局高分者的勝率只能將將過半。而要確保在95%的置信水平上,一定對局數(shù)內(nèi)贏多輸少,等級分高400的玩家需要100戰(zhàn),等級分高80的玩家則需要2000戰(zhàn)。這意味著在對局數(shù)通常遠小于100戰(zhàn)的賽會制比賽中,我們完全無法憑勝負關系判斷剛入門的的新人,和經(jīng)驗豐富的老手誰強誰弱——而他們之間的訓練量可能相差百倍。相對地,對于絕大多數(shù)成熟的競技項目,10倍的訓練量(職業(yè)和核心業(yè)余玩家的差距)往往就意味著萬無一失的天塹。

圖1 勝率同實力差和對局數(shù)的關系,Meaning

對于水平接近的麻將玩家,1000戰(zhàn)是令人絕望的數(shù)字,在同桌率奇高的鳳凰桌東風戰(zhàn)中,只有兩位玩家互相達到了1000次同臺競技[4]。因此,日麻絕不是高競技性項目,它在一系列誤打誤撞的、不徹底的改革中,偶然得到了相較其他規(guī)則稍多的技術細節(jié),但它依然沒有脫離麻雀本身的特質——比起競技,它和賭博有著更天然的親合。

但良好的項目需要客觀地描述玩家的差距。若是完全放棄客觀標準,倒向主觀評價,我們不難預見,任意玩家都可以借口“我打得根本不差”,“你是惡意攻擊”來拒絕他人評價,從而導致無序的環(huán)境,導致新人難以進入,導致玩家難以自我定位而喪失成就感,最終失去競技化的可能。事實上,百多年來大家就是這么稀里糊涂過的。而如果玩家們不想再打回百多年來的賭博麻將,如果不想麻將止步于休閑娛樂,就必須解決評價問題。對此,網(wǎng)絡麻將(以下網(wǎng)麻)給出了解決方案。

2.段位制

讓所有玩家互相對局100戰(zhàn)顯然是不現(xiàn)實的。但網(wǎng)麻創(chuàng)造了隨機的匹配,可以認為每個玩家在某一時期某一平臺某一級別的房間遭遇的對手,其平均實力是相同的。如此便有了共同的參照。各平臺皆以此為基礎搭建了晉級制度。我們以其中最成功的天鳳為例探討。

天鳳的晉級制度,可以稱為段位-等級分雙軌制。等差增加的4位pt懲罰使升段的難度逐漸增加,圖2[5]展示了老一輩研究者“我打麻將”模擬的,七段實力者(順位分布為4個0.25)在鳳南從七段1400pt開始,對局n戰(zhàn)后最高曾到達過x段的頻率??梢钥吹?,在10000戰(zhàn)(絕大多數(shù)人整個游戲生涯都無法達成)以下,到達過九段的機會不小,而到達十段的可能則小于10%。也就是說,以一般人的對局數(shù)來說,達到超出自己實力3段的段位是很難的。一位到達過七段的玩家至少可以很有信心地說,我比只到過四段的人強。這也就是平時大家說的波動2段的含義。七段和四段的差距雖然巨大,但至少,在一定程度上評價實力成為了可能。值得注意的是,如果某玩家能像第一行那樣,在100戰(zhàn)之內(nèi)到達八段,那他真實實力也九成高于七段。所以和我們的一般印象稍有不同,有些時候評價實力并不需要長期對局——當然,這種情況總是少見的。

圖2 七段實力者鳳南n戰(zhàn)到達過x段的頻率表,我打麻將

“最高到達段”的弊端在于沒有細節(jié),無法處理對局數(shù)累積而產(chǎn)生的影響。100戰(zhàn)之內(nèi)升到八段的玩家如果此后1000戰(zhàn)一落千丈,我們將不得不重新審視他的實力,但此時“最高到達段”這一標準已經(jīng)不再合適。同時,隨著對局數(shù)增加,到達任何段位的概率都會增加,2000戰(zhàn)到達過九段的頻率是1000戰(zhàn)的2倍有余,但通常我們并不能比較它們的強弱,因為不知道升九前后的具體情況。這樣一來,“最高到達段”的區(qū)分度就降低了。

等級分制減緩了對局數(shù)累積的影響。如圖2展示的那樣,升段越快,實力強的可能性就越大。而等級分公式?jīng)Q定了若升段耗費的對局數(shù)過多,就很有可能達不到高級場的準入標準。即結果上,等級分門檻擋住了實力強的可能性不大的玩家。有趣的是,上述“最高到達段”的標準,完全可以替換為“最高到達R”,因為等級分自帶補正,相當于段位制的負和,卻又比段位制連續(xù)。從這個意義上講,段位制反而很冗余。但減緩影響不能本質上解決對局數(shù)累積的問題,“最高到達R”同樣不反映細節(jié)。此外,由于等級分低于1500的帳號離開游戲的概率很高,等級分實際上一直處于通脹之中。如今的天鳳的平均R相較十年前上升了大約25R,特鳳之間的2000R門檻形同虛設,只有上特之間的1800R門檻還在發(fā)揮一定作用。而鳳桌之后又不在有新的門檻,所以等級分對最受關心的鳳桌玩家的實力區(qū)分無甚幫助。

如此,我們可以認識到,段位制并不必須。事實上,先于天鳳的高水平網(wǎng)麻平臺《東風莊》便不設段位,只設等級分。天鳳的等級分公式只是對東風莊的微調(diào)[6],段位-等級分雙軌制亦非劃時代的構想。天鳳鳳凰桌成為網(wǎng)麻最高水平平臺不是因為段位pt設計得多好,而只是因為最高水平的玩家群選擇了它。面對這個為賭博而生的、先天不足的游戲,段位制搞得再巧妙也玩不出花。

但人們還是玩出了一些花花。

3.安定段位

2011年8月,天鳳的月間排名中悄無聲息地上線了一個新項目:段位效率。彼時坊間已有不少計算安定段位(以下安定段)的小工具,這是對它們的認可,也是玩家們的選擇。天鳳采取“段位效率”一名是因為月間的戰(zhàn)績并不“安定”,而要讓安定段安定下來,就需要大量的對局數(shù),這就恰好解決了段位制無法處理的對局數(shù)累積的問題。這也就是平時大家說的對戰(zhàn)數(shù)重視的含義。由于網(wǎng)麻可以低成本記錄全部對局,這回玩家們終于可以直觀地看到對局數(shù)是如何暴力地收斂成績的了。

圖3 安定段位的收斂,うたたねこ

圖3[7]為安定段的置信區(qū)間隨對局數(shù)的變化,橫坐標為對局數(shù),縱坐標為安定段,三組折線由外至內(nèi)分別為99%、90%、80%的置信區(qū)間。可以看出,對局數(shù)少時,安定段變動激烈,不能評價實力,大約到500戰(zhàn)后,安定段才比段位本身更“安定”。實用地說,700戰(zhàn)安定段高2則95%更強,3000戰(zhàn)安定段高1則95%更強,平時可以以這兩個數(shù)字為節(jié)點。3000戰(zhàn),還是絕大部分核心玩家能達到的對局數(shù)。大約10000戰(zhàn)以后,99%的置信區(qū)間也會收斂到±0.5段之內(nèi),但這已經(jīng)超出常人的領域了。借助安定段,我們能夠評價出1段的實力差,對于麻將這個運氣游戲來說已經(jīng)是階段性勝利了。同段位制一樣,安定段在不同平臺的規(guī)則下也可以替換為安定R、平均順位等指標而同樣生效。

當然,沒有能評價一切的標準。安定段常因不能反映當前實力而受詬病。但其實沒有哪個項目的積分系統(tǒng)能反映當前實力,積分只能參照選手的過往成績,而無法考慮近期的進步、傷病等因素。麻將不能反映當前實力比其他項目看上去更嚴重,在于成熟的項目的最大榮譽,永遠 是冠軍,而不是虛無縹緲的積分或著排名——那是實在沒成績才會吹的東西。但麻將必須依靠長期對局,比賽冠軍才是虛名——這是麻將的運氣成分決定的,任何指標也無能為力。

有時候,我們會篩選一個區(qū)間內(nèi)的對局來看安定段,但這其實很危險。圖4是鳳桌某玩家從第5000戰(zhàn)起的“近5000戰(zhàn)安定段”的變化,橫坐標為對局數(shù),縱坐標為近5000戰(zhàn)的區(qū)間安定段。他的0~5000的安定段為7.7,5000~10000戰(zhàn)的區(qū)間內(nèi)彪升到8.8。但如果我們草率地判定,在5000~10000戰(zhàn)的區(qū)間時,他的實力進步了一段,就不得不同樣地假設在10000~15000戰(zhàn),他的實力退步了2段,而此后的15000戰(zhàn)內(nèi),他竟然又進步了2段重回巔峰,但又又又退步了2段再入谷底。這顯然是滑稽的??墒菆D3已經(jīng)告訴我們5000戰(zhàn)的安定段已經(jīng)能90%收斂在±0.5段內(nèi),怎么圖4里又連著好幾次2段2段地波動呢?

圖4

其實冷靜觀察,易見大部分數(shù)字確實分布在7.8±0.5段之內(nèi),超出此區(qū)間的節(jié)點占16%,基本符合圖3。但如果隨心所欲地選取區(qū)間,那打了35000戰(zhàn)就有30000次機會,哪怕是超脫于99.9%的置信區(qū)間的數(shù)字,也是信手拈來。即使不人為篩選,只是每隔n戰(zhàn)這樣劃分,那劃上五、六個區(qū)間,也有可觀機率抽到5%級別的波動了。像這樣篩選安定段的方法,比起篩出所有top說“我安定inf.”,高明得有限。圖5是這位玩家700戰(zhàn)起的累計安定段變化,每個數(shù)字都是截止當前對局數(shù)的總安定段。可以看到5000戰(zhàn)后變化就趨于平緩,10000戰(zhàn)后甚至幾乎不曾跳脫出±0.1段。圖4中的那些山巒丘壑,在圖5中如同萎縮得像蝦爬。不篩選地查看總體安定段,是利用安定段數(shù)據(jù)的正確方法。這也是不建議頻繁換號的原因之一,因為換號會不可避免地產(chǎn)生劃分區(qū)間的節(jié)點,增添了查看總體安定段的麻煩[8]。

圖5

進一步地,我們也能夠發(fā)覺所謂的當前實力很難偏離總體安定段太遠。安定段本就是高水平玩家才需要關注的信息,而對高水平玩家來說,提高本就是緩慢的,如果對局是連續(xù)的,那進步已經(jīng)一點一滴地融入在了每一次對局之中。高水平玩家不可能靠看了點戰(zhàn)術書或著做了點靜態(tài)何切實力就一夜爆漲。即便有所領悟也需要連續(xù)的安定段來佐證,更不要說不在高級場強化領悟,而放任它在低級場生銹是多么暴殄天物。除非在某個節(jié)點轉戰(zhàn)其他平臺打幾千戰(zhàn)取得進步后回歸,我們無需截然地分割戰(zhàn)績。

就天鳳平臺而言,安定段還有一些小問題。段位制的pt設計,導致每一段上的最佳pt策略會有微小的差異,而在超出單場的更大尺度上,又有故意掉段等策略。玩家們對此各有選擇,安定段無法顧及。但即使如此,高級場長期安定段依然是現(xiàn)行最具效力的評價標準。

然而,實力的本質在于技術細節(jié),講實力而一字不提具體技術,是不是忽略了房間里的大象?

4.牌局內(nèi)容

看一個人實力如何,難道不是看了他的對局就能了解了嗎?是,也不是。實力差距過大時,強者可以輕而易舉地指出弱者的漏洞,因為有些選擇之間的差距巨大,運氣成分可以迅速收斂,幾局就可以體感出來。同時統(tǒng)計研究給了我們一些理論,可以客觀地判定對錯,指導弱者快速進步。但頂尖玩家在復雜局面下的分歧,卻難以頻繁出現(xiàn),51:49的微差選擇,可能打到升天鳳位,反而是后者表現(xiàn)更佳。同時現(xiàn)有理論對此也無能為力,因為現(xiàn)有理論只是在解釋頂尖玩家早已玩爛的技術,而不能教授他們新的技術。有副露率50%的十段,也有副露率20%的十段,很多局面下的最優(yōu)解不唯一,天鳳位的牌風差異也極大,誰也無法成為標準參照,運氣因素產(chǎn)生的噪音會立刻淹沒細微的技術差異。這也就是說,失去理論的客觀標準后,弱者無法判斷強者間的強弱。假設甲只通過看牌譜,能判斷甲乙丙三人實力為甲<乙<丙。但能做出這個判斷,說明甲的體系可以正確定量評價丙和乙在所有技術環(huán)節(jié)上的優(yōu)劣(由于加權不同,僅僅定性是不行的)。然而如果可以正確定量評價,則甲的體系必然優(yōu)于乙和丙,甲<乙<丙不成立。即如果確實甲的實力劣于乙和丙,則甲不能正確判斷三人間的實力排序。而我們平時能感覺出誰比我強,正是因為我們不能完全隔絕理論帶來的客觀標準,我們總是或多或少知道自己哪里打得不好。

同時,在分析相近實力的玩家時,牌譜本身丟失的信息不可忽略。現(xiàn)有的網(wǎng)麻平臺均無法做到保留實戰(zhàn)的卡頓、偽卡頓、思考時間等信息。一旦這些信息影響到做牌思路,那整局牌的十幾次操作都要受波及而評價不準。即,牌譜本身有誤差,測不準小于刻度的差距。

綜上兩點,評價實力必須要借助客觀標準。這個標準可以是段位、安定段、可以是理論,也可以是麻將之神。假如存在“正確每一打”的麻將之神,那么它確實可以居高臨下地給所有人排名(但也得收集齊牌譜信息)。 當然,絕對的正確只能是信仰,比較可能的現(xiàn)實的出現(xiàn)遠超人類實力的AI。可惜的是,目前的日麻AI還遠遠達不到頂尖人類的水平[9],而麻將也不怎么受業(yè)界關注,難以期待此后幾年AI有大進步。但至少這是個念想,就在最近,Naga在天鳳推出了牌譜分析報告業(yè)務,以其目前的實力來說,對特上以下的玩家非常實用,新人們又多了一條快速提升的路徑。

至此,我們梳理了網(wǎng)麻中評價實力的意義,評價實力的客觀方法及必須采用客觀方法的原因。但越是梳理清晰,我們就越不得不接受麻將是運氣游戲的事實,不得不接受很可能整個游戲生涯也無法和差1段的人真正分清強弱。這樣的游戲無法真正競技化,除非它有魄力走進唯一的窄門——

5.復式麻將

日麻并不欠缺技術細節(jié)。訓練一個鳳凰,理論加實戰(zhàn)怎么也得1000小時。相對于每局的配牌摸牌,技術細節(jié)能改變的東西少得可憐。試想哪怕是百米跑這樣的純實力項目,如果隨機分配起跑位置,那我也能和博爾特三七開。麻將的配牌摸牌甚之數(shù)倍,而復式恰恰能幫我們砍掉這兩個最大的運氣要素。復式的概念來自橋牌,原則上,它允許無限多玩家在不同桌打同一副牌,配牌和摸牌都相同,玩家不與同桌的對手比較,而與其他桌同風位的玩家比較。如此,則牌山在一局內(nèi)對某家的青睞完全化為烏有——全都和,相當于全都沒有和。當然,不完全信息博弈的本質無法更改,好形還是有1/3可能輸給愚形,但復式的實力收斂會極其迅速,因為日麻每局有可觀的決策次數(shù),每次決策也通常涉及多個技術細節(jié)。反之,比如飛行棋之類技術細節(jié)少的項目,做成復式也改變得有限。不妨做如下思想實驗:假設有甲乙兩位玩家,甲單戰(zhàn)和乙的不同操作,不影響結果的概率是90%,帶來更好結果的概率是7%,帶來更差結果的概率是3%(這大致相當于1段位差),這樣單戰(zhàn)勝計1分平計0分,比賽10戰(zhàn),則平:勝:負的比例大約為43:42:15。哪怕平局后抽簽決勝,那高1段的玩家3次里也能贏2次。參考圖1,按傳統(tǒng)賽制,這需要200戰(zhàn)。10戰(zhàn)已經(jīng)是賽會制比賽決賽能承受的對局量,比賽的含金量上升,離競技化的路就近了一程。比賽100戰(zhàn),則平:勝:負的比例大約為6:87:7,高1段已經(jīng)十拿九穩(wěn)。而按傳統(tǒng)賽制,這需要2000戰(zhàn)。相對地,復式2000戰(zhàn)已經(jīng)足以區(qū)分0.01段級別的差距。復式至少能加快收斂速率20倍,假如仔細打磨賽制細節(jié),收斂得還會更快。

復式麻將在國標麻將中已有應用,世界麻將運動會曾采用此賽制,甚至有同桌的他家全是AI的比賽,連對手造成的偶然因素都抹平了。天鳳也曾做過線上測試。復式在技術上沒有難度,本場之類的要素不關乎日麻的基礎,若在線下不易實現(xiàn),大可砍去。復式面臨的最大阻力不在技術,而在整個社會的慣性,也在組織者和愛好者的心里。但這就是另一個故事了。

6.結語

本文做了一些瑣碎的整理,沒有什么創(chuàng)新,我也沒有統(tǒng)計相關的研究能力。文中內(nèi)容多為高水平玩家的共識,只是平常的討論模式難以系統(tǒng)性地介紹,致使部分新人對各種指標的理解產(chǎn)生了偏差。只是休閑娛樂的話,那本文毫無意義,因為提高競技性不是麻將的主旋律,也不是唯一正確的麻將觀。但想要提高技術,希望麻將變得更加競技的玩家們,可以參考本文,樹立正確的實力觀。


[1]https://results.ittf.link/index.php?option=com_fabrik&view=details&formid=99&rowid=105649&Itemid=266

[2]終局時順位在上者勝。

[3]出自Meaning博客,原文已刪除。

[4]當然,如果在鳳東打數(shù)千戰(zhàn),幾百個對手里總能和兩三個打出足以區(qū)分強弱的戰(zhàn)績。比如100戰(zhàn)60勝,已經(jīng)在95%的置信水平上顯著——但這微不足道的福利也只限于鳳東了。

[5]http://blog.livedoor.jp/wo_da_majiang/archives/52148692.html

[6]東風莊等級分公式:局變動R=((他家平均R-自家R)/60+(2.5-順位)*20)*補正數(shù),天鳳等級分公式:變動R=((桌平均R-自家R)/40+(2.5-順位)*20)*補正數(shù),補正方案相同。

[7]http://blog.livedoor.jp/utatanecat/archives/4285607.html

[8]要注意的是,不同場的安定段最好不要合并著看。同一玩家,不考慮是否擅長,在不同場的理論安定段不同。般上特鳳的安定段公式不同,理論上高級場的安定段高于低級場(否則高級場就沒人打了)。而由于小局數(shù)少,東風較半莊離散程度小,同水平則在東風安定段會更靠近零和段位,并且離零和段位越遠,影響越大。比如鳳南安定6段,在鳳東也許可以安定6.3段,在鳳南安定9段,在鳳東也許只能安定8.5段。

[9]Suphx和Naga雖然都達到了安定8段以上,但AI的實戰(zhàn)水平基本等于理論水平,而人會在要求快速思考的網(wǎng)麻中因體系內(nèi)的失誤打丟至少一個安定段,并且安定越高,受失誤的影響越大。即,AI的理論水平至多不過是鳳桌平均水平。


網(wǎng)絡麻將實力的評價方法的評論 (共 條)

分享到微博請遵守國家法律
南阳市| 甘德县| 彭山县| 镇江市| 克什克腾旗| 高台县| 四子王旗| 辛集市| 成安县| 西青区| 澜沧| 江口县| 桃江县| 齐河县| 临泉县| 治县。| 全南县| 鹤峰县| 惠安县| 泰安市| 乌拉特中旗| 彩票| 大新县| 淮阳县| 泰来县| 托克托县| 平安县| 曲阜市| 芜湖市| 阿坝| 沂水县| 安乡县| 忻城县| 蕲春县| 满城县| 咸宁市| 远安县| 陇南市| 乐清市| 邮箱| 苍南县|