網(wǎng)絡麻將數(shù)據(jù)的使用方法
1.引言
華語日麻圈語境下的“科學麻將”出自突擊東北著《科學化麻將》一書,此書的翻譯是通稱《79博客》的一部分。由于《79博客》至今仍是華語圈傳播最廣的日麻教程,“科學麻將”一詞便也隨之深入人心,幾近成為正確打法的代名詞。然而截至2021年出版的日麻書籍中,除了突氏的《科學化麻將》、《新科學化麻將》之外,再無一本標題中含有“科學”一詞——看來在日語語境下,“科學麻將”竟是很邊緣的詞。那么當我們在漢語語境談及“科學麻將”時,究竟談的是什么的科學,以及科學的什么?

2.不科學的科學麻將
《科學化麻將》得稱“科學”的基礎是其使用了大量統(tǒng)計數(shù)據(jù)。巧的是《79博客》的另一部分,《beginner's luck》中,除了一些簡單的枚數(shù)比較,我們很難看到什么數(shù)據(jù)和計算,整部教程依靠的基礎是作者自己的風格和理解,這也是日麻戰(zhàn)術書的常見體例,而通常我們一并稱其為“科學麻將”。但是一旦某種打法依靠的基礎是自己的風格和理解,又不能窮盡所有可能時,它必然不會屬于科學的范疇。就好比圍棋定式,縱然再怎么符合人類的棋理,也不免被AI大規(guī)模淘汰。而AI本身雖然是科學成果,但它們弈出的定式同樣不可能得到嚴格證明,只能回歸名為“棋理”的玄學。
麻將自然也有類似的“牌理[1]”,它是人的感覺,人的經(jīng)驗,人的語言,難以精確,難以證明。以圖1為例,有這樣一條牌理認為,應該先從下家的風牌,即南風開始打起,因為越晚打的牌越容易被碰,而根據(jù)被碰后距離自家下次摸牌的遠近,碰牌家是上家時對自家最有利,是下家時對自家最不利。這條牌理邏輯清晰,推論簡明,這牌又是配牌第一打,完全不涉及其他要素,對人來講極易掌握,極易接受,沒有副作用,不會學歪。但由于各個選擇之間的差距太過微小,手牌距離收益的路又太過漫長,以致于統(tǒng)計數(shù)據(jù)或基于統(tǒng)計的模擬無力處理滔天的波動,難以得出有效的結果。也就是說,這個牌理既無法證明也無法證偽——盡管它看上去有理有據(jù),但本質(zhì)上和薩滿信仰沒什么區(qū)別。

人類一思考,上帝就發(fā)笑。事實上諸如“立3過7”之類的,看上去更加有理有據(jù)的牌理已經(jīng)由統(tǒng)計數(shù)據(jù)推翻了[2]。人總是會有所忽略,而牌友們對麻將又不可能有科研級別的謹慎,這些個人經(jīng)驗總結出的牌理、口訣,哪怕經(jīng)過集體研究,即使當下看著再像回事,也難保不錯得離譜。同時,這些牌理雖然我們學習、接納,照著樣去對局,但這就好像前AI時代人們學圍棋棋理口訣一樣,我們學的永遠是人類模糊的經(jīng)驗,這些經(jīng)驗沒有實驗手段,沒有足夠的證據(jù)支撐,甚至有時候所指不明、適用范圍曖昧。因此,牌理不是通過科學方法得出的理論。
現(xiàn)有統(tǒng)計數(shù)據(jù)的體量也說明了這一點。圖2是《新科學化麻將》的目錄,可以看到除了第1、2節(jié)講的是牌效率的最后階段,先制立直判斷外,剩下的內(nèi)容全部屬于攻守判斷的范疇。《統(tǒng)計學的麻將戰(zhàn)術》的內(nèi)容類似,只多了棄和時的放銃率的內(nèi)容。這些內(nèi)容完全不牽扯具體牌形,全是抽象的模型,不會告訴我們翼形、跳一形,或著圖1那樣的牌怎么打期望高。從這個意義上講,聽牌以前的牌效率,大家打的都是“玄學麻將”[3]。在另一方面,統(tǒng)計數(shù)據(jù)對場況判斷的范疇也幾乎無有涉獵。僅考慮all last的點差組合,也能分出二三十種類別,要把這些搞得像現(xiàn)在的攻守判斷一樣清楚,那至少需要二十倍于圖2的內(nèi)容。可以說,些微的統(tǒng)計數(shù)據(jù)根本撐不起一個基于數(shù)據(jù)的打牌體系,實際上沒有什么“數(shù)據(jù)流”,大家都是“感覺流”。


3.不科學的統(tǒng)計數(shù)據(jù)
統(tǒng)計數(shù)據(jù)雖不全面,但是否能說至少在攻守判斷范疇內(nèi)我們能打“科學麻將”呢?很可惜,從科學的方法論出發(fā),我們難以給出肯定的回答。即使沒有受夠統(tǒng)計學訓練,相信大家也聽說過諸如吃冰激凌導致溺水、美國海軍死亡率低于紐約市民之類的段子,數(shù)據(jù)會騙人,不是把數(shù)字堆在一起排排隊就叫統(tǒng)計學。比數(shù)據(jù)更重要的是合理的解釋,解釋不到位的數(shù)據(jù)比題圖中的金字塔高明的有限。而無論是《統(tǒng)計學的麻將戰(zhàn)術》還是《新科學化麻將》,在這方面雖不至于有意忽略,但也是強調(diào)不足的。再加之翻譯損失的語義,大部分讀者對于這些數(shù)據(jù)都有或多或少的誤解,以至于戰(zhàn)術手段出現(xiàn)偏差。具體來說,現(xiàn)有的統(tǒng)計在方法上存在如下問題。
試做如下思想實驗。玩家群體A先制只立8枚殘兩面1469,統(tǒng)計這個群體的兩面和率得出x翻a巡即立好于默聽;玩家群體B先制什么兩面都立,統(tǒng)計這個群體的兩面和率得出x翻b巡即立好于默聽。易見a>b。也就是保守樣本統(tǒng)計出了激進策略,而激進樣本統(tǒng)計出了保守策略。出現(xiàn)這一現(xiàn)象是因為統(tǒng)計沒有區(qū)分兩面的種類,而只選最好的兩面立直,相當于玩家手動幫統(tǒng)計篩掉了不太好的部分,數(shù)據(jù)自然更激進。如今的數(shù)據(jù)區(qū)分兩面的種類是容易的,但總有些難以篩選的項目,比如“我感覺他慢”、“我感覺他雖然是一副露但聽了”,這些項目很難轉化成精確的篩選條件。
統(tǒng)計學麻將常常被戲稱為通通立麻將,這其中有多大程度是受到鳳凰玩家規(guī)避了一些不利局面,導致統(tǒng)計結果偏激進的影響,值得思考。這些統(tǒng)計沒有給出更細的條件,每位鳳凰的打法又是一個個黑箱,對“不利局面”的判斷也各不相同,即使去篩選,應該采取誰的標準?事實上,上述兩本書中的條件設定本就有頗為隨意之處,對好形、先制、默聽等概念的定義并沒有什么特別合理的依據(jù),書中也缺乏關于采取那種定義的論述,不免有訴諸主觀情感的嫌疑。另一方面,作為讀者我們?nèi)绾闻袛鄷械慕Y論在何時適用?學習者正是因為沒有鳳凰的判斷能力才需要學習,但沒有鳳凰的判斷能力又難以準確使用書中結論,真是進退兩難。當然,鳳凰們也許憑經(jīng)驗可以判斷書中的內(nèi)容至少在方向上大體無誤,上述所謂保守策略的影響不會大到影響大致結論的地步。但一旦憑借經(jīng)驗,就又難免滑向主觀,加之鳳凰的打法本來也受這些統(tǒng)計的薰陶,這下更是有了循環(huán)論證的危險。
如上,我們知道了即使有統(tǒng)計數(shù)據(jù)支撐,“科學麻將”也不那么科學。了解這些問題之后,如果還看愿意相信統(tǒng)計數(shù)據(jù),那這種相信,也只能算是信仰了。褪去了科學光環(huán),我們終于可以來聊聊怎么使用這些數(shù)據(jù)了。

4.數(shù)據(jù)的使用方法
一、注意條件
一如前文提到的,不同作者的統(tǒng)計樣本不同,對好形、先制、默聽等概念的定義不同。使用數(shù)據(jù)之前我們首先要確認的就是他們設定的這些篩選條件,而平時群內(nèi)交流時通常會忽略這一點。更尷尬的是,有時候作者并不會明確寫明所有條件,進一步加大了讀者的誤會。此前就有讀者質(zhì)疑過《統(tǒng)計學的麻將戰(zhàn)術》和《新科學化麻將》中的數(shù)據(jù)不一致,為此突擊東北還專門撰文回答[4]。以先制兩面立直為例,首先《統(tǒng)》的數(shù)據(jù)來源于2015年止的鳳南對局,而《新》的數(shù)據(jù)來源于2017年后的鳳南對局。這兩段時期的總體風格在某些項目上有顯著差異。同時,《新》中的諸多表格中的數(shù)字,并未直接來自上述統(tǒng)計,而是來自基于統(tǒng)計的模擬。其次,《統(tǒng)》中未區(qū)別數(shù)牌種類,而《新》中僅選取了兩面2558為代表;《統(tǒng)》定義先制為他家未立直,而《新》定義先制為他家未立直且未副露;《統(tǒng)》中未考慮一發(fā)、里寶、赤等小項,而《新》考慮到了。以上區(qū)別共同作用,導致《新》中的數(shù)據(jù)顯得比《統(tǒng)》更激進了。類似的不一致在每個項目上都存在,讀者需隨時注意,在實際使用中自己遇到的局面和數(shù)據(jù)中設定的條件有多少出入,偏離了“平均”多少。
二、牢記比較
麻將是選擇的游戲,僅僅知道一種打法的期望是沒法做決策的——即立好,可有沒有更好的呢?有時候選項又不限于兩種——即立比默聽好,可是不是還有更好的呢?以有役愚形立直為例,圖3是《統(tǒng)》給出的即立和默聽的局收支,注意第一行愚形nomi沒有默聽的數(shù)值,因為nomi不存在有役默聽。如此一來,第一行的數(shù)字就失去了比較的對象,我們即使看到這些數(shù)字,也沒法用來決策,因為不知道真的選擇無役默聽時的期望是怎樣的。書中后文也確實提到了比較差的愚形nomi應當選擇默聽,但這只是作者的理解,并未給出數(shù)據(jù)。其余的愚形雖然給出了立直和默聽兩方的數(shù)據(jù),但讀者在實際運用時,切記不要忽略還有諸如默聽等改、直接拒聽等選項,不要看到立直高就選了立直,遺忘了其他可能。有時候,我們要比較的對象不在同一張表上,比如存在多種聽牌選擇時,此時需要查閱復數(shù)表格才能得到參考。

三、警惕局收支
局收支是統(tǒng)計數(shù)據(jù)中最重要的指標。一切攻守判斷比較的就是局收支。通常認為平場各選擇的優(yōu)劣基本同局收支的優(yōu)劣一致。然而在類天鳳規(guī)則中,不說局收支假設的絕對平場,就連相對的平場,從東一局開始就有些崎嶇了。圖4展示了東一0本場子家聽半筋非現(xiàn)物4枚殘坎5追立8000點和有役默聽5200點的各項數(shù)據(jù)的差值(使用nisi作hosimyu4模擬,鳳南七段pt設置)??梢钥吹搅⒅钡木质罩б恢鳖I先到12巡,但pt收支從一開始就不如默聽了。其原因在于天鳳的pt只與順位相關,并且各順位的間距不平均。細看順位分布,能夠發(fā)現(xiàn)立直很大程度只是把2位變成1位,卻把23位變成了4位。如果說在實戰(zhàn)能出現(xiàn)的最平的平場,局收支都要減500點才能應用的話[5],那這個指標的價值還有多少呢?這是需要此后的研究反思的。而在實際使用中,我們又發(fā)現(xiàn)給局收支加多少修正又只能依靠讀者自身的水平,這也說明了統(tǒng)計數(shù)據(jù)終歸只能是輔助。

5.結語
至此,我們指出了人類的經(jīng)驗總結出的牌理不能稱為“科學麻將”,意圖通過統(tǒng)計學方法研究麻將的嘗試也不怎么“科學”。而從學習的角度上講,統(tǒng)計數(shù)據(jù)更像是工具書而非教科書。我們不能完全依靠數(shù)據(jù)構建打法,使用數(shù)據(jù)時要辨明可能導致數(shù)據(jù)和實際情況偏差的原因。而要做到這一點,還是需要不斷實戰(zhàn)與總結。沒有科學手段鋪出捷徑,那就只能靠傳統(tǒng)方法一點一滴打磨。如果說還有什么是科學的,至少,我們應該保持科學的麻將觀,尊敬概率,相信隨機,少談流勢,多講邏輯。
注
[1] 指類比于棋理的牌理,不是天鳳牌理的牌理。
[2] https://t.bilibili.com/569798283076947104
[3] 現(xiàn)在網(wǎng)上有不下三種“一人麻將計算器”類程序能給出高向聽時各選擇的局收支期望,但顧名思義,它們通常不能考慮到副露影向、不同牌的榮和率和存量的不同、他家動向的影響等要素,指導作用有限。
[4] http://hobbyjapan.co.jp/mahjong/explanation.html
[5] 當然,先制和棄和時,局收支和pt收支的不一致沒有這么嚴重。
