純能量的NAGA學(xué)習(xí)心得(下)
二、萬(wàn)物至簡(jiǎn),返璞歸真——NAGA的行牌
如果讓我用一個(gè)詞去評(píng)價(jià)NAGA的行牌,我會(huì)說(shuō):“樸素”。這里的“樸素”,擁有三個(gè)含義。
第一個(gè)含義是,面對(duì)一些極為普遍的情況,NAGA做出的選擇基本和一個(gè)擁有完備日麻世界觀(換個(gè)說(shuō)法,能安定在鳳桌七段)的雀士相同,基本和大部分情況下數(shù)據(jù)和統(tǒng)計(jì)學(xué)顯示的規(guī)律一致。比如,全好形平斷的副露巡目,面對(duì)先制立直的進(jìn)攻與防守等等。
第二個(gè)含義是,NAGA的行牌包含有某種可以總結(jié)的普遍規(guī)律,在面對(duì)相同或相似情況時(shí),NAGA總能給出相近的答案,這也是我們學(xué)習(xí)NAGA打牌的基礎(chǔ)。
第三個(gè)含義是,NAGA不善奇技淫巧。說(shuō)的就是諸如一點(diǎn)讀等類似情況。在這個(gè)層面上講,我認(rèn)為“樸素”是一種貶義詞。就如我曾說(shuō)過(guò)的那般:“如果’樸素‘’阻礙了進(jìn)步,那么它就應(yīng)該被拋棄”。但令人頭疼的是其中處于某些中間地帶的問(wèn)題,沒(méi)有證據(jù)證明究竟AI的樸素是正確的還是錯(cuò)誤的,這無(wú)疑是最令A(yù)I學(xué)習(xí)者頭疼的情況。

我認(rèn)為,作為一個(gè)AI學(xué)習(xí)者,面對(duì)各種高端技巧的運(yùn)用時(shí),最為合理的做法是站在比AI更高的思維層級(jí)上,即“我知道這個(gè)何切NAGA會(huì)這么打,以及他這么打的原因,但是我出于這樣的原因選擇其它的打法?!保ㄗⅲ哼@里的高端技巧應(yīng)當(dāng)?shù)拇_是某種高端技巧,而非攻守判斷等等之類簡(jiǎn)單的問(wèn)題,或“牌風(fēng)”之類的理由。)

比如上文的何切圖片,不加思索地通通PASS,處于最低的思維層級(jí);知曉這里存在碰的打法,屬于更高的思維層級(jí)。知曉這樣的打法并能根據(jù)實(shí)際情況決定使用或不使用,以及使用或不使用這樣打法的原因,處于最高的層級(jí)。
這里辨析一下在NAGA學(xué)習(xí)中存在的幾種觀點(diǎn):

(1)不從結(jié)果中分析出原因的話就沒(méi)有意義?
其實(shí)我覺(jué)得,這句話包含了一些更深刻的哲學(xué)討論,這里篇幅太小不便展開(kāi)。我認(rèn)為,這句話是不完全正確的。倘若能以人腦分析出AI選擇的緣由固然對(duì)學(xué)習(xí)極為有益,但這并不意味著不分析原因的學(xué)習(xí)就沒(méi)有意義。我對(duì)這一觀點(diǎn)的看法如下:
第一,麻將不是論文答辯,只看行牌不問(wèn)緣由。
試想以下的情形,一個(gè)立直NOMI從來(lái)不立直的雀士,在學(xué)習(xí)NAGA后發(fā)現(xiàn)它大部分情況都會(huì)立直,雖然不理解NAGA這么做的原因,但他還是這么去學(xué)了。那么能說(shuō)這位雀士的學(xué)習(xí)是沒(méi)有意義的嗎?很多新人在打牌時(shí)根本沒(méi)有理由,或者是基于錯(cuò)誤的理由在打牌,而正確的解釋又過(guò)于復(fù)雜,短時(shí)間內(nèi)難以理解,這種情況下先設(shè)立一個(gè)正確的公式總是有益的。畢竟學(xué)習(xí)的最終目標(biāo)是切出正確的每一打。
第二,某些場(chǎng)況是簡(jiǎn)單的,對(duì)應(yīng)是清晰的,詳細(xì)的解釋是復(fù)雜的,那么不必苛責(zé)原因。
比如,第一枚役牌碰不碰,NAGA90%的情況都會(huì)碰,若要分析原因大抵就是“局收支高”了,但究竟為啥直接碰第一枚的局收支更高?這個(gè)問(wèn)題對(duì)人類來(lái)講就很不直觀了。但我們可以分析出幾個(gè)簡(jiǎn)單的不碰情況,除此之外就通通碰,這在大部分情況下都是正確的一打,這顯然對(duì)水平的提升是有益的。換言之,簡(jiǎn)單情況學(xué)“形”。
第三,反之,如果場(chǎng)況是復(fù)雜的,對(duì)應(yīng)是模糊的,那么我們應(yīng)當(dāng)理解其后的原因。
在這種情況下,總結(jié)幾個(gè)簡(jiǎn)單的公式并不能幫我們找到正確的每一打,它往往由多種因素相互影響而決定。我們既沒(méi)有能力也沒(méi)有必要從“形”上去模仿,而是要綜合運(yùn)用牌桌上已有的信息,根據(jù)我們的所學(xué)綜合做出判斷,再根據(jù)NAGA的結(jié)果進(jìn)行修正。
(2)重視A級(jí)失誤?
這話沒(méi)錯(cuò),但要是變成“只重視A級(jí)失誤”我覺(jué)得就是很不可取的。我認(rèn)為,將錯(cuò)誤“分門別類”劃分等級(jí),本身就已經(jīng)比修正這些錯(cuò)誤更加耗費(fèi)精力了。實(shí)際上,NAGA給出許多非A級(jí)失誤都可以通過(guò)總結(jié)幾個(gè)公式,學(xué)“形”來(lái)解決(比如幺九手順),不用耗費(fèi)腦力深入分析。更何況,100點(diǎn)的局收支差雖然只是1000點(diǎn)的十分之一,但也是差別不是么?并且,這些問(wèn)題實(shí)際上很多都是某些差別雖然小但十分穩(wěn)定的類型,只要打?qū)湍芊€(wěn)定獲得局收支,何樂(lè)而不學(xué)呢?

(3)AI不懼怕面對(duì)困難的處境
我的看法是,當(dāng)你的水平達(dá)到一定的高度,當(dāng)你不再能簡(jiǎn)單地憑借牌效和判斷的優(yōu)勢(shì)碾壓同桌對(duì)手時(shí),是什么能讓你更進(jìn)一步地前進(jìn)呢?實(shí)際上,當(dāng)你的提升遇到瓶頸,若你想要更進(jìn)一步,你必須要學(xué)會(huì)面對(duì)并處理好這些困難的處境。
下面我將具體地就NAGA的打牌特點(diǎn)進(jìn)行分析。
1.聚沙成塔,水滴石穿——牌效
可以說(shuō),牌效是在學(xué)習(xí)NAGA中最好學(xué)習(xí)的部分,也是對(duì)初學(xué)者來(lái)說(shuō)提升最大的部分,某知名雀士曾說(shuō):"學(xué)好NAGA的序盤牌效,水平能提升兩段?!庇纱丝梢?jiàn),學(xué)習(xí)NAGA的牌效對(duì)于初學(xué)者來(lái)說(shuō)耗費(fèi)小,收益高,是值得首先攻克的部分。由于NAGA“樸素”的特點(diǎn),因此其牌效實(shí)際上和現(xiàn)存的牌效體系差別很小,學(xué)習(xí)者只需要在自身體系上小幅度修改即可。
并且牌效部分剛好是“場(chǎng)況是簡(jiǎn)單的,對(duì)應(yīng)是清晰的”內(nèi)容,簡(jiǎn)單總結(jié)幾個(gè)公式即可做到嚴(yán)謹(jǐn)?shù)男虮P手順。我認(rèn)為,序盤牌效學(xué)習(xí)真正的難點(diǎn)在于能否在實(shí)戰(zhàn)中精益求精,不出差錯(cuò),形成肌肉記憶和條件反射。倘若理論學(xué)會(huì)了,在實(shí)戰(zhàn)中卻馬馬虎虎,那學(xué)習(xí)效果的效果自然約等于零。

一般而言,在討論序盤牌效前,我們必須討論行牌的思路和手牌的類型。行牌的思路相當(dāng)于本局的戰(zhàn)略方向,主要的考慮因素?zé)o外乎“大”和“快”。有沒(méi)有哪種路線可以將打點(diǎn)提升到滿貫?有沒(méi)有機(jī)會(huì)可以迅速提升手牌速度,拿下這一局?除去少部分極端場(chǎng)況,我們不會(huì)把“安”在一開(kāi)始就納入戰(zhàn)略的考慮中。不同類型的手牌,其牌效也是不同的。
針對(duì)普通平場(chǎng)而言,一般我們優(yōu)先考慮能達(dá)到滿貫的路線,若沒(méi)有路線能達(dá)到滿貫,再考慮速度最快的路線。
決定了做牌的方向,手牌的類型也就決定了。一般而言,手牌的類型分為4類:
1:面子手;2:變則手;3:半變則手;4:特殊和牌形與其兼顧形狀
面子手,指按照做牌方向前進(jìn)時(shí),嚴(yán)格按照基本的牌效前進(jìn)的手牌。比較典型的例子是以好形立直、役牌為目標(biāo)前進(jìn)的手牌。
變則手,指按照做牌方向前進(jìn)時(shí),必然違背基本的牌效,這一般是為了做成達(dá)成滿貫所需的手役,有時(shí)也是因?yàn)樗鍪忠劭梢钥焖俸团?。比如,以?duì)對(duì)和、混一色、帶幺九為目標(biāo)的手牌。
半變則手,指按照做牌方向前進(jìn)時(shí),在手牌的某一部分或某一時(shí)刻,需要違背基本的牌效,而在其它部分和時(shí)刻嚴(yán)格按照牌效前進(jìn)的牌。例如,以三色同順、一氣通貫、小三元等為目標(biāo)的手牌。
特殊和牌形與其兼顧形狀,特殊和牌形的基本牌效與面子手體系完全不兼容,尤其當(dāng)需要兼顧時(shí),需要對(duì)特殊形和一般形的牌效進(jìn)行取舍。包括以七對(duì)、國(guó)士無(wú)雙、流局滿貫為目標(biāo)的手牌。
一般而言,變則手、半變則手的牌效相對(duì)簡(jiǎn)單,相比于牌效更重要的是能否注意到向?qū)?yīng)手役前進(jìn)的路徑。

就面子手而言,當(dāng)搭子未齊的早巡時(shí),切浮牌的普遍規(guī)律如下:(<表示先于后者打出)
一般規(guī)律:客風(fēng)<普通幺九<場(chǎng)風(fēng)(非自風(fēng))<三元<自風(fēng)<弱28 <寶牌浮牌(均未現(xiàn))
客風(fēng)順序:同現(xiàn)枚數(shù),競(jìng)爭(zhēng)家自風(fēng)優(yōu)先打出,平場(chǎng)下家優(yōu)先,上家最后。不同現(xiàn)枚數(shù),優(yōu)先打生張,若渴望和牌且客風(fēng)成對(duì)有牌效,優(yōu)先打現(xiàn)枚數(shù)多的。
幺九順序:同色對(duì)稱先打1。摸對(duì)提升不大的,優(yōu)先打生張。
役牌順序:摸對(duì)有提升的手牌,先打出現(xiàn)枚數(shù)多的,否則(如全好形平和搭子齊全)先打生張。摸對(duì)提升極大的牌,可以后于28打出,但一般不后于37打出(如手牌無(wú)役寶牌3)。現(xiàn)1自風(fēng)一般后于現(xiàn)0場(chǎng)風(fēng),與現(xiàn)0三元微差。
三元順序:發(fā)<白<中,優(yōu)先打摸切的牌。
其內(nèi)在邏輯為:
提升效應(yīng):進(jìn)張后提升最大的牌最后打。
壓制效應(yīng):越容易被別家利用的牌越早打。
留安效應(yīng):留下安全的牌,優(yōu)先留親現(xiàn)。
在早巡,除非提升效應(yīng)差距極小或不存在,否則優(yōu)先考慮提升效應(yīng);除非提升效應(yīng)和壓制效應(yīng)都不存在差距,否則不考慮留安效應(yīng)。
例如,平和全好形缺雀頭的牌形,客風(fēng)成對(duì)的提升比役牌大,因此此時(shí)要先打役牌;
當(dāng)手牌為碰出役牌后全好形,數(shù)牌摸好形的提升不大,不如留生張役牌;
手牌為全好形一向聽(tīng)時(shí),基本沒(méi)有什么能提升質(zhì)量的浮牌,留下安全牌。
手牌五搭齊全,幺九數(shù)牌成搭提升微弱,不如留下更安全的現(xiàn)2客風(fēng)。
以下為幾則案例






隨著巡目推進(jìn),壓制效應(yīng)的重要性急劇下降并迅速消失,留安效應(yīng)的重要性逐步上升。一般而言,針對(duì)普通的手牌,當(dāng)牌局進(jìn)行到7-8巡時(shí),即使手牌仍有改良的余地,也需要開(kāi)始留安。而那種搭子全是愚形、浮牌一堆,無(wú)望迅速和牌的牌形,往往要在3巡時(shí)就開(kāi)始留安了。
已經(jīng)副露的手牌的留安判斷更高,一般在4-5巡便開(kāi)始考慮留安。
根據(jù)現(xiàn)代麻雀最新理論,全好形的平和,保留完全一向聽(tīng)的2378牌保留到8巡,456牌保留到4巡,而如若碰聽(tīng)的機(jī)會(huì)十分重要,則可以始終保留。
針對(duì)單純的打點(diǎn)改良(如寶牌浮牌),一般留至8巡;如果改良除了打點(diǎn)之外還可以提供副露機(jī)會(huì),那么可以一直保留(例如三色)。
有關(guān)鳴牌牌效的部分,放到下一節(jié)主要討論。
序盤牌效千變?nèi)f化,但脫離不了做牌方向和手牌類型的大方向,離不開(kāi)提升效應(yīng)、壓制效應(yīng)、留安效應(yīng)的三原則。隨著巡目推進(jìn),場(chǎng)況更加復(fù)雜,單純的公式也就失去了意義,需要具體情況進(jìn)行具體分析。
考慮優(yōu)秀的數(shù)牌浮牌和較差搭子是否退向的問(wèn)題時(shí),一般遵循以下的規(guī)律:
1:高向聽(tīng)主動(dòng)退向
2:低向聽(tīng)謹(jǐn)慎退向
3:打點(diǎn)有提升堅(jiān)決退向
4:巡目越早越好退向



在考慮較差聽(tīng)牌時(shí)的即立和拒聽(tīng)問(wèn)題時(shí),NAGA基本和數(shù)理麻雀的研究結(jié)果相一致,存在四連形和斷幺時(shí),更傾向于拒聽(tīng),小牌更傾向于拒聽(tīng),早巡更傾向于拒聽(tīng)。


2.因勢(shì)利導(dǎo),奇正相生——速度與打點(diǎn)的抉擇
考慮速度與打點(diǎn)的過(guò)程,實(shí)際上也是決定做牌思路和方向的過(guò)程。我們通常將1-2番認(rèn)為是小牌,3番認(rèn)為是中等牌,滿貫以上認(rèn)為是大牌,并以向聽(tīng)數(shù)和推進(jìn)向聽(tīng)的難度衡量速度。一般有關(guān)速度和打點(diǎn)的問(wèn)題,按類型可分為手役問(wèn)題、寶牌問(wèn)題和副露問(wèn)題,按巡目可分為早、中、晚巡。
早巡是較為重視打點(diǎn)大小的時(shí)期,如果速度本身已經(jīng)夠快,那么可以適當(dāng)減速甚至退向聽(tīng)追求打點(diǎn)。平場(chǎng)副露手早巡平衡速度和打點(diǎn)的大致規(guī)則如下:
1:1-2番的牌,拒聽(tīng)可以提升至少2番的情況,可以拒聽(tīng)。
2:3番的牌通常不再拒聽(tīng)
3:4番滿貫以上,不再損失速度追求打點(diǎn)提升
4:3番好形聽(tīng)牌和4番愚形聽(tīng)牌,如果增加的番數(shù)是因?yàn)槭忠郏⑶衣?tīng)牌強(qiáng)度下降不多,那么可以選擇愚形;如果增加的番數(shù)是因?yàn)閷毰?,那么選擇好形。
5:帶寶牌兩面2番和寶牌雙碰,選擇寶牌雙碰;強(qiáng)于2番的則選擇兩面。












針對(duì)役牌的副露,普遍規(guī)律如下:
1:沒(méi)有特意說(shuō)明不碰的,通通碰,俗稱“能碰就碰”。
2:場(chǎng)況極端情況,例如南四局不放銃不吃四的場(chǎng)面,速度不快的不碰。
3:南場(chǎng)后期的大TOP,速度不快且打點(diǎn)不高的不碰。
4:急需打點(diǎn)的落后四位,需要立直提升打點(diǎn)的不碰。
5:平場(chǎng),好形充足有望立直提升打點(diǎn),碰出后很小的早巡不碰。
6:役牌為唯一雀頭,副露后沒(méi)有滿貫的不碰。
7:搭子欠缺且質(zhì)量極差,浮牌質(zhì)量差的不碰。







針對(duì)后付:普遍規(guī)律如下:
1:一鳴能消除愚形的,開(kāi)始后付;
2:滿貫牌的后付,可以從好形開(kāi)始,但必須保證除役牌對(duì)子外其余均為斷幺牌,可以保留斷幺的退路。
3:不懼怕絞殺。




針對(duì)其它情況的副露,大致規(guī)律為:
1:副露有滿貫就全速前進(jìn);
2:如果不是副露后立刻就能聽(tīng)牌,那么從愚形開(kāi)始副露
3:可以立直可以副露的手牌,副露的時(shí)機(jī)基本符合數(shù)理麻將統(tǒng)計(jì)規(guī)律。
即:愚形基本從早巡就開(kāi)始副露,全好形的斷幺平和,平場(chǎng)副露1番和3番一般等至9巡,副露2番一般至12巡。
3.避其鋒芒,藏器待時(shí)——進(jìn)攻與防守的判斷
很多人覺(jué)得NAGA的攻擊性過(guò)強(qiáng),其實(shí)我覺(jué)得是因?yàn)楫?dāng)前流行的打法攻擊性太弱了。實(shí)際上,在面對(duì)先制立直時(shí),NAGA會(huì)少會(huì)選擇全棄的路線,大部分策略都是"兜牌”,打出相對(duì)不容易放銃的牌,努力向聽(tīng)牌前進(jìn)。而在那些NISI攻守表中對(duì)攻顯著有利的牌,NAGA也是絲毫不懼打出危險(xiǎn)牌進(jìn)攻的。
攻守判斷的原則如下:
1:巡目越早越傾向于對(duì)攻。
2:手牌大于兩向聽(tīng),爛牌,或大于一向聽(tīng)時(shí)有多家對(duì)攻,堅(jiān)決全棄。
3:好形-好形平和D1等優(yōu)秀的一向聽(tīng),進(jìn)攻為主,兼顧防御。
4:1-2向聽(tīng)中等牌力的牌,兜牌迂回。
5:根據(jù)場(chǎng)況、寶牌分布情況修正判斷。





在防守立直時(shí),一般遵循以下原則:如果一家立直,那么在防守時(shí)應(yīng)當(dāng)考慮維持牌形的完整性方便兜牌;如果有人與立直家對(duì)攻,那么完全按照銃率最低的打法行牌。在防守時(shí),NAGA高度重視早外,給予早外很高的平均。

這里介紹一下NAGA面對(duì)立直的絕學(xué):無(wú)役默聽(tīng)對(duì)攻。
A類無(wú)役默聽(tīng)對(duì)攻牌一般有下面幾種特點(diǎn):
1:牌型很爛,不足以立直對(duì)攻;
2:安全牌很少,不足以貫徹安全防守;
3:要打出的牌相對(duì)危險(xiǎn)度不高;
其核心思想與“無(wú)安對(duì)攻”類似,如果防守很快就會(huì)陷入無(wú)牌可打的境地,不如先默聽(tīng),等摸到非常危險(xiǎn)的手牌時(shí)再轉(zhuǎn)而棄和,以期在期間能改良牌形或者直接自摸。

B類無(wú)役默聽(tīng)對(duì)攻牌一般有下面幾種特點(diǎn):
1:牌形很大,即使不立直自摸也相當(dāng)滿意。
2:待牌非常差,在對(duì)攻中勝率極低。
3:除了立直家?guī)缀鯚o(wú)人會(huì)主動(dòng)切出。
其核心思想是用和率換取少輸1000點(diǎn),以及期待后續(xù)變化和改良。

在針對(duì)副露手的進(jìn)攻方面,NAGA保持了一以貫之的進(jìn)攻特性。實(shí)際上,由于副露手的聽(tīng)牌率問(wèn)題,NAGA在對(duì)副露家的進(jìn)攻會(huì)更加激進(jìn),又由于NAGA不善讀牌,所以可能存在過(guò)度進(jìn)攻的傾向,這種現(xiàn)象在針對(duì)染手時(shí)更加顯著。
4.王者之師,陽(yáng)謀當(dāng)?shù)馈x牌與迷彩的末路
這個(gè)部分的內(nèi)容其實(shí)非常簡(jiǎn)單,基本一句話就可以概括:NAGA不會(huì)讀牌與迷彩。
或者說(shuō),NAGA所有能做出的讀牌,都是像5-2立直1高危這樣從大數(shù)據(jù)中有跡可循的內(nèi)容,而邏輯嚴(yán)密地對(duì)他家手牌或待牌進(jìn)行1推測(cè)后決定打法的操作,它是做不出來(lái)的。同時(shí),NAGA的行牌基本是按照全牌效前進(jìn)的,雖然會(huì)在最后的時(shí)刻根據(jù)自己的手順,考慮到榮和率,做出是否立直的決定,但在行牌過(guò)程中是不會(huì)刻意迷彩的。

其實(shí),有關(guān)迷彩最為主要的問(wèn)題是,迷彩提升榮和率的收益,和為了迷彩造成牌效損失時(shí)減少的收益,是否能相抵?大多數(shù)刻意的迷彩,從收益上都是得不償失的,例如騙早外操作。倘若它真的可以帶來(lái)收益,為何迄今為止沒(méi)有任何一個(gè)AI做出類似的刻意騙早外操作呢?像135早早把5打掉騙筋,這是人類可以感受到的損失;而騙早外造成的損失,對(duì)人來(lái)說(shuō)就不那么敏感了;而像這里究竟是先2P還是先4P,從直覺(jué)上來(lái)看人類已經(jīng)很難區(qū)分了。
我們注意到,這里的2P也是擁有推薦度的,也就是說(shuō)NAGA也在一定程度上認(rèn)可2-4的手順??紤]到當(dāng)前的AI只會(huì)給出打牌的純策略,我認(rèn)為,對(duì)于某些情況下的迷彩來(lái)說(shuō),最佳策略可能是以一定的頻率進(jìn)行迷彩操作。
日麻的理論永遠(yuǎn)在發(fā)展,期待今后的新理論能為我們帶來(lái)更多的驚喜吧。