最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

純能量的NAGA學(xué)習(xí)心得(上)

2023-01-27 21:06 作者:純能量  | 我要投稿

一、滄海桑田,萬象更新——人工智能的變革

1997年,深藍(lán)擊敗國(guó)際象棋世界冠軍加里·卡斯帕羅夫;

2016年,AlphaGo擊敗圍棋世界冠軍李世石;

2019年,Pluribus在無限德?lián)淞俗罁魯∪祟愴敿膺x手;

人工智能帶來的變革,開始無可避免地波及到每一個(gè)人類智力運(yùn)動(dòng)的領(lǐng)域,而麻將并非例外。Suphy,NAGA25先后問鼎天鳳十段,akochan,mortal的開源AI看譜服務(wù)引起熱潮,無論是支持還是反對(duì)者,都無可否認(rèn)這樣的一個(gè)事實(shí):人工智能已經(jīng)給麻將帶來了天翻地覆的變化。

作為AI時(shí)代興起的日麻玩家,我希望在此談?wù)勎覍?duì)AI的看法,以及學(xué)習(xí)NAGA的心得與體會(huì)。

1.拋棄意會(huì),格物致知——我對(duì)AI麻將的看法

開門見山地說,我對(duì)于AI的實(shí)力持有肯定態(tài)度,甚至屬于是信任AI麻將的水平和實(shí)力的激進(jìn)派。我時(shí)常會(huì)這么說:“有缺點(diǎn)的AI畢竟是AI,而再完美的人類也不過是人類。”只此一言,就足以說明我對(duì)AI麻將的態(tài)度。

世界觀決定方法論,就我個(gè)人形成的日麻體系而言,有相當(dāng)?shù)牟糠侄际峭ㄟ^學(xué)習(xí)NAGA逐步建立、改良、強(qiáng)化的。我目前的半莊譜,NAGA評(píng)分中位數(shù)大致在91分,而總成績(jī)多在88-95分之間進(jìn)行波動(dòng),可以說,我對(duì)NAGA的理解學(xué)習(xí)已經(jīng)邁入了攻堅(jiān)克難的深水區(qū)。

如果有人問我,學(xué)習(xí)AI打牌,和閱讀各類戰(zhàn)術(shù)書、詢問何切、高段講譜最大的區(qū)別是什么,我的回答是:前者是格物致知,后者是意會(huì)言傳——很顯然,AI不會(huì)告訴你它為何這么打,不會(huì)給你任何的講解。舉個(gè)例子,高段看譜、閱讀戰(zhàn)術(shù)書與何切如同通過老師授課、課本知識(shí)和課后習(xí)題認(rèn)識(shí)牛頓三定律,而AI就像一個(gè)近似光滑的平面和兩個(gè)小球,一切的規(guī)律只能靠自己去領(lǐng)悟,這里沒有現(xiàn)成的知識(shí),學(xué)習(xí)AI的過程就如同物理學(xué)實(shí)驗(yàn),只有一次次的嘗試最終才能總結(jié)出規(guī)律。

有人說:人工智能好是好,但是丟掉了“神韻”。我的回答是,只要你肯定一副圖畫是無數(shù)個(gè)像素點(diǎn)的組合,一盤圍棋是一場(chǎng)完美信息博弈,一局麻將是無數(shù)個(gè)隨機(jī)事件組成的游戲——那么,這里便沒有什么“神韻”,只有“形體”。學(xué)習(xí)AI,從來不是學(xué)什么“AI的神韻”,而是它那么打,那么下,你也跟著這么打,這么下罷了。前幾十年,開局“點(diǎn)三三”還被稱為圍棋中“丑陋的一手”,如今又變成了“AI的深意”,被眾多人學(xué)習(xí)。

柯潔(黑)對(duì)陣AlphaGo(白),短短4個(gè)回合黑棋已經(jīng)下出了兩個(gè)33,這在以前是不可想象的

有人說,AI之所以能點(diǎn)33,是因?yàn)樗淖兞硕ㄊ桨?。?duì)的,但為什么AI之前研究圍棋千百年的人類沒有想到這一小小的變化呢?日麻中難道就沒有這樣的情況嗎?從我學(xué)習(xí)AI的經(jīng)歷來看,這樣的情況不僅有,而且很多——大多都被冠以“牌風(fēng)”、“流派”的名號(hào),甚至被寫入了各種戰(zhàn)術(shù)書中。本質(zhì)上,這些東西都和定式一樣,是人類對(duì)望而興嘆信息集數(shù)目的一種不得已之策略而已,誰又能說這些定式不會(huì)有出錯(cuò)的一天呢?

2.學(xué)而不思,難得存進(jìn)——我學(xué)習(xí)NAGA的方法

世界觀決定方法論,可以說,我學(xué)習(xí)NAGA的原則,全部建立在我對(duì)AI水平激進(jìn)的信任之上:但凡沒有證據(jù)表明NAGA是錯(cuò)誤的地方,我通通認(rèn)為是正確的并加以采納和學(xué)習(xí),所謂“AI的正確推定”。

有人覺得這種屬于是“先射箭再畫靶子”的行為,一個(gè)看似離譜的行為非要替它找個(gè)理由。但是,AI是客觀的,是絕對(duì)中立的,不會(huì)因?yàn)橹饕暯腔蛘吆吻腥耸鞘裁慈章榻绲拇蠹t大熱爭(zhēng)議人物就受到干擾,或者給出不一樣、不明確的答案。與其說是“先射箭再畫靶子”,不如說是“以絕對(duì)的箭為基準(zhǔn)建立一個(gè)體系”。

AI不會(huì)因?yàn)橹饕暯腔蛘吆吻腥耸侨章榻绲拇蠹t大熱的爭(zhēng)議人物就受到影響

當(dāng)然,這里的“絕對(duì)”也是相對(duì)的,隨著NAGA版本的更迭,不同模式的選取之下,同樣的局面也可能會(huì)給出不同的答案。比如說,前些年大火大熱的355m355p11344556s何切,隨著版本更迭,NAGA也給出了許多不同的答案??梢哉f,NAGA現(xiàn)有的體系也肯定也不是最優(yōu)秀的。但是我認(rèn)為,它的確比我更接近最優(yōu)秀的體系,所以排除掉那些顯然錯(cuò)誤的BUG與缺陷選項(xiàng),全盤向NAGA學(xué)習(xí)是有助于水平提高的。

此外,相比于就向人類強(qiáng)者學(xué)習(xí)而言,向AI學(xué)習(xí)擁有時(shí)空和效度的優(yōu)勢(shì)。時(shí)空的優(yōu)勢(shì)無需多提,沒有人類可以隨時(shí)隨地回答何切,提供看譜服務(wù);而效度的優(yōu)勢(shì)如我文章開頭所言:有缺點(diǎn)的AI畢竟是AI,而再完美的人類也不過是人類,人總會(huì)受到各種影響與干擾,無法保證自己的切牌與回答是與自身體系完全契合的,即“隨機(jī)誤差”,這會(huì)強(qiáng)烈干擾對(duì)體系精細(xì)層面的學(xué)習(xí),而AI則沒有這樣的問題。

人類難免發(fā)生看錯(cuò)、算錯(cuò)、數(shù)錯(cuò)等等這樣的情況

正是以上這些原因,使我堅(jiān)定了向NAGA學(xué)習(xí)的戰(zhàn)略,并設(shè)立了“AI的正確推定”法則。

在具體的操作層面,我向AI的學(xué)習(xí)可以細(xì)分為看譜、復(fù)盤、研討、總結(jié)這些部分。

看譜,無需多言,有條件的將自己的所有牌譜上傳進(jìn)行NAGA分析,沒有條件的利用tenhou.net/6 的自定義牌譜編輯功能,將一些有具體疑惑的局面進(jìn)行解析。在遇到困惑的何切時(shí),也采用類似的方法。

復(fù)盤,NAGA會(huì)給出4個(gè)級(jí)別的指標(biāo),用以區(qū)分主視角選擇和NAGA最優(yōu)選擇之間的差距。一般來講,前兩級(jí)的差距可以不用過多關(guān)注,它們大多都是兩可的,但是仍然需要研究NAGA給出的不同選項(xiàng)之間的差別和優(yōu)劣;針對(duì)后兩級(jí)的差距,需要重點(diǎn)關(guān)注,這些差別可能代表著這一打已經(jīng)偏離了AI的打法體系,也可能標(biāo)志著一個(gè)BUG的存在。

這里需要著重強(qiáng)調(diào),有的雀士在使用AI時(shí)往往糾結(jié)“為啥它打A不打B呢?”實(shí)際上,某些微差的何切,本身就是打A打B都可以的,甚至于完美的策略本身可能就是分別給A和B一定的概率打出。這些微差何切,與其去糾結(jié)“為啥不打B”,不如去考慮“為啥能打A”,這樣對(duì)水平的提高才更有幫助。

NAGA的分級(jí)制度也給我回答何切一定的啟發(fā),使用“100%、鐵、兩可、四六開、三七開”等詞語優(yōu)化我的何切回答描述。

4個(gè)級(jí)別的指標(biāo),以及下方的局面編輯

研討,針對(duì)后兩個(gè)級(jí)別的差距,需要分析NAGA選項(xiàng)的優(yōu)勢(shì),自己選項(xiàng)的不足,并將其補(bǔ)充進(jìn)自身的體系內(nèi)。又或者,你發(fā)現(xiàn)了一個(gè)BUG,需要格外關(guān)注此類情況下NAGA存在的問題。倘若自身無法分析,那么還需要進(jìn)一步研討。比如詢問各高段的意見,利用牌譜編輯設(shè)置幾個(gè)不同的類似局面進(jìn)行分析,便于找出規(guī)律,納入體系。實(shí)際上,NAGA的行牌和現(xiàn)有數(shù)據(jù)麻將的理論有相當(dāng)部分都是契合的,少部分不能以現(xiàn)有理論合理解釋的都是少數(shù)具有明顯特點(diǎn)的特殊情況。對(duì)于這些問題,如果我找不出打法上明顯的問題和漏洞,仍然會(huì)選擇去學(xué)習(xí)。

總結(jié),這是最高層次的學(xué)習(xí),是針對(duì)NAGA在某一種或某一類特殊情況下行牌規(guī)律的歸納,是一種由特殊到一般的提煉,它往往需要對(duì)大量相似局面的統(tǒng)一分析才能做出。當(dāng)然,由于NAGA和現(xiàn)行數(shù)據(jù)麻雀體系的高度一致性,所以數(shù)據(jù)麻雀的結(jié)論往往就是NAGA行牌規(guī)律的近似。另外,需要注意的是,總結(jié)必須要分析大量局面才能做出,單一或少量何切的結(jié)果都不能進(jìn)行總結(jié)。第一個(gè)原因是,何切的結(jié)果可能是多種原因?qū)е碌?,通過少量試驗(yàn)將其歸納到單一原因上,未必可靠;第二個(gè)原因是,AI雖然不存在隨機(jī)誤差,但存在系統(tǒng)誤差,比如不同花色數(shù)牌之間的差別,三元牌之間的差別等等,沒有對(duì)比對(duì)照的少量試驗(yàn),很可能將結(jié)論和誤差混淆。(題外話,為何NAGA七對(duì)不再更新了呢?也是因?yàn)樯鲜鰞煞N原因,導(dǎo)致我認(rèn)為結(jié)論未必可靠,并且工作量實(shí)在太大)

因此,我建議,雀士在利用NAGA總結(jié)某種規(guī)律時(shí),應(yīng)該盡可能滿足物理實(shí)驗(yàn)的要求和標(biāo)準(zhǔn),設(shè)置對(duì)照、重復(fù)實(shí)驗(yàn),以保證結(jié)論的可靠性(雖然,這顯然會(huì)大大增加工作量和花費(fèi),因此通過實(shí)戰(zhàn)牌譜學(xué)習(xí)仍然是最優(yōu)的選擇)

3.思而不學(xué),墨守成規(guī)——科學(xué)看待AI的缺點(diǎn)

經(jīng)常有人會(huì)將一張AI給出的離譜何切回答發(fā)到群里,然后群內(nèi)瞬間便充滿了快樂的氣息。我認(rèn)為,以一兩種特殊情況下AI存在的問題,來否認(rèn)其它情況下AI的實(shí)力,是不正確的。正如同我們不會(huì)用點(diǎn)錯(cuò)的一打去評(píng)價(jià)主視角的實(shí)力一樣。(雖然,這可能代表了心態(tài)、注意力等等之類的“軟實(shí)力”)因此,對(duì)AI的思辨與批判不應(yīng)影響對(duì)AI的學(xué)習(xí)

我認(rèn)為,就NAGA而言,其缺點(diǎn)主要包括以下三點(diǎn):BUG,設(shè)計(jì)問題,強(qiáng)邏輯,這是其遠(yuǎn)不如人類的地方,如果一個(gè)何切涉及到了這三個(gè)部分的內(nèi)容,那么可對(duì)NAGA的選擇進(jìn)行取舍,甚至拋棄NAGA的建議。

(1)BUG

有程序的地方就會(huì)有BUG,NAGA作為AI也不例外。NAGA目前仍然具有許多BUG,本文就詳細(xì)地說明一下NAGA目前存在的各類BUG。

I.碰暗刻BUG 置信度:極高 危害性:小(一般人一眼就能看出不合理,不會(huì)有人真的去學(xué))

表現(xiàn):當(dāng)手牌存在一個(gè)暗刻,其它家打出第四張時(shí),NAGA有概率給出極大的“碰”的推薦度。當(dāng)暗刻為役牌時(shí),情況更加明顯。

此圖基本可以100%確定這是一個(gè)BUG

II.綠一色BUG 置信度:極高 危害性:極小

表現(xiàn):NAGA不認(rèn)識(shí)綠一色。

沒有人類會(huì)打錯(cuò)

III.途中流局BUG 置信度:高 危害性:小

表現(xiàn):NAGA似乎沒有途中流局概念。

棒聽即立,速攻速攻!

IV.多種立直/副露選擇BUG 置信度:極高 危害性:極大

表現(xiàn):當(dāng)一副牌同時(shí)存在多種、可選的、擁有推薦度的、立直(或副露)選擇時(shí),NAGA有時(shí)無法給出準(zhǔn)確的立直(或副露)推薦度。?

欸我不立
欸我又立了,你猜我立不立

V.接近流局時(shí)副露/立直判斷BUG 置信度:中 危害性:中

表現(xiàn):當(dāng)剩余枚數(shù)極少時(shí),NAGA的副露/立直判斷可能會(huì)出現(xiàn)極大偏移。

猜猜看,我為啥要吃
當(dāng)然是為了吃打中給親家運(yùn)一次海底啦~

VI.ALL LAST判斷問題BUG 置信度:低 危害性:中

表現(xiàn):NAGA有時(shí)在ALL LAST做出匪夷所思的操作,有時(shí)又和其它BUG發(fā)生雜糅,尚不明確是BUG還是本該如此。

VII.前后一致亂打BUG 置信度:中?危害性:中

表現(xiàn):如果一副牌,主視角在前面開始亂打(比如一直掉線摸切),那么NAGA在此后也會(huì)開始亂打。懷疑這是因?yàn)镹AGA具有保持前后一致性的特點(diǎn)。同樣基于此,NAGA幾乎不會(huì)留立,表現(xiàn)為只要聽牌時(shí)選擇DAMA,只要此后牌型沒有任何變化,立直推薦度都極低。

VIII. 數(shù)據(jù)不準(zhǔn)確BUG 置信度:極高 ?困擾性:高

表現(xiàn):NAGA給出的數(shù)據(jù)(和率,銃率,流局率,橫移動(dòng)率,聽牌確率,每張牌的銃率)在特定的情況下可能與實(shí)際出現(xiàn)較大偏移。

猜猜13種13牌起手的和率是多少

此外,由于此BUG還額外誕生一個(gè)誤解,即NAGA不看手摸切。實(shí)際上,NAGA會(huì)注意到手摸切,此誤解產(chǎn)生的原因是因?yàn)樵贏家打出牌x,B家摸切后,牌x又顯示出對(duì)B家的銃率,(雖然理論上確實(shí)有見逃山越的可能)因此有人認(rèn)為NAGA不看手摸切,這是錯(cuò)誤的。顯示銃率是因?yàn)殂|率本來在特定情況下就不準(zhǔn),而不是NAGA不看手摸切。

IX.立直暗杠BUG 置信度:100%(顯示BUG)低(行牌BUG)?困擾性:高 危害性:中

表現(xiàn):同時(shí)能立直和暗杠的牌,NAGA只會(huì)顯示暗杠推薦度,立直推薦度需要黑科技才能看見。并且,同時(shí)能立直和暗杠的牌,NAGA可能做出一些奇怪的操作,尚不知曉這些操作是BUG還是本該如此。

(2)設(shè)計(jì)問題

AI麻將在設(shè)計(jì)時(shí)沒有考慮一些情況,這導(dǎo)致AI在相關(guān)局面的判斷出現(xiàn)問題。

1:AI不會(huì)讀卡頓,這導(dǎo)致切牌丟失了卡頓信息。

2:部分AI不會(huì)見逃,除了4確和之外通通和。(NAGA根本不提供和牌推薦度)在考慮見逃時(shí),我推薦采用模擬器框架的AI(akochan)進(jìn)行分析。

3:在同時(shí)存在5和紅5時(shí),5和0被視為一樣的牌,NAGA永遠(yuǎn)先打5。(這點(diǎn)在牌譜解析的時(shí)候也能看出來,5和0推薦條是一樣長(zhǎng)的,NAGA始終先打5)在特定情況下,打0會(huì)比打5更好。

4:空切問題。比如,主視角手中有一張7m,此時(shí)又摸到一張7m,NAGA對(duì)手切與摸切7m不加區(qū)分。

5:順位分布問題。按照天鳳段位避四、零和的規(guī)則進(jìn)行訓(xùn)練的NAGA,在面對(duì)不同的規(guī)則和順位分布時(shí),結(jié)論可能出現(xiàn)偏差。

(3)強(qiáng)邏輯

其實(shí),第一部分中的很多BUG,都可以算作是強(qiáng)邏輯的問題。比如,一個(gè)明顯可以錯(cuò)海底的副露,NAGA卻選擇不做,等等。這些何切,人類可以通過嚴(yán)謹(jǐn)?shù)耐评砗瓦\(yùn)算做出顯著有利的選擇,但這對(duì)NAGA卻似乎很難掌握。類似的還有“一點(diǎn)讀”的判斷問題。所謂“讀牌”,大致可分為兩種,一種是統(tǒng)計(jì)學(xué)上的規(guī)律(比如4-2切立直,1危險(xiǎn)度高),這點(diǎn)NAGA的水平不錯(cuò),但另一種讀牌,或者被稱為“一點(diǎn)讀”,基于人類對(duì)牌河的推理和邏輯性分析,NAGA就不太行了。一個(gè)從“一點(diǎn)讀”角度顯著危險(xiǎn),銃率超過50%的牌,NAGA卻可以毫不猶豫地打出去。

我個(gè)人認(rèn)為,這是因?yàn)椤耙稽c(diǎn)讀”往往需要多個(gè)微小的邏輯組成部分,每一個(gè)部分都是彼此分離且相關(guān)性很低的,但當(dāng)他們組合在一起時(shí),卻可以得到一個(gè)邏輯鏈條,形成一個(gè)強(qiáng)結(jié)論。倘若運(yùn)用統(tǒng)計(jì)方法分析,那么這些部分各自容易淹沒在“噪音”之中,找不出與結(jié)論的顯著關(guān)系。比如說,有人打8m——副露家手切8m——8m是“沒有碰的牌”——8m跨筋銃率低,這樣的一個(gè)一點(diǎn)讀,在統(tǒng)計(jì)學(xué)上似乎很難找到統(tǒng)計(jì)的方法和規(guī)律。

這么來看,監(jiān)督學(xué)習(xí)似乎在讀牌方面更加有利,只是我并未研究過蘇菲牌譜,不知道在有“全能先知”指引下的蘇菲,是否對(duì)一點(diǎn)讀有不同的看法。






純能量的NAGA學(xué)習(xí)心得(上)的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
奉化市| 长宁区| 富锦市| 东乡| 葫芦岛市| 金塔县| 伽师县| 扎囊县| 宝应县| 苏尼特左旗| 福泉市| 湘潭市| 磐石市| 桓仁| 新龙县| 正阳县| 铜山县| 宁武县| 温泉县| 临海市| 阳原县| 江安县| 洞头县| 贵州省| 烟台市| 阿克| 磴口县| 宣汉县| 梨树县| 双牌县| 崇礼县| 呼和浩特市| 山阴县| 贺州市| 隆化县| 新化县| 永宁县| 宝山区| 德庆县| 黄大仙区| 东台市|