測評商湯元蘿卜圍棋機器人:“恐龍”塞進家庭機器人

作者/ IT時報記者 孫妍
編輯/ 林斐 孫妍
“什么時候老百姓也能跟AlphaGo這樣的對手對上一盤?”自從七年前那場讓人類恐慌的人機大戰(zhàn)后,老百姓一直在呼喚圍棋AI能走入尋常家庭,但無奈于其所需的龐大算力難題沒有解決。
“什么時候出圍棋機器人?”自從商湯在2022年推出元蘿卜AI下棋機器人象棋版后,圍棋愛好者都在呼喚下一個圍棋機器人。
畢竟圍棋比象棋擁有更廣大的受眾群體。2022年,中國擁有段位證書的棋手大約為200萬,擁有等級證書的棋手大約為600萬,若擴大到整個圍棋愛好者,體量大約是6000—7000萬。近日廣東省的一次調(diào)研發(fā)現(xiàn),若以“參與并下過圍棋,每周3次,參與時間3年以上”作為標準,僅廣東省圍棋人口就達666.61萬。
千呼萬喚始出來,今年6月14日,商湯終于發(fā)布了元蘿卜AI下棋機器人圍棋版(以下簡稱元蘿卜圍棋機器人)?!禝T時報》也在第一時間評測了元蘿卜圍棋機器人,到底比象棋機器人難在哪?商湯又是怎樣把一只吃算力如“恐龍”的圍棋AI塞進了一個桌面機器人中?
01 一位“三位一體”的AI陪練
下圍棋,是一種修行。很多家長讓孩子學習圍棋的初衷并不是想著能走上職業(yè)道路,只是為了修煉孩子的耐心、心態(tài)和修養(yǎng),氣定神閑地思考落子。
比起象棋規(guī)則,圍棋的棋理入門更為簡單,但是棋藝的天花板更高。有了AI幫助,剛?cè)腴T的小白們更能坐得住了。元蘿卜圍棋機器人沒有設(shè)置枯燥的課程,上手就能實操。
圍棋是世界上最復(fù)雜的棋盤游戲之一,商湯和中國棋院合作,設(shè)計了7個級別的AI習題精練,吃子、對殺、死活、手筋練習題一應(yīng)俱全,覆蓋從啟蒙到業(yè)余五段,基本可以實現(xiàn)從入門到精通。
在測試AI習題精練時,《IT時報》記者發(fā)現(xiàn),元蘿卜會充分調(diào)用畫面、語音和機械臂,“三位一體”的體驗就像是一位真人老師在手把手與你下圍棋。如果孩子面對題目無從下手時,元蘿卜會主動介入,柔聲細語地指出:“錯了,應(yīng)該這樣下,下次別忘了吃子”,機械臂進行實操演示,并在屏幕上標識出應(yīng)該怎樣作答,仔細地解析錯誤的原因。
打開“元蘿卜AI下棋機器人”App,還能看到每一盤的對弈結(jié)果和復(fù)盤分析,家長可以對孩子的學習進度一目了然,學員也可以查漏補缺、總結(jié)得失。

AI習題精練覆蓋了業(yè)余五段以下的級別,但高段位的棋手每天也會通過習題練習來保持狀態(tài),就像小說中武林高手都要閉關(guān)修煉先人流傳下來的武功秘籍,通過拆解高手的定式和套路,來提高自己的棋藝。如果元蘿卜能在大師版中加入高手棋局的打譜,就能更好地擴充用戶群體。
02 一位實力相當?shù)膶κ?/span>
古人形容,棋逢對手是一種伯牙子期般難得的境界。在現(xiàn)實中,要想找到一位棋力相當?shù)膶κ謥韺?,談何容易,而這也正是AI可以解決的難題。
不同棋力水平的學員都能在元蘿卜里找到自己的對手,因為元蘿卜不僅覆蓋了從業(yè)余20級到職業(yè)九段的19路人機對弈,同時也為初學者設(shè)置了9路、13路、19路棋力闖關(guān),更有超越人類職業(yè)九段水平的“巔峰對決”模式。
除了人機對弈外,AI還能幫你匹配真人對手對弈。元蘿卜加入“星球聯(lián)盟”功能,目前已接入“99圍棋”“新博圍棋”“弈客圍棋”等多個知名在線圍棋平臺,覆蓋數(shù)百萬用戶。在家隨時打開元蘿卜,就能在數(shù)百萬棋手中匹配到與你棋力相當?shù)膶κ帧?strong>實測中,在“99圍棋”上匹配對手時,基本能在30秒內(nèi)匹配成功,第一次進入“星球聯(lián)盟”時,需要選擇你的棋力水平是幾級或幾段,如果AI能通過平時的訓練自動判定用戶的棋力水平,體驗感會更好。

連不會下圍棋,只會下五子棋的用戶也能找到對手。在加入“五子棋”這個板塊時,商湯研發(fā)人員可能都沒預(yù)料到,這反倒會成為家庭里打開率最高的對弈游戲,沒有專業(yè)門檻,老少咸宜。很多新用戶都表示,拿到手最先試用的就是五子棋,全家老少輪流出動,特別是當初出茅廬這最簡單的一關(guān)都輸給機器人后,完全被調(diào)動了勝負欲,連下幾十盤停不下來。
“我也要得到一座獎杯!”一旦輸多贏少,孩子會興趣銳減,所以一位實力相當?shù)膶κ趾苡兄?。通過五子棋這一簡單的入門級游戲,沒有任何基礎(chǔ)的低齡兒童也會被潛移默化地影響,培養(yǎng)對圍棋的興趣,對于有老有小的家庭來說,這的確是一個促進智力開發(fā)的、全家人都能玩的游戲。
03 一位平靜真實的“絕世高手”
中國象棋特級大師謝靖在與元蘿卜象棋機器人巔峰對決中,AI機器人獲勝,終了謝靖說道,機器人思考一步棋時間只有幾秒鐘,給人以很大的壓力,機器人還沒有任何情緒的影響,“現(xiàn)實中基本沒有這樣的棋手”。
元蘿卜象棋機器人修煉上億盤,而圍棋機器人訓練的盤數(shù)遠超過象棋機器人。元蘿卜圍棋機器人的“巔峰對決”超過了職業(yè)九段,職業(yè)九段是什么水平?截至目前,中國棋壇共有56位圍棋職業(yè)九段棋手,包括我們熟知的棋圣聶衛(wèi)平、現(xiàn)在中國棋手世界排名最高的柯潔等。
而對家長來說,這是一位不會制造“噪聲”,讓孩子回歸真實對弈的高手。一到暑假,家長都會給孩子尋覓一個新技能,但苦于自己沒時間、不會下或?qū)嵙Σ粔?,讓孩子在學習圍棋的過程中缺乏一位“高手”陪練,孩子也很難漲棋。

如今,在線圍棋平臺選擇多樣,為何商湯還要下功夫研究機械臂,做出一個適合放在家里的真實機器人來做陪練呢?讓孩子從電子屏幕回歸實體棋盤,沉浸在執(zhí)子下棋中,感受對手沒有情緒波動的節(jié)奏和狀態(tài),隔絕廣告、游戲等“噪音”,才能更好地保護視力,提升專注力。
除了課堂上的專業(yè)指導,課余的練習也十分重要。但是,一盤圍棋少則幾十分鐘多則數(shù)小時,長時間在電腦、平板或手機上下棋,很容易“開小差”。而且,日后圍棋考級定段仍要下實體棋子,真實比賽的練習感知與線上圍棋有很大的空間感、節(jié)奏感差異。
04 解構(gòu)桌面上的“恐龍”
如果將元蘿卜AI下棋機器人象棋版比作大象,那么元蘿卜圍棋機器人則是一只恐龍。當年戰(zhàn)勝人類圍棋冠軍的AlphaGo調(diào)用的超算能耗接近人腦的5萬倍,如何把這只吃算力的“恐龍”塞進一臺能放在家庭書桌上的實體機器人中?這是AlphaGo沒有解決的難題。
商湯又是如何讓圍棋AI從科學殿堂走進千千萬萬的普通家庭的,它不需要人類輔助執(zhí)棋,從觀察棋局變化,到推算走棋招數(shù),再到取子落子,全部獨立完成,是一臺既會思考又會行動的AI下棋機器人。
“解構(gòu)”元蘿卜圍棋機器人后發(fā)現(xiàn),從入門的20級到強業(yè)余5段調(diào)用的是本地棋力,元蘿卜內(nèi)置芯片就能處理;而業(yè)余6段到高于職業(yè)九段的巔峰對決調(diào)用的是云端棋力,需要調(diào)用服務(wù)器算力。元蘿卜內(nèi)置了三類場景、若干個引擎,可以根據(jù)不同計算需求,調(diào)用不同的計算資源,大大降低算力成本。
跟象棋機器人不同的是,元蘿卜圍棋機器人的機械臂設(shè)計了轉(zhuǎn)輪吸盤,可以一次從棋碗中取5枚棋子,不需要頻繁取子,黑白棋還可以同時取放。這一難度比象棋機器人高很多,因為圍棋棋子更容易滑動,在棋碗中呈現(xiàn)不規(guī)則排列,但在實測中,元蘿卜取子和落子的操作精準度很高,很少有取子失敗的情況,而且由于取子速度快,即使失敗也不會影響對弈。
商湯不僅把“恐龍”塞進了一個小小的桌面機器人中,還馴服了它,讓它安全地走進家庭,走向世界。
實測中,遇到人的阻擋時,元蘿卜機械臂會立即停下,不會與人對抗,磁吸式取子方式,不會出現(xiàn)夾手的誤傷風險,低齡兒童也可以放心使用。不論是象棋機器人還是圍棋機器人,元蘿卜都是一個手無縛雞之力的、溫柔的機器人,《IT時報》記者甚至拿生雞蛋測試是否會夾手,結(jié)果是雞蛋絲毫沒有裂縫。
對于高手來說,不論身在世界的哪個角落,都需要找到一位隨時能跟自己對弈的對手,于是,商湯還專門設(shè)計了大師版,配備大容量移動電源和拉桿箱,續(xù)航可供3小時不間斷下棋,帶著元蘿卜跑遍世界成為可能。
排版/ 季嘉穎
圖片/ IT時報
來源/《IT時報》公眾號vittimes