AI學(xué)會(huì)了玩《我的世界》,通過(guò)觀看40000小時(shí)的游戲視頻
OpenAI的最新人工智能通過(guò)觀看4萬(wàn)小時(shí)的YouTube視頻學(xué)會(huì)了玩《我的世界》(Minecraft)。
這家專門(mén)從事人工智能的公司開(kāi)發(fā)了一種視頻預(yù)訓(xùn)練(VPT)算法,使其人工智能可以通過(guò)觀看學(xué)習(xí)游戲視頻訓(xùn)練。
與以前創(chuàng)建《Minecraft》游戲AI算法的嘗試不同,OpenAI的在與人類相同的環(huán)境中使用相當(dāng)于使用鼠標(biāo)和鍵盤(pán)進(jìn)行游戲,使這成為AI技術(shù)的一個(gè)巨大飛躍。
開(kāi)箱后,人工智能學(xué)會(huì)了砍樹(shù)、制作木板和建造工藝臺(tái)等動(dòng)作,以及游泳、狩獵、烹飪等。
通過(guò)一些調(diào)整,人工智能最終發(fā)展了它的生產(chǎn)力,并能夠?qū)W習(xí)建造一個(gè)鉆石鎬,這個(gè)技能需要人類玩家花費(fèi)大約20分鐘和24000個(gè)動(dòng)作來(lái)完成。
然而,原始錄像對(duì)人工智能的學(xué)習(xí)是不夠的。這是因?yàn)閮H有視頻顯示了可以做什么,但沒(méi)有顯示如何去做。
因此,承包商記錄并標(biāo)記了基本的Minecraft技能,以創(chuàng)建另一種算法,用鍵盤(pán)和鼠標(biāo)的輸入提示,準(zhǔn)確地注釋了這7萬(wàn)小時(shí)的YouTube錄像。
這使人工智能能夠通過(guò)觀察人類的行動(dòng)來(lái)學(xué)習(xí),而不是測(cè)試隨機(jī)行動(dòng),并利用過(guò)去和未來(lái)的信息預(yù)測(cè)所采取的行動(dòng)。
雖然該團(tuán)隊(duì)只用Minecraft測(cè)試了人工智能,但他們相信游戲的開(kāi)放性和通用的人類交互(鼠標(biāo)和鍵盤(pán))意味著人工智能也可以用于一般的計(jì)算機(jī)使用。