【AI雜談】對(duì)齊、曲別針與影之實(shí)力者
這篇文章算是AI小雜談,不過(guò)剛開(kāi)始想的時(shí)候我有點(diǎn)猶豫是要主講AI呢還是二次元呢,后來(lái)覺(jué)得影實(shí)已經(jīng)寫了很多了,還是來(lái)講AI吧。
是這樣的,中午我突然想到了一個(gè)久違的AI的例子,即曲別針例子。
我們知道,人類是不希望發(fā)生終結(jié)者之類的劇情的,我們希望AI能夠和人類和諧共處,認(rèn)可我們的“價(jià)值觀”,而不希望“邪惡”的AI掌控世界。
由此比較著名的機(jī)器人三原則(當(dāng)然也適用于AI,特別是搭載了AI的機(jī)器人)就出現(xiàn)了,這三原則實(shí)際上是很有問(wèn)題的,當(dāng)然,在我們進(jìn)行邏輯討論之前,就面臨著一個(gè)很大的問(wèn)題,即AI他甚至都做不到理解這三條原則,我們也不能以一種完備地方式寫一堆規(guī)則實(shí)現(xiàn)這三條原則,就不要談后續(xù)的“邏輯游戲”了。
不過(guò)像ChatGPT這樣的大語(yǔ)言模型的出現(xiàn)讓情況稍微有點(diǎn)不同了,雖然我們不能斷言ChatGPT能理解語(yǔ)言,但實(shí)驗(yàn)確實(shí)表明至少大模型能夠突破簡(jiǎn)單的統(tǒng)計(jì)信息、有很多抽象且high-level的問(wèn)題了。
這時(shí)候我們就要將價(jià)值觀的對(duì)齊作為一個(gè)很重要的課題了,OpenAI也是說(shuō)要做超級(jí)對(duì)齊。為什么說(shuō)價(jià)值觀對(duì)齊很重要呢,是否只要保證模型不會(huì)輸出惡意的內(nèi)容就可以了呢?實(shí)際上是不夠的,一個(gè)典型的例子就是“曲別針制作AI”
“曲別針制作AI”是一個(gè)強(qiáng)大的AI,但是它唯一的目的就是做曲別針。這看似和我們的價(jià)值觀不沖突,或者說(shuō)和我們?nèi)祟惖膬r(jià)值觀是“正交”的。但是,這個(gè)AI很可能會(huì)帶來(lái)嚴(yán)重的后果,雖則對(duì)“做曲別針”這一目標(biāo)的追求,它會(huì)想盡一切可能更快地去生產(chǎn)曲別針,它完全不會(huì)考慮供需平衡,又因?yàn)樗銐驈?qiáng)大,所以可以搶其他生產(chǎn)線的原料,最終毀滅地球甚至是整個(gè)宇宙(不斷自身復(fù)制、并發(fā)展科技來(lái)侵占其他星球)來(lái)生產(chǎn)曲別針,最后一步是把自己也變成曲別針,然后我們就得到一個(gè)只存在曲別針的宇宙(因?yàn)樗銐驈?qiáng)大,所以能保證這樣的宇宙是能永恒存在的)
這個(gè)例子很好,說(shuō)明了即使是和人類價(jià)值觀有些許偏差,AI就有可能帶來(lái)災(zāi)難性的后果。當(dāng)然,這種想法當(dāng)然會(huì)有一些批評(píng)意見(jiàn),但這里就不展開(kāi)了,大家喜歡的話可以自己思考。
某種程度上《影實(shí)》的男主希德也是一樣,他的目標(biāo)“影之實(shí)力者”就是一種“正交目標(biāo)”,而且他有足夠的能力,所以很多人都會(huì)下意識(shí)地?fù)?dān)心男主可能會(huì)帶來(lái)災(zāi)難性的后果,這當(dāng)然可以理解。雖然我認(rèn)為對(duì)于這樣一部誤解電波系帶有強(qiáng)烈喜劇成分的作品來(lái)說(shuō),沒(méi)有必要擔(dān)心,甚至?xí)У暨@部作品就是了。