關(guān)于當(dāng)前網(wǎng)上對(duì)AI繪圖的爭(zhēng)議,一些個(gè)人看法
能夠看到,目前在所有關(guān)于AI繪圖的爭(zhēng)論里,有相當(dāng)一部分是圍繞著“AI繪圖是否是縫合拼圖”展開(kāi)的。
并非說(shuō)這種爭(zhēng)論沒(méi)有意義,只是我想就這個(gè)話(huà)題,深入刨析一下,探討目前真正到這AI繪圖產(chǎn)生如此巨大的爭(zhēng)議,其根源到底可能是什么。
顯擺出結(jié)論,糾結(jié)AI繪圖到底是不是縫合拼圖,根本沒(méi)有抓住主要矛盾。在這場(chǎng)爭(zhēng)議之中,AI在技術(shù)角度是否抄襲,根本不重要,問(wèn)題的關(guān)鍵和核心在于以下兩個(gè)問(wèn)題:
不經(jīng)過(guò)真人畫(huà)師的同意,甚至在對(duì)方強(qiáng)烈反感的前提下,將其作品作為AI的訓(xùn)練集,是否符合道德?
繪畫(huà)平臺(tái)網(wǎng)站的用戶(hù),是否有權(quán)利選擇屏蔽或不屏蔽AI畫(huà)作?網(wǎng)站是否有義務(wù)將這兩種作品做出明顯區(qū)分?
這里先重點(diǎn)探討一下第一點(diǎn),因?yàn)槲艺J(rèn)為這是更為重要的。
正是因?yàn)殡p方在這第一點(diǎn)問(wèn)題上存在爭(zhēng)執(zhí),才會(huì)派生出“AI是不是在縫合拼圖”這種爭(zhēng)論:
正方首先是認(rèn)為不經(jīng)畫(huà)師允許將其作品投喂AI的行為是不道德的,才會(huì)努力去證明AI繪圖的運(yùn)行機(jī)制就是縫合拼圖,就是抄襲剽竊,這樣才能夠?yàn)樗麄兊暮诵闹鲝執(zhí)峁┕缹用娴谋硶?shū)。
反方首先認(rèn)為無(wú)償哪去目標(biāo)畫(huà)師的作品充當(dāng)訓(xùn)練集是正當(dāng)?shù)?,才?huì)從技術(shù)角度證明StableDiffusion不是拼圖縫合,是創(chuàng)作,以及證明AI訓(xùn)練的過(guò)程和人類(lèi)學(xué)習(xí)是本質(zhì)一樣的。
這才產(chǎn)生問(wèn)題的關(guān)鍵,這才是爭(zhēng)論的核心。是雙方在第一點(diǎn)問(wèn)題上存在矛盾,才導(dǎo)致了AI是否縫合的爭(zhēng)執(zhí),后者是前者的派生物,不要將因果關(guān)系搞反。
那么,在找到了主要矛盾后,我們?cè)賮?lái)看看反AI一方是采用怎樣的手段捍衛(wèi)這方面的自己的主張的呢?
主流的,無(wú)非兩種方法,一種是在網(wǎng)絡(luò)上和AI的擁躉對(duì)線(xiàn),斥責(zé)對(duì)方的不道德,以及辱罵AI畫(huà)圖的原理機(jī)制。
這是最無(wú)力的一種,因?yàn)槟懔R一萬(wàn)句,把對(duì)方駁斥得一句話(huà)都說(shuō)不出來(lái),哪怕真的在技術(shù)上證明了AI就是抄襲縫合,也完全阻止不了別人拿畫(huà)師的作品去煉丹。
畢竟程序部署在別人的電腦里,手長(zhǎng)在別人的身上,你難道有任何方法,阻止他把發(fā)布在公共平臺(tái)上的畫(huà)作下載下來(lái)丟進(jìn)StableDiffusion嗎?沒(méi)有。
這種思路是很奇怪的,一方面譴責(zé)AI使用者行為的不道德,一方面又把自己的主張得以實(shí)現(xiàn)的希望,完全寄托在對(duì)方的道德上,而沒(méi)有其他任何的強(qiáng)制手段保障自己主張的實(shí)現(xiàn)。
這著實(shí)是很無(wú)力的。
之前有人詆毀那些抵制AI繪圖的畫(huà)師,說(shuō)是盧德運(yùn)動(dòng)時(shí)期砸毀工廠機(jī)器的工人,這種比喻是完全站不住腳的。
因?yàn)楸R德運(yùn)動(dòng)好歹真的砸了機(jī)器,讓工廠短時(shí)間內(nèi)停工,讓個(gè)別的資本家蒙受了實(shí)質(zhì)性的損失。而畫(huà)師網(wǎng)上罵得再兇,能讓煉丹師不扒圖、不訓(xùn)練嗎?
真要拿盧德運(yùn)動(dòng)來(lái)對(duì)比,應(yīng)該是有畫(huà)師直接線(xiàn)下跑到煉丹師的家里把人揍一頓,把他電腦砸了,這才對(duì)應(yīng)得上。
第二種是許多人呼吁的“推動(dòng)立法”,簡(jiǎn)單點(diǎn)說(shuō)就是寄希望于國(guó)家能制訂相關(guān)法律,限制AI的使用和傳播。
這比第一種的可行性高一點(diǎn),但也僅僅只是五十步笑百步。
先不談以國(guó)內(nèi)的實(shí)際環(huán)境,你要怎樣才能讓趙老爺們就為了一群臭畫(huà)畫(huà)的修訂法律,就算你們神通廣大,真的成功了,一部新的法案從擬定到實(shí)施,又要多久時(shí)間?
確實(shí),現(xiàn)在國(guó)內(nèi)是有畫(huà)師狀告AI繪圖者勝訴的。
但看一下事件的詳細(xì)過(guò)程,就會(huì)發(fā)現(xiàn)就國(guó)內(nèi)而言,這種案例只是幾位個(gè)別的個(gè)例,達(dá)成所需要的條件實(shí)在太嚴(yán)苛太復(fù)雜了,不具備普遍意義的操作性。
把希望寄托在這種事情上,也是很渺茫的。
總之這條路線(xiàn)可以嘗試,但希望多半不大。
既然否定了兩條常見(jiàn)的行動(dòng)路線(xiàn),那么也有就斗膽談?wù)勛约赫J(rèn)為比較有可行性且有成效的辦法。當(dāng)然,不一定真的有用,還請(qǐng)相關(guān)領(lǐng)域的大佬們做出裁決。
首先,既然AI繪圖采用的是機(jī)器學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)的方式訓(xùn)練模型,那么,就可以嘗試一種幾乎能夠針對(duì)一切機(jī)器學(xué)習(xí)模型都有效的手段——對(duì)抗攻擊。
簡(jiǎn)單地說(shuō),就是針對(duì)AI繪圖主流的StableDiffusion算法,用對(duì)抗攻擊的方式開(kāi)發(fā)一個(gè)工具,一個(gè)處理圖片的工具。
一幅圖片被這個(gè)工具處理過(guò)后,肉眼上沒(méi)有什么變化,但是當(dāng)它被StableDiffusion進(jìn)行預(yù)處理并訓(xùn)練時(shí),會(huì)被識(shí)別成完全不相干的東西。
也就是說(shuō),被處理過(guò)的圖片,人眼看不出任何區(qū)別,但是在AI眼里,就是一團(tuán)馬賽克,根本沒(méi)有任何訓(xùn)練的價(jià)值,只會(huì)污染最終模型的性能。
對(duì)抗攻擊是幾乎對(duì)任何用機(jī)器學(xué)習(xí)訓(xùn)練出來(lái)的AI模型都有效的,過(guò)去不知道多少人采取過(guò)這種方法成功找到了無(wú)數(shù)AI的漏洞(包括自動(dòng)駕駛、圖像識(shí)別等等)。
在限速路牌上貼一截膠帶,就能讓特斯拉把限速?gòu)?0認(rèn)成80;胸前衣服上印一張圖,就能讓攝像頭把自己識(shí)別成貓……例子實(shí)在太多了。
(換言之,就是某種形式上的電子水印。)
這是一條早就被前人開(kāi)拓過(guò)無(wú)數(shù)遍的道路,應(yīng)該是比什么推動(dòng)立法要靠譜得多。
只要把這個(gè)工具開(kāi)發(fā)出來(lái),就能真實(shí)有效地保證每一位不想讓自己的畫(huà)作被投喂AI的畫(huà)師如愿以?xún)敗?/p>
同時(shí)也能夠報(bào)復(fù)那些私自拿自己作品投喂AI的煉丹師,污染他們的模型,破壞他們的成功,浪費(fèi)他們的電量、計(jì)算資源和時(shí)間。
而StableDiffusion算法是開(kāi)源的,目前主流使用的StableDiffusion WebUI也是完全開(kāi)源的,那些插件也都是開(kāi)源的,模型也都是公開(kāi)的。
也就是說(shuō),AI繪圖這一領(lǐng)域其實(shí)不存在任何秘密,代碼都是公開(kāi)的,資源也都是公開(kāi)的,全在GitHub上,任何人都能下載研究。
由于我并不是什么人工智能領(lǐng)域的大佬,對(duì)技術(shù)的了解肯定存在誤解和錯(cuò)漏,因此我也不能保證上訴方案百分百正確。
希望有路過(guò)的大佬分析一下我說(shuō)的思路的可行性。
當(dāng)然,就算這條路線(xiàn)是可行的,那也肯定很艱難。因?yàn)檫@相當(dāng)于讓一群文藝工作者,在敵人最擅長(zhǎng)的領(lǐng)域硬碰硬。
很可能畫(huà)師這邊剛費(fèi)盡心思開(kāi)發(fā)出一個(gè)反訓(xùn)練工具,幾天后StableDiffusion WebUI就更新修復(fù)了漏洞。
然而,我認(rèn)為如果這條路線(xiàn)在技術(shù)上不存在絕對(duì)障礙,那么都是比網(wǎng)絡(luò)對(duì)線(xiàn)、比所謂的“呼吁立法”要更可行也更有效的。
因?yàn)橹辽贈(zèng)]有任何人規(guī)定畫(huà)師就不能是程序員,況且市場(chǎng)經(jīng)濟(jì)世界存在一種叫“外包”的制度。
無(wú)論如何,多少要比把成功的希望完全寄托于敵人或趙老爺?shù)牧贾弦孔V一些。
說(shuō)我第一點(diǎn),再談?wù)劦诙c(diǎn)。為避免讀者遺忘,我重復(fù)一遍:
“繪畫(huà)平臺(tái)網(wǎng)站的用戶(hù),是否有權(quán)利選擇屏蔽或不屏蔽AI畫(huà)作?網(wǎng)站是否有義務(wù)將這兩種作品做出明顯區(qū)分?”
之所以談到這點(diǎn),是因?yàn)槲蚁氲角岸螘r(shí)間相當(dāng)紅火、被反AI一個(gè)視作標(biāo)桿的運(yùn)動(dòng),即A站大量畫(huà)師主動(dòng)抵制AI的運(yùn)動(dòng),最初的起因正是和網(wǎng)站在這一點(diǎn)發(fā)生了矛盾。
畫(huà)師,以及一部分用戶(hù),認(rèn)為沒(méi)有分類(lèi)機(jī)制的A站被大量AI繪畫(huà)霸占了版面,這影響了他們的正常使用,因此發(fā)起了這項(xiàng)運(yùn)動(dòng)。
后面由于A站官方的冷淡處理,忽視了真實(shí)存在的群眾的呼聲,這才導(dǎo)致這場(chǎng)運(yùn)動(dòng)規(guī)模愈發(fā)龐大、范圍愈發(fā)廣泛。
確實(shí),既然這項(xiàng)運(yùn)動(dòng)能夠壯大起來(lái),至少能夠說(shuō)明,在網(wǎng)絡(luò)空間,大多數(shù)用戶(hù)都是認(rèn)為,自己應(yīng)該有屏蔽或不屏蔽AI畫(huà)作的權(quán)利,并且也應(yīng)該有知情一幅畫(huà)作是否為AI繪畫(huà)的權(quán)利。
(譬如p站是有專(zhuān)門(mén)的tag來(lái)區(qū)分AI畫(huà)作和真人畫(huà)師畫(huà)作的,而且用戶(hù)也可以自由選擇是否屏蔽。)
這說(shuō)明這場(chǎng)運(yùn)動(dòng)是有群眾基礎(chǔ)的,是應(yīng)該被認(rèn)為是正當(dāng)的。
而且,不僅是正當(dāng)?shù)模€是確實(shí)是有成效的,因?yàn)槲艺J(rèn)為我們應(yīng)該支持鼓勵(lì),至少不應(yīng)該諷刺、詆毀。
如果這場(chǎng)運(yùn)動(dòng)能夠成功,不管是對(duì)畫(huà)師還是對(duì)普通用戶(hù),都是好事。
關(guān)于當(dāng)前網(wǎng)上一部分對(duì)AI繪圖的爭(zhēng)論的主要矛盾,我已經(jīng)講完了。
至于現(xiàn)在很常見(jiàn)的關(guān)于AI繪圖是否拼圖縫合的爭(zhēng)論,在不作價(jià)值判斷的前提下,我認(rèn)為:
只要一開(kāi)頭提到的兩點(diǎn)現(xiàn)實(shí)條件,即“沒(méi)有強(qiáng)制手段阻止煉丹師扒圖訓(xùn)練”,和“部分網(wǎng)站不將AI畫(huà)作和畫(huà)師作品做區(qū)別”,這兩點(diǎn)沒(méi)能夠改變,那么,不管在拼圖縫合與否的話(huà)題上吵得再兇,不論AI擁躉如何攻擊畫(huà)師的知識(shí)水平,畫(huà)師如何譴責(zé)對(duì)方的不道德,都不會(huì)對(duì)當(dāng)前的整體局勢(shì)產(chǎn)生太大影響。
這不是在搞受害者有罪論,不是說(shuō),畫(huà)師作為受害一方,就不能夠抱怨,不能夠發(fā)泄情緒,不能夠捍衛(wèi)自以為的正當(dāng)權(quán)利。
而是對(duì)不為個(gè)別人意志所轉(zhuǎn)移的現(xiàn)實(shí)條件做出盡量客觀的陳述與分析。
這肯定不能說(shuō)是受害者有罪論,就好像我勸說(shuō)一名對(duì)泥石流高聲咒罵的村民,勸說(shuō)他不能指望靠譴責(zé)泥石流的不道德來(lái)阻止村莊的毀滅,絕不能說(shuō)我在指責(zé)受害者一樣。