關(guān)于AI繪圖的現(xiàn)狀及爭議 隨便聊聊

昨天晚上我給我的Stable Diffusion(以下簡稱SD)安裝了Ultimate Upscale插件,現(xiàn)在我可以幾乎無損地將一張圖放大一倍:


如果在一個(gè)月前我需要做這項(xiàng)工作的話,我大概需要搜索“圖片無損放大”,然后在眾多廣告網(wǎng)站和收費(fèi)網(wǎng)站中找到那么一兩個(gè)提供幾次免費(fèi)試用機(jī)會(huì)的在線放大網(wǎng)站,生成一張還算差強(qiáng)人意的圖。
而現(xiàn)在內(nèi)嵌在SD webui中的Ultimate Upscale插件,zip包只有18KB。
本文寫的很隨意,也沒什么改動(dòng),一遍寫完,類似于視頻臺(tái)詞初稿,可能有語病,觀點(diǎn)及其主觀,僅代表個(gè)人,如有認(rèn)同,我很開心,如有反對,各自保留意見。
一、AI現(xiàn)狀
從上個(gè)月我開始玩SD開始,我的B站首頁10個(gè)視頻得有6個(gè)是AI相關(guān)。AI作圖、AI動(dòng)畫、AI音mad、AI鬼畜、AI作曲、AI翻唱等等,這還只是我平時(shí)關(guān)注的部分。
AI作品的質(zhì)量暫且不論,畢竟這東西個(gè)人評判標(biāo)準(zhǔn)不同,但從效率來說確實(shí)是不可避免的把傳統(tǒng)創(chuàng)作者薄紗了:就我最近看的AI Mr.quin翻唱合輯:【AI.Quin】富士山下【AI翻唱】_嗶哩嗶哩_bilibili?出曲速度基本是一天兩到三首,也就是四五小時(shí)就可以出一曲成品。而以質(zhì)量來看,要達(dá)到這種水準(zhǔn),需要相當(dāng)熟練的調(diào)音大佬工作一個(gè)星期左右(這基本也是當(dāng)年鬼畜區(qū)up“高產(chǎn)”的標(biāo)準(zhǔn))
如果回到本文想主要討論的主題:AI繪圖,效率上則是更是夸張。也許說我的RTX 2080掛一天能生成多少成品圖,很多人還沒有概念,那么AI繪圖目前對我的最大幫助就是:我?guī)缀醮_定我將告別所有的手機(jī)壁紙軟件了(wallpaper engine是不可能丟的,懂得都懂),因?yàn)槲抑灰丛枨敖o我的SD設(shè)定好prompt,等我洗完澡回來,第二天的壁紙已經(jīng)足夠我挑了。

顯然這些出圖并不算十分令人滿意(也許是這幾星期以來我的口味又刁了),無論是手部、身體結(jié)構(gòu)或是一些常識性的物體的透視都有明顯的問題,但如果我只想要一張“符合我要求的風(fēng)格與關(guān)鍵詞且看的過去”的壁紙第二天用,那顯然是足夠了。
而且,經(jīng)歷過SD幾個(gè)版本更迭的人應(yīng)該會(huì)懂,一個(gè)月之前,我們還難以想象用AI去繪制這種元素極其豐富并且毫不避諱展示出手部的圖。當(dāng)時(shí)人的身體結(jié)構(gòu)還經(jīng)常出問題,于是有了controlnet帶來的openpose;之后手部的老大難問題依然存在,又有了openpose_hand,那么下個(gè)月的這個(gè)時(shí)候,手部問題會(huì)不會(huì)已經(jīng)解決了呢?還是說,不用到下個(gè)月?

二、技術(shù)爆炸與AI繪圖火爆的原因
“技術(shù)爆炸”是大劉在《三體》中提出的一個(gè)概念,原文為“一個(gè)文明或物種的科學(xué)技術(shù)水平在短時(shí)間內(nèi)迅速增長的過程”,對于AI繪圖來說這個(gè)概念可能過大了,但性質(zhì)上類似。這里推薦大家去看這位up的視頻:【AI繪畫】AI圖像生成技術(shù)時(shí)間軸(截至2023年2月28日),可以重點(diǎn)關(guān)注一下2022年8月22日SD的開源一級10月3日NovelAI的上線,結(jié)合2022年之前與之后的發(fā)展速度,你能真切地體會(huì)到“爆炸”地感覺。

NovelAI幾乎是在一個(gè)國慶假期之內(nèi)完成了出世到開源的過程,并且也是從這時(shí)候開始AI繪畫迅速出圈,無數(shù)開發(fā)者開始創(chuàng)造新的插件,C站上各種角色的lora模型更新迭代,各種AI繪圖交流群和AI繪圖教程up如雨后春筍般出現(xiàn),更有如秋葉這樣的大佬,直接化身賽博菩薩,做出了傻瓜式UI(我清楚地記得我看到這個(gè)UI發(fā)布視頻的前一天配置了一晚上環(huán)境,第二天只需要鼠標(biāo)雙擊就行了),想入坑AI繪圖的,這應(yīng)該是你要看的第一個(gè)教程:【AI繪畫】啟動(dòng)器正式發(fā)布!一鍵啟動(dòng)/修復(fù)/更新/模型下載管理全支持!

那么問題來了,是什么動(dòng)力驅(qū)使著這些人夜以繼日地開發(fā)插件、煉模型、做教程,以及是什么動(dòng)力驅(qū)使著我們這些SD使用者每天興致勃勃地在屏幕前調(diào)參等圖呢?誠然有那么一部分人是為了利益,比如哪個(gè)傳說中賣了3000萬日元AI澀圖不知道有沒有被抓起來的日本奸商,但在交流群里我看到的往往是近幾個(gè)月連游戲都不玩了,每天壓榨自己的3080煉lora模型的群友。
對于這種除了消耗電費(fèi)和顯存壽命的行為,大多數(shù)人的看法是“澀澀是人類進(jìn)步的源動(dòng)力”,我覺得這想法片面了些。就我自己和相當(dāng)一部分群友來看,澀圖不過是玩了幾天就膩了的主題,現(xiàn)在大家都在討論prompt的效率、煉模型的技巧、新插件的開發(fā)以及怎么搭配別的軟件使用能修好手部等等(別的不說,我最近ps和blender技巧是大有長進(jìn))。在我看來,AI繪圖給我們這些使用者帶來的獨(dú)一無二的原創(chuàng)的成就感,才是大家不斷嘗試的動(dòng)力來源。每當(dāng)我想到“我將獲得一張獨(dú)一無二的一張圖來當(dāng)壁紙”,就會(huì)忍不住想再生成幾張碰碰運(yùn)氣。

上圖制作原材料和教程來源:【教程】壓榨AI給我出立體小卡( ??ω?? )
回到這一段的主題,AI繪圖為何火爆?它的根本變化在于SD之類工具的開源,這賦予了幾乎所有人幾乎一致的生產(chǎn)工具,并且可以與大多數(shù)人當(dāng)前擅長的領(lǐng)域迅速接軌。
比如做圖片精修的人完全可以簡單在ps里處理后用AI做后處理,做場景建模的人可以用SD導(dǎo)出深度圖高效完成二轉(zhuǎn)三過程,做角色設(shè)計(jì)的人輸入角色設(shè)定關(guān)鍵詞就能直接生成圖片給甲方看,諸如此類。我的技能十分有限,因而在這方面的想象力也是有限的,實(shí)際應(yīng)用應(yīng)當(dāng)遠(yuǎn)不止于此。
但有一點(diǎn)我是可以肯定的,AI繪圖的火爆,應(yīng)當(dāng)是作為一項(xiàng)工具而火爆,而不是單純的作為一個(gè)“圖像生成器”而受人追捧。而有意思的是,當(dāng)前對于AI繪圖質(zhì)疑與反對聲最大的,似乎正是單純把AI繪圖當(dāng)作純圖像生成工具的群體,這正是我在下段要說的,也是我最想說的部分。
三、新“蒸汽機(jī)”與版權(quán)問題
我很樂意將AI與蒸汽機(jī)類比,在我看來這是將AI看作蒸汽機(jī)與計(jì)算機(jī)之后的新一代技術(shù)革命的行為,是對AI技術(shù)的認(rèn)可。而事實(shí)上,這種類比是很有幫助的:正如同AI出人意料的最先攻陷藝術(shù)創(chuàng)作領(lǐng)域一樣,人類所引以為傲的創(chuàng)造力和想象力可能并不真的那么強(qiáng)大,至少這種強(qiáng)大只屬于少數(shù)人,而絕大多數(shù)人在這方面是平庸的,因而他們很難去想象或相信未來可能發(fā)生的變化,所以以過去之事類比,可能有利于理解我對AI的看法。
首先,正如我上文所提到的,這些反對者藝術(shù)家和畫師們僅把AI繪圖當(dāng)作純粹出圖工具看待,這正如看到第一臺(tái)蒸汽機(jī)是一臺(tái)抽水機(jī),就認(rèn)為蒸汽機(jī)只能用來抽水一樣。如果我們穿越回哪個(gè)年代,自然知道蒸汽機(jī)還可以用來驅(qū)動(dòng)汽車輪船,但現(xiàn)在的他們似乎無視了AI繪圖對于修圖、建模、人設(shè)創(chuàng)作、思維具象化等等工作的幫助,而只是一味地聲明AI侵占了他們的抽水工作?;蛟SAI根本不在意在這條賽道上和他們競爭,就像蒸汽機(jī)根本不在意抽水這一小項(xiàng)工作一樣:AI只是發(fā)了點(diǎn)小力,就整的繪畫界誠惶誠恐。
現(xiàn)在對于AI繪圖的主要質(zhì)疑與反對有以下幾點(diǎn):
1. AI讀圖侵犯了原圖作者的版權(quán)?
然后,認(rèn)為AI讀圖侵犯了版權(quán),這是我覺得這幾條里相對合理的了,也是歐美藝術(shù)界現(xiàn)在一直在討論訴訟的主題。不過我個(gè)人認(rèn)為藝術(shù)作品的版權(quán)難以量化,一幅畫能不能讀取,能讀取多少,能讀取多細(xì),也許是需要法規(guī)去限制。
但我更想說的是,藝術(shù)家們似乎并不應(yīng)當(dāng)為此興奮,因?yàn)檫@完全是利好法律工作者而不是畫師們。由于繪畫作品實(shí)現(xiàn)價(jià)值的途徑就是公開展示,想要自己的畫出名又不被盜取幾乎是做不到的,藝術(shù)家們能做的大概只是去討回應(yīng)得的創(chuàng)作收益,而這部分收益可能有相當(dāng)大的部分還得分給律師。
再退一步,就算真的實(shí)現(xiàn)了“展示畫作并能保證畫作數(shù)據(jù)不被讀取”,AI也并不一定真的要讀這些畫師的畫作來實(shí)現(xiàn)進(jìn)步。倘若對強(qiáng)化學(xué)習(xí)與對抗學(xué)習(xí)有所了解,也知道AI的左右互博有多么厲害。當(dāng)年Alpha Zero靠著自我對弈一周就干翻了master,并且輕松碾過了整個(gè)人類圍棋歷史的積淀,我不知道這些畫師是何來的自信,AI沒了他們的原圖就畫不出好圖來的。
2. AI創(chuàng)作邏輯不符合藝術(shù)范疇?
過于單純幼稚的觀點(diǎn),且不說藝術(shù)本身就是由人定義,正確的說法應(yīng)該是AI是否能納入“傳統(tǒng)藝術(shù)”的范疇。但我覺得AI應(yīng)該也不在乎和傳統(tǒng)藝術(shù)糾纏不清,就算AI繪圖被納為“AI藝術(shù)”,傳統(tǒng)藝術(shù)就能斗得過日新月異的AI藝術(shù)了?陳佩斯那句臺(tái)詞說得好:“你還管得了觀眾愛看什么嗎?”想象一下不遠(yuǎn)的將來,傳統(tǒng)畫師畫也畫不過AI,效率也比不過AI,還要求比AI高的成本,叫嚷著“我們是傳統(tǒng)藝術(shù)”,這不如同在蒸汽機(jī)車面前拉著人力車叫嚷著“我們是傳統(tǒng)出行方式”一樣可笑么。
3. AI對于藝術(shù)家的挫敗可能造成藝術(shù)領(lǐng)域的不思進(jìn)取
更是無力吐槽的問題,頭一回聽說自己不思進(jìn)取找別人理由的。AI可不會(huì)不思進(jìn)取,AI天天都在進(jìn)化。這都沒法類比了,拉著人力車說坐開蒸汽車的司機(jī)不愛鍛煉?純純的小丑觀點(diǎn)。
四、總結(jié)
早就聽說業(yè)界頂尖的一些畫師很早就開始用AI畫背景等不太重要的部分了,聰明人總是知道如何去使用新興工具。我們大眾普遍不能算聰明人,可能不知道如何最正確的使用方法,但我至少知道跟著大佬們走,總體方向不會(huì)錯(cuò),而且嘗試去使用一定比拒絕使用好。
現(xiàn)在其實(shí)是個(gè)好時(shí)代,或者說時(shí)代其實(shí)是越來越好的,想想一下你在工業(yè)革命時(shí)代拉人力車,蒸汽機(jī)的出現(xiàn)基本宣告你的失業(yè),因?yàn)槔嚨膸缀鯖]有機(jī)會(huì)去學(xué)習(xí)蒸汽機(jī)的使用;計(jì)算機(jī)取代了我的計(jì)算工作,但我若是改行去做更深層次的分析,也能有口飯吃。
而今天只要你有臺(tái)帶顯卡能聯(lián)網(wǎng)的電腦,就能享受到人人平等的繪圖工具使用權(quán),不去嘗試一下怎么用,反倒給自己樹個(gè)假想敵拼命抵制,不得不說是相當(dāng)缺乏智慧的行為。而且AI影響的領(lǐng)域早就不止繪畫一處了,AI自動(dòng)駕駛,AI搜索引擎(最近的chatgpt和NewBing),甚至AI讀文獻(xiàn)(我自己就在用scispace)等等,也沒見哪家的抱怨聲音有你們這么大???
大概是藝術(shù)圈固步自封太久了吧,小圈子整天內(nèi)部互相吹捧,搞得如同華山論劍一般,自我感覺良好,時(shí)不時(shí)出個(gè)拍賣幾千萬的大白紙,還嘲笑我們這些圈外人土包子看不懂。結(jié)果現(xiàn)在空降了個(gè)拿機(jī)關(guān)槍的給你論劍的全突突了,一下子接受不了吧。給你們點(diǎn)小小的AI震撼。

我作為圈外人反正是看的挺爽的,AI用的也挺爽的,我現(xiàn)在只想加速。