有關(guān)AI繪畫的筆記——2022.8.27
我真的是什么都不懂,瞎寫而已。麻煩不感興趣和有意見(jiàn)的屏蔽我。歲數(shù)大了,不會(huì)溝通,看不慣的留言就直接刪了,B站給的權(quán)力,我憑什么不用。我沒(méi)有能力改變你對(duì)我的偏見(jiàn),別浪費(fèi)彼此時(shí)間。何況我就是寫得很瑣碎,就是想篩掉沒(méi)耐心看的人。

Stable Diffusion的出現(xiàn)確實(shí)改變了AI繪畫的發(fā)展進(jìn)程,倒不是說(shuō)其它模型都沒(méi)意義了,而是它現(xiàn)在這種出圖的質(zhì)量和速度,已經(jīng)改變了很多事。用klms采樣,20步計(jì)算足以做出一張像樣的畫面,這種速度大大降低了學(xué)習(xí)和試錯(cuò)成本,再加上模型本身精度和出圖質(zhì)量的提升,稱其為“革命性”進(jìn)展,我覺(jué)得不為過(guò)。
到我發(fā)這篇日志為止,SD的開(kāi)源notebook已經(jīng)有2D動(dòng)畫功能,好像選項(xiàng)參數(shù)和DD還不太一樣,但是由于本身出圖很快,所以這個(gè)功能可以非??旖莺?jiǎn)單地上手和調(diào)試。DD時(shí)代的動(dòng)畫,我有心嘗試但沒(méi)有硬件條件,不過(guò)細(xì)看那些動(dòng)畫作品,內(nèi)容基本就是讓人驚駭一下,沒(méi)有什么實(shí)際意義,因?yàn)闆](méi)人有機(jī)會(huì)詳細(xì)調(diào)試,生產(chǎn)時(shí)間太長(zhǎng)了?,F(xiàn)在完全不一樣,SD在動(dòng)畫方面有很大的發(fā)揮空間,幾乎沒(méi)有硬件條件限制,做個(gè)1分鐘的動(dòng)畫跟DD里做一張高分辨率圖的時(shí)間差不多。另一大原因是SD的準(zhǔn)確性提高,可以在prompt上多下些功夫了。DD里寫一些復(fù)雜的prompt,簡(jiǎn)直就是自欺欺人,能做出東西來(lái)純屬運(yùn)氣。
建議如果前面DD里做的不多的話,直接研究SD就好了,兩者間的prompt不通用,思路也不一樣。除非你像我這種,根本不存在什么甲方乙方交圖之類的需求,就是自己探索著玩,那DD對(duì)你還是有價(jià)值,而且可能永遠(yuǎn)都有意義,因?yàn)樗锩嬗蟹浅6嗖淮_定性,可探索的空間是無(wú)窮的。

簡(jiǎn)單說(shuō)下可以分享的思路,為什么說(shuō)有些不能分享,現(xiàn)在AI繪圖爭(zhēng)議還挺多的,雖然已經(jīng)有人拿它交工改圖掙錢了,但我這么直接把原圖發(fā)出來(lái),還是沒(méi)辦法得到“原創(chuàng)”的共識(shí),像我這種沒(méi)有圈子的底層屌絲,雖然已經(jīng)無(wú)所謂你拿走做什么用了,但是我還是希望我自己發(fā)的視頻不受影響,這是我的底線,前面已經(jīng)被某些SH突破過(guò)了,那我現(xiàn)在就不冒險(xiǎn)了。要是這些圖過(guò)一兩年還有人覺(jué)得好看,那才有意義,現(xiàn)在說(shuō)明不了問(wèn)題。
而且,目前的AI繪圖,尤其是認(rèn)真探索的話,早就不是prompt那么簡(jiǎn)單了,只會(huì)用text,也就只有那些在線的可以玩玩,開(kāi)源notebook里的參數(shù),不學(xué)基本什么都做不出來(lái)。以Stable DIffusion為例,現(xiàn)在出圖這么快,我甚至連圖都不保存了(相比DD而言,它出的圖,我?guī)缀醵家鄠浞菀幌?,成本太高了,丟了很難重畫出來(lái)),只存seed,因?yàn)楫嬅娓鷖eed關(guān)系最大,固定seed后出圖就沒(méi)有變化了,這時(shí)候要提高畫質(zhì),就是靠一點(diǎn)一點(diǎn)調(diào)參數(shù)看效果。SD里參數(shù)很少,基本就是GS和Steps,其實(shí)很容易找到合適的取值。基本作圖思路就是選定主題+隨機(jī)到合適的Seed+重復(fù)調(diào)節(jié)GS和Steps,這樣可以達(dá)到一個(gè)理想的水平。別跟人要Prompts了,沒(méi)用。還有人想花錢買的,是不是有點(diǎn)太聰明。

至于DD和它現(xiàn)在最新的衍生notebook,參數(shù)的調(diào)節(jié)測(cè)試是非常繁雜的,新的功能是細(xì)化去噪音過(guò)程,有點(diǎn)真的像實(shí)際繪畫那樣了,先用一個(gè)prompt畫輪廓,再用第二個(gè)prompt畫細(xì)節(jié),還有cutn曲線的設(shè)置,以及后期用mask遮蔽部分畫面進(jìn)行重畫。以DD出圖的速度,想調(diào)節(jié)這些內(nèi)容肯定很麻煩。相比SD,DD的學(xué)習(xí)和試錯(cuò)成本要高得多。
提到學(xué)習(xí)成本,A Traveler’s Guide to the Latent Space這篇指南是使用DD必須要看的,這個(gè)152頁(yè),zippy那本32頁(yè),兩個(gè)都看完才能對(duì)DD這些參數(shù)有一個(gè)經(jīng)驗(yàn)性的認(rèn)識(shí),為什么說(shuō)是經(jīng)驗(yàn)性,因?yàn)槎际且郧笆褂谜咦鰧?shí)驗(yàn)后對(duì)參數(shù)的總結(jié),是一種經(jīng)驗(yàn)總結(jié)而不是科學(xué)嚴(yán)謹(jǐn)?shù)慕Y(jié)論。作者原文就是告訴你這些東西只能信一半,因?yàn)楫?dāng)你換了prompt和參數(shù),很多規(guī)律都可能不再適用,但DD的實(shí)驗(yàn)成本太高了,現(xiàn)在再投入時(shí)間做實(shí)驗(yàn)都不劃算了,所以這里提供的很多內(nèi)容都可以先作為參考。
我自己也對(duì)DD里的參數(shù)進(jìn)行過(guò)一定的測(cè)試,說(shuō)實(shí)話,沒(méi)得到什么結(jié)論。唯一的收獲就是不在prompt上做太多虛妄的設(shè)計(jì),就用簡(jiǎn)單幾個(gè)熟悉的詞匯,組合之后讓AI自己發(fā)揮就完了。后面做的視頻,基本上prompt都簡(jiǎn)單得發(fā)指。我甚至還在用DD 5.2,參數(shù)幾乎跟默認(rèn)沒(méi)有差別。要探索就是增加或更換一個(gè)新詞,看看它的效果是怎樣的,然后再換一換組合。其實(shí)這些已經(jīng)要花很長(zhǎng)時(shí)間了。
而SD里目前不需要這么麻煩了,唯一需要保存的就是使用某些主題時(shí)發(fā)現(xiàn)的一些不錯(cuò)的seed,因?yàn)轭愃频臉?gòu)圖可以用在別的主題上,所以要自己找個(gè)小本子記一下。prompts用詞根本不用記了,測(cè)試成本這么低,準(zhǔn)確性這么高,可以拍腦門子隨便試了。這是DD里做不到的。

就這么多,以后會(huì)多寫專欄,寫各種主題,還是寫字舒服。
完。