散文網(wǎng) » 科技 »數(shù)碼 » 有關(guān)AI繪畫的筆記——2022.8.27

有關(guān)AI繪畫的筆記——2022.8.27

2022-08-27 10:17 作者:藍(lán)鯨澤維爾 0人讀過(guò) | 我要投稿

我真的是什么都不懂，瞎寫而已。麻煩不感興趣和有意見(jiàn)的屏蔽我。歲數(shù)大了，不會(huì)溝通，看不慣的留言就直接刪了，B站給的權(quán)力，我憑什么不用。我沒(méi)有能力改變你對(duì)我的偏見(jiàn)，別浪費(fèi)彼此時(shí)間。何況我就是寫得很瑣碎，就是想篩掉沒(méi)耐心看的人。

Stable Diffusion的出現(xiàn)確實(shí)改變了AI繪畫的發(fā)展進(jìn)程，倒不是說(shuō)其它模型都沒(méi)意義了，而是它現(xiàn)在這種出圖的質(zhì)量和速度，已經(jīng)改變了很多事。用klms采樣，20步計(jì)算足以做出一張像樣的畫面，這種速度大大降低了學(xué)習(xí)和試錯(cuò)成本，再加上模型本身精度和出圖質(zhì)量的提升，稱其為“革命性”進(jìn)展，我覺(jué)得不為過(guò)。

到我發(fā)這篇日志為止，SD的開(kāi)源notebook已經(jīng)有2D動(dòng)畫功能，好像選項(xiàng)參數(shù)和DD還不太一樣，但是由于本身出圖很快，所以這個(gè)功能可以非?？旖莺?jiǎn)單地上手和調(diào)試。DD時(shí)代的動(dòng)畫，我有心嘗試但沒(méi)有硬件條件，不過(guò)細(xì)看那些動(dòng)畫作品，內(nèi)容基本就是讓人驚駭一下，沒(méi)有什么實(shí)際意義，因?yàn)闆](méi)人有機(jī)會(huì)詳細(xì)調(diào)試，生產(chǎn)時(shí)間太長(zhǎng)了?，F(xiàn)在完全不一樣，SD在動(dòng)畫方面有很大的發(fā)揮空間，幾乎沒(méi)有硬件條件限制，做個(gè)1分鐘的動(dòng)畫跟DD里做一張高分辨率圖的時(shí)間差不多。另一大原因是SD的準(zhǔn)確性提高，可以在prompt上多下些功夫了。DD里寫一些復(fù)雜的prompt，簡(jiǎn)直就是自欺欺人，能做出東西來(lái)純屬運(yùn)氣。

建議如果前面DD里做的不多的話，直接研究SD就好了，兩者間的prompt不通用，思路也不一樣。除非你像我這種，根本不存在什么甲方乙方交圖之類的需求，就是自己探索著玩，那DD對(duì)你還是有價(jià)值，而且可能永遠(yuǎn)都有意義，因?yàn)樗锩嬗蟹浅６嗖淮_定性，可探索的空間是無(wú)窮的。

簡(jiǎn)單說(shuō)下可以分享的思路，為什么說(shuō)有些不能分享，現(xiàn)在AI繪圖爭(zhēng)議還挺多的，雖然已經(jīng)有人拿它交工改圖掙錢了，但我這么直接把原圖發(fā)出來(lái)，還是沒(méi)辦法得到“原創(chuàng)”的共識(shí)，像我這種沒(méi)有圈子的底層屌絲，雖然已經(jīng)無(wú)所謂你拿走做什么用了，但是我還是希望我自己發(fā)的視頻不受影響，這是我的底線，前面已經(jīng)被某些SH突破過(guò)了，那我現(xiàn)在就不冒險(xiǎn)了。要是這些圖過(guò)一兩年還有人覺(jué)得好看，那才有意義，現(xiàn)在說(shuō)明不了問(wèn)題。

而且，目前的AI繪圖，尤其是認(rèn)真探索的話，早就不是prompt那么簡(jiǎn)單了，只會(huì)用text，也就只有那些在線的可以玩玩，開(kāi)源notebook里的參數(shù)，不學(xué)基本什么都做不出來(lái)。以Stable DIffusion為例，現(xiàn)在出圖這么快，我甚至連圖都不保存了（相比DD而言，它出的圖，我?guī)缀醵家鄠浞菀幌?，成本太高了，丟了很難重畫出來(lái)），只存seed，因?yàn)楫嬅娓鷖eed關(guān)系最大，固定seed后出圖就沒(méi)有變化了，這時(shí)候要提高畫質(zhì)，就是靠一點(diǎn)一點(diǎn)調(diào)參數(shù)看效果。SD里參數(shù)很少，基本就是GS和Steps，其實(shí)很容易找到合適的取值。基本作圖思路就是選定主題+隨機(jī)到合適的Seed+重復(fù)調(diào)節(jié)GS和Steps，這樣可以達(dá)到一個(gè)理想的水平。別跟人要Prompts了，沒(méi)用。還有人想花錢買的，是不是有點(diǎn)太聰明。

至于DD和它現(xiàn)在最新的衍生notebook，參數(shù)的調(diào)節(jié)測(cè)試是非常繁雜的，新的功能是細(xì)化去噪音過(guò)程，有點(diǎn)真的像實(shí)際繪畫那樣了，先用一個(gè)prompt畫輪廓，再用第二個(gè)prompt畫細(xì)節(jié)，還有cutn曲線的設(shè)置，以及后期用mask遮蔽部分畫面進(jìn)行重畫。以DD出圖的速度，想調(diào)節(jié)這些內(nèi)容肯定很麻煩。相比SD，DD的學(xué)習(xí)和試錯(cuò)成本要高得多。

提到學(xué)習(xí)成本，A Traveler’s Guide to the Latent Space這篇指南是使用DD必須要看的，這個(gè)152頁(yè)，zippy那本32頁(yè)，兩個(gè)都看完才能對(duì)DD這些參數(shù)有一個(gè)經(jīng)驗(yàn)性的認(rèn)識(shí)，為什么說(shuō)是經(jīng)驗(yàn)性，因?yàn)槎际且郧笆褂谜咦鰧?shí)驗(yàn)后對(duì)參數(shù)的總結(jié)，是一種經(jīng)驗(yàn)總結(jié)而不是科學(xué)嚴(yán)謹(jǐn)?shù)慕Y(jié)論。作者原文就是告訴你這些東西只能信一半，因?yàn)楫?dāng)你換了prompt和參數(shù)，很多規(guī)律都可能不再適用，但DD的實(shí)驗(yàn)成本太高了，現(xiàn)在再投入時(shí)間做實(shí)驗(yàn)都不劃算了，所以這里提供的很多內(nèi)容都可以先作為參考。

我自己也對(duì)DD里的參數(shù)進(jìn)行過(guò)一定的測(cè)試，說(shuō)實(shí)話，沒(méi)得到什么結(jié)論。唯一的收獲就是不在prompt上做太多虛妄的設(shè)計(jì)，就用簡(jiǎn)單幾個(gè)熟悉的詞匯，組合之后讓AI自己發(fā)揮就完了。后面做的視頻，基本上prompt都簡(jiǎn)單得發(fā)指。我甚至還在用DD 5.2,參數(shù)幾乎跟默認(rèn)沒(méi)有差別。要探索就是增加或更換一個(gè)新詞，看看它的效果是怎樣的，然后再換一換組合。其實(shí)這些已經(jīng)要花很長(zhǎng)時(shí)間了。

而SD里目前不需要這么麻煩了，唯一需要保存的就是使用某些主題時(shí)發(fā)現(xiàn)的一些不錯(cuò)的seed，因?yàn)轭愃频臉?gòu)圖可以用在別的主題上，所以要自己找個(gè)小本子記一下。prompts用詞根本不用記了，測(cè)試成本這么低，準(zhǔn)確性這么高，可以拍腦門子隨便試了。這是DD里做不到的。