AI繪畫:Stable Diffusion Web UI(五)圖生圖的基礎(chǔ)使用1
本次記錄圖生圖界面img2img、sketch的主要功能。
非技術(shù)大佬,如有錯(cuò)誤,純屬正常。
前面幾篇有需要的新手小伙伴可以去合集中看看:
(一)Windows本地搭建
(二)插件及模型安裝
(三)基礎(chǔ)使用教程
(四)模型推薦
相比文生圖的抽卡,圖生圖因?yàn)橛袀€(gè)參考圖片打底,所以擁有更高的可控性,下面我按照圖生圖的幾個(gè)使用方向來說明具體功能。本次是img2img、sketch的重新繪圖,下次是局部繪圖以及批量處理。
1、反推提示詞

算是一個(gè)附加功能,結(jié)果并不準(zhǔn)確,只是給我們一個(gè)參考。如果是第一次使用,需要聯(lián)網(wǎng)下載模型包。
CLIP反推:側(cè)重于對圖像的描述,生成句子;
DeepBooru反推:側(cè)重于對圖像內(nèi)容的識(shí)別,生成tag。
使用下面這張圖作為演示:

可以明顯的看出兩者的差別:
這是根據(jù)反推生成的圖:左DeepBooru反推,中CLIP反推,右參考圖

想要較好還原,建議選擇DeepBooru反推修改使用。
2、重新繪制參考圖-img2img、sketch
img2img和sketch特點(diǎn)就是會(huì)根據(jù)重繪強(qiáng)度的高低對全圖進(jìn)行重新繪制,因此參考圖最重要的部分是顏色和構(gòu)圖,而不是細(xì)節(jié)。它們的應(yīng)用范圍包括大幅度改變圖像內(nèi)容、改變畫風(fēng)風(fēng)格、線稿繪圖等等。
圖生圖界面的img2img和sketch↓

(1)先看下各項(xiàng)參數(shù),參數(shù)欄都是一樣的:

參數(shù)欄
①.縮放模式:

出圖和參考圖比例不同時(shí),不同的縮放模式有不同的效果。
比如:參考圖是512*768的豎圖,比例大概是2.6:4;出圖是512*512方圖,比例是1:1。
示例第一張是原圖,重繪都是0↓

第二張拉伸模式,直接把短邊拉長;第三張裁剪模式,把長邊的上下剪掉;第四張填充模式,用AI填充短邊;第五張直接縮放模式,效果和拉伸是一樣的,但是因?yàn)榉糯蟮氖菨撟兞克詫?dǎo)致模糊。
至于啥是潛變量,俺也不知道....但是我嘗試過效果,怎么說呢,這個(gè)模式最少要重繪0.5以上才正常(未考慮采樣器的影響),下圖↓

②在文生圖講過,不在贅述
只需要注意尺寸的設(shè)置,需要根據(jù)縮放模式的不同效果。
③重繪強(qiáng)度:

這個(gè)在前面文生圖高分修復(fù)Hires. fix的時(shí)候也說過,數(shù)值越小對原圖影響越小,數(shù)值越大,AI越奔放,與原圖差異越大。
高分修復(fù)的時(shí)候我們并不希望對原圖有太大影響,所以數(shù)值一般都不大。圖生圖這邊正好相反,不然還圖生圖干啥...因此重繪強(qiáng)度可以說是圖生圖最重要的參數(shù)
這個(gè)地方有一點(diǎn)需要注意,如果是隨便找的一張圖,在只有圖沒有提示詞的情況下,第一次重繪強(qiáng)度不要過大,不然會(huì)完全脫離參考圖。
參考圖↓:

無提示詞,種子隨機(jī)↓

無提示詞,種子不變↓

只有負(fù)面提示詞,種子不變↓

有原圖提示詞,種子隨機(jī)↓

有原圖提示詞,種子不變↓

可以發(fā)現(xiàn),
在重繪強(qiáng)度較小的情況下,參考圖基本上就替代了文生圖中提示詞的功能,甚至表現(xiàn)的更好。我們不需要在提示詞框中再輸入(關(guān)于參考圖內(nèi)容)的提示詞,只需要輸入我們想要改變的提示詞就可以。隨著重繪強(qiáng)度加大,最好添加顏色相關(guān)的提示詞;
要想保持原圖的大體結(jié)構(gòu),保持種子不變是個(gè)好辦法;
同文生圖一樣,同樣的提示詞多次重復(fù)出圖會(huì)導(dǎo)致AI出圖逐漸固化;
img2img大體流程:我們可以先通過反推原圖生成提示詞,第一次重繪保持強(qiáng)度小于0.3,然后舍棄原圖使用第一次重繪的圖做參考圖繼續(xù)重繪。保持種子不變可以在重繪強(qiáng)度高的時(shí)候保持原圖結(jié)構(gòu),同時(shí)也要不斷修改提示詞達(dá)到我們想要的效果。
tips:
圖生圖雖然比文生圖穩(wěn)定,但仍不是一蹴而就的,利用生成批次一次生成多張圖片會(huì)有更多的選擇。

點(diǎn)擊這兒可以將重繪的圖發(fā)送到img2img替換原圖,如果遇到合適的,不要死守著一張參考圖不放,這張背景合適就發(fā)過去畫人物,另一張人物合適就發(fā)過去畫背景↓

上面的演示用到了SD自帶的腳本工具xyz圖表,特別實(shí)用。通過設(shè)置xy軸參數(shù),可以快速幫我們了解不同參數(shù)對出圖的影響。它的位置就在 文生圖/圖生圖 參數(shù)界面的下方腳本框內(nèi),選擇 “X/Y/Z 圖表”。

類型直接在下拉框中選擇;
軸值的一般格式為:

比如我想了解采樣器和迭代步數(shù)對出圖的影響,可以這么設(shè)置:


(2)應(yīng)用
①風(fēng)格轉(zhuǎn)換:三次元轉(zhuǎn)二次元
首先用AI 生成了一個(gè)衰哥,生成完直接發(fā)送到圖生圖,選擇一個(gè)二次元模型,我這里選擇CounterfeitV25;

先試探一波,采樣器使用DDIM,重繪0.3以后才開始有明顯的二次元風(fēng)格,在30步以后已經(jīng)穩(wěn)定。

選擇一張,進(jìn)一步重繪,添加背景啥的提示詞;
勉強(qiáng)能看.....↓

②線稿草稿繪圖:
百度找的不知名大佬的線稿,此次不使用插件。

a.先試探一波,看看步數(shù)和重繪,使用拉伸以及euler a

b.可以看到,對線稿來說,在沒有提示詞的情況下,步數(shù)并不會(huì)造成什么大的影響;重繪0.4開始發(fā)生變化,0.6已經(jīng)發(fā)生巨大變化,后面再補(bǔ)一個(gè)0.5看看(不考慮參考圖的要素,我竟然覺得AI這波發(fā)揮的還不錯(cuò))↓

0.3和0.5↓ 0.3眼睛已經(jīng)上色,0.5也脫離了原圖;

c.如何才能保留參考圖結(jié)構(gòu)呢?
前面說過,對全圖重繪而言,參考圖最重要的是顏色和結(jié)構(gòu),線稿沒有顏色,我們先試圖保證人物。
添加一些提示詞,重繪保持0.3

d.感覺第三張更好,發(fā)送到img2img進(jìn)行重繪,不修改提示詞,使用xyz嘗試不同的重繪強(qiáng)度↓

感覺0.4更好,取消xyz圖表,使用0.4重繪幾張

e.選擇第四張吧,發(fā)送到img2img,重繪選0.5,添加新的提示詞

f.隨便選個(gè)第二張吧,此時(shí)我已經(jīng)不想繼續(xù)下去了o(╥﹏╥)o
原圖:

奔放吧AI

隨便再搞幾張↓


g.現(xiàn)在回到c步驟,在完成添加提示詞以后,我們嘗試一個(gè)新的腳本,回送/loopback

這個(gè)腳本的是把每次生成的圖自動(dòng)發(fā)送到img2img作為參考圖進(jìn)行重繪,然后一直這樣迭代,直到達(dá)到我們的設(shè)置的迭代值。用來替代上面那些無止境的嘗試....
選擇腳本。

迭代次數(shù),就是循環(huán)幾次;
Final denoising strength,最終去噪強(qiáng)度,我們在c步驟的時(shí)候重繪強(qiáng)度是0.3,設(shè)置最終0.66,那么腳本就會(huì)通過6次迭代,將重繪強(qiáng)度從0.3增加到0.66;
Denoising strength curve,去噪強(qiáng)度曲線,選項(xiàng)分別是激進(jìn)、線性、懶惰?什么意思呢,就好像大家的顯卡風(fēng)扇轉(zhuǎn)速,顯卡開始工作,溫度開始上升,有的風(fēng)扇溫度一升高轉(zhuǎn)速就噌的一下上去了,嗡嗡的吵死了,有的隨溫度線性增加,有的不到99度他都不轉(zhuǎn)....
下面這個(gè)Append interrogated prompt at each iteration,在每次迭代時(shí)附加詢問提示,我也不知道是啥,里面有CLIP、DeepBooru的選項(xiàng),我猜是每次迭代以后反推這兩個(gè)類型的提示詞,然后應(yīng)用到下一次迭代。
不想回去找c的圖了(圖太多了不想找),就用e的吧,最終去噪強(qiáng)度我們改成0.88,種子保持不變:
線性↓

激進(jìn)↓

懶惰...↓

下面這兩個(gè)是最后那個(gè)Append interrogated prompt at each iteration選項(xiàng)的對比:
CLIP↓

DeepBooru↓

③上色
終于輪到Sketh了,
點(diǎn)擊取色板可以選顏色

我先畫為敬↓

此時(shí)提示詞中并沒有任何顏色提示詞
直接使用回送腳本,設(shè)置如下

看效果:
這個(gè)腳本最后一項(xiàng)開啟Deepbooru是真的好啊,雖然最后和我畫的顏色一點(diǎn)關(guān)系都沒有....

這個(gè)最后一項(xiàng)是CLIP↓

下面是關(guān)閉Deepbooru和CLIP↓

下面分別是關(guān)閉Deepbooru和CLIP的激進(jìn)和懶惰↓


我發(fā)現(xiàn)有兩個(gè)一樣的圖;還有為啥非要給人家轉(zhuǎn)個(gè)身.....
按照畫筆顏色添加提示詞應(yīng)該能獲得更好的效果,我就不嘗試了。
最后終于輪到我展示畫工了
攤牌了,我其實(shí)是個(gè)畫家

老規(guī)矩,使用回送腳本

多欣賞幾次





畫工和我一樣好的同學(xué),記得把重繪強(qiáng)度調(diào)高一點(diǎn).....