老鹿學(xué)Ai繪畫:圖生圖及繪圖模式參數(shù)詳解


今天我們要分享的是今天分享內(nèi)容的視頻版如下,視頻已添加進(jìn)度條及配音,文中涉及到的模型已上傳,想要原視頻以及模型的鹿友公眾號(hào)后臺(tái)回復(fù)“460”獲?。?/p>
以下是圖文版內(nèi)容:
正文共:3291字 39圖
預(yù)計(jì)閱讀時(shí)間:9分鐘
之前我們分享了6篇關(guān)于Stable Diffusion的文章,涵蓋了文生圖板塊的大部分新手內(nèi)容。如果你想從頭學(xué)習(xí)AI繪圖,可以點(diǎn)擊文章頂部的合集鏈接:

里面可以閱讀目前為止我寫的所有Stable Diffusion內(nèi)容:

從今天開始,我們正式進(jìn)入圖生圖的內(nèi)容。

01
圖生圖的概述以及重繪幅度
在開始學(xué)習(xí)之前,讓我們先想象一個(gè)場景。例如你想生成一張類似的圖像,你應(yīng)該如何書寫提示詞呢:

通過這張圖,你能獲取到的關(guān)鍵詞信息有:tree、house、street、sky。
在文生圖中,生成這樣一張圖可能需要對(duì)色彩、構(gòu)圖等方面進(jìn)行詳細(xì)描述。盡管你可能會(huì)寫下很長一串提示詞,但仍然可能很難獲得你所期望的效果。
比如,我在二次元模型中僅僅憑借這幾個(gè)關(guān)鍵詞,只能得到如下所示的一張圖:

而通過圖生圖的處理,我們不僅可以向SD傳達(dá)了生成圖片的關(guān)鍵詞信息,還可以提供一張圖片作為參考。
這樣即使只是短短的幾個(gè)提示詞,我們也能輕松生成一張與參考圖片相似的圖像:

然后使用重繪幅度這個(gè)參數(shù)來進(jìn)行控制,數(shù)值越低,生成的圖片越接近參考圖:

數(shù)值越高,與參考圖的差距也就越大,生成的圖片畫風(fēng)也越接近你使用的模型。
例如我這里把模型換成了寫實(shí)類的模型,當(dāng)重繪幅度數(shù)值較大的時(shí)候,圖片也偏向?qū)憣?shí)了:

02
圖生圖四種縮放模式
圖生圖的參數(shù)幾乎和文生圖完全相同,因此我們在學(xué)完文生圖之后,再來學(xué)習(xí)圖生圖就會(huì)非常容易上手。
相比文生圖,圖生圖的參數(shù)中多了四種縮放模式的選項(xiàng),主要用于處理生成圖片與參考圖像的分辨率不一致的情況:

為了便于講解我這里先把重繪幅度改為0:

例如我們參考圖的分辨率是512*512,手動(dòng)拖動(dòng)尺寸的滑塊,界面中會(huì)出現(xiàn)紅色的框幫助你判斷生成圖像的畫幅:

當(dāng)我把分辨率改為768*400,使用的縮放模式為拉伸時(shí),生成的圖片會(huì)忽略掉原參考圖的橫縱比。
因此可以看到生成的圖片高于原尺寸的寬被拉長了,而低于原尺寸的高被壓扁了:

第二種裁切模式是在保持縱橫比的情況下,裁剪原始圖像的多余部分并改變大小。
通過生成的圖片我們可以看到,它相當(dāng)于是在512*512的原圖上裁切了一部分:

而生成的圖片分辨率大小調(diào)整為了我們設(shè)置的大?。?/p>
第三種填充模式簡單理解為PS的智能填充,能夠幫助你在保持縱橫比的同時(shí)改變尺寸,并重新繪制空白區(qū)域。
這個(gè)需要搭配重繪幅度來使用,由于我前面設(shè)置的重繪幅度為0,因此它只會(huì)拉伸:

而當(dāng)我把重繪幅度拉高以后,就能看到效果了,填充的還是挺好的:

最后一種縮放模式和第一種拉伸一樣,同樣也會(huì)改變原圖的橫縱比,區(qū)別在于調(diào)整圖片分辨率的時(shí)候,它使用了Upscaler算法。
這個(gè)模式很少使用,當(dāng)重繪幅度改為0時(shí),可以看到同樣是拉伸,這個(gè)模式生成的圖片會(huì)很糊:

搭配重繪幅度后生成的效果是這樣的:

同樣的參數(shù)下使用拉伸模式是這樣的,具體使用哪一種大家就根據(jù)自己的喜好選擇吧:

另外這個(gè)模式使用的Upscaler算法是可以更改的,你可以在設(shè)置-放大-圖生圖放大算法中選擇自己想要的算法,選擇之后記得保存設(shè)置并且重啟webUI界面:

修改完畢以后界面中看不到任何變化,但是它的算法已經(jīng)改為你選擇的算法了:

03
反推提示詞
在圖生圖界面中還有兩個(gè)反推提示詞的選項(xiàng):

Clip反推提示詞能反推出短句,側(cè)重點(diǎn)在于描述畫面中對(duì)象與對(duì)象之間的關(guān)系:

而DeepBooru反推提示詞則反推出的是單詞,側(cè)重點(diǎn)在于描述對(duì)象的特征,可以看出這個(gè)模式在人物的描述上會(huì)更好一些:

基于兩種反推提示詞的特點(diǎn),我們可以搭配著反推多張圖片的提示詞,然后再在圖生圖或文生圖中進(jìn)行篩選后嘗試使用它們:

04
更改畫風(fēng)的小技巧
前面我們提到了重繪幅度數(shù)值越低越接近于參考圖,數(shù)值越高畫風(fēng)越接近我們使用的模型。
如果我即想要保留參考圖的構(gòu)圖等,又想要改變畫風(fēng)應(yīng)該怎么弄呢?
文生圖和圖生圖的生成框的下方都可以將生成的圖片再次發(fā)送到圖生圖、局部重繪和附加功能面板:

例如我現(xiàn)在想要把鳴人換成三次元風(fēng)格,先把模型切換成chilloutmix三次元模型,注意,正確的使用模型很重要:

先降低重繪幅度的參數(shù),找到生成的不錯(cuò)的狀態(tài)將它再次發(fā)送到圖生圖:

繼續(xù)這個(gè)操作多重復(fù)幾次,每次選擇一個(gè)合適的圖作為下一次生成的參考圖:

我每次重繪幅度都是0.35,大概重復(fù)了3-4次,就能得到一張還不錯(cuò)的圖片了:

05
圖生圖繪圖
圖生圖旁邊有一個(gè)繪圖功能,它的參數(shù)對(duì)比圖生圖,只是多了畫筆和畫筆顏色調(diào)節(jié)的功能,相當(dāng)于可以在參考圖上進(jìn)行編輯:

例如我現(xiàn)在想要鳴人的頭發(fā)是紅色的,僅僅添加提示詞你會(huì)發(fā)現(xiàn)效果并不理想:

這個(gè)時(shí)候你可以用畫筆工具將頭發(fā)涂成紅色,然后再次生成就能得到一個(gè)紅色頭發(fā)的鳴人了:

你還可以直接在圖片上自己繪制草圖:

大概繪制成這樣:

然后在提示框中輸入bule sky, green grass, yellow chicken, gray water,sun等提示詞,它也能懂你的意思:

當(dāng)然這個(gè)草圖也可以是PS中畫的,不過生成的畫風(fēng)好像有點(diǎn)變化:


最后是一些我用Stable Diffusion結(jié)合ps弄出來的圖片,并且用chatgtp簡單生成了一下文案,圖片中所用到的Lora模型大家可以到網(wǎng)盤中自取,以下是文案加圖片內(nèi)容:
【AIGC】今天參觀了一位民間肖像畫工匠的工作室,他的畫作多是以古代人物為主題。然而,令我感到意外的是,在這些古畫中,我竟然發(fā)現(xiàn)了一些現(xiàn)代人的蹤影,這讓我深感困惑。
這些古畫中的人物,與我所熟悉的現(xiàn)代人異常相似,這到底是怎么回事呢?我向工匠詢問,他透露這些畫作是家族傳承的。據(jù)他所說,描繪的人物都是在古代擔(dān)任過官職的人。
這個(gè)發(fā)現(xiàn)引發(fā)了我的思考。難道這些人與古代的官員們存在著某種神秘的聯(lián)系?這個(gè)問題開始變得撲朔迷離起來....









【AIGC】工匠看到我對(duì)他的回答表示質(zhì)疑,他深思片刻后,從抽屜中取出一疊陳年的泛黃黑白照片。這些照片呈現(xiàn)出畫像上的人物過去的一些痕跡。
他指著照片,告訴我畫作里的人在古代確實(shí)曾擔(dān)任過官職,而這些畫作是根據(jù)他們的真實(shí)形象創(chuàng)作而成的。工匠解釋道,他的家族世代相傳著這些珍貴的照片和古畫技藝。
這令我更加困惑。古畫中的人物與現(xiàn)代人的相似性并不是巧合,而是蘊(yùn)含著深?yuàn)W的聯(lián)系....









以上就是今天想要分享給大家的所有內(nèi)容。
如果覺得對(duì)自己有所幫助,請不要吝嗇自己的點(diǎn)贊、點(diǎn)在看、轉(zhuǎn)發(fā)朋友圈,你們的支持對(duì)我很重要,謝謝!
更多內(nèi)容歡迎關(guān)注公眾號(hào):
本文由“野鹿志”發(fā)布
轉(zhuǎn)載前請聯(lián)系馬鹿野郎