AI繪畫:SD Web UI(三)基礎(chǔ)使用教程
基于Stable Diffusion Web UI項(xiàng)目,感謝各位大大的無私奉獻(xiàn)
前兩篇內(nèi)容:
AI繪畫:Stable Diffusion Web UI之插件及模型安裝
AI繪畫:Stable Diffusion Web UI本地搭建之Windows
有需要的的小伙伴可以在合集中查看。

? ? ????前面兩篇說了如何在本地搭建Stable Diffusion Web UI以及如何安裝插件及模型,這次記錄一下WEB UI
最基本的使用。主要是以文生圖/txt2img為主。
????????如果按照我前面的教程做了漢化,那么這個界面理解起來就比較容易了。

①:checkpoint模型
????????此處是選擇我們安裝的checkpoint模型,以前是ckpt格式,現(xiàn)在大部分是safetensors格式。這個格式相比ckpt,就是突出個safe,如果你不能使用safetensors格式,那么就是Web UI的版本太低了,git pull就OK。在WebUI運(yùn)行中安裝了新模型,需要點(diǎn)擊右側(cè)藍(lán)色刷新按鈕或者重啟UI(Reload UI)。
關(guān)于checkpoint
大概分為CHECKPOINT TRAINED以及CHECKPOINT MERGE,分別是別人訓(xùn)練好的和融合好的,它是大型模型,里面集合了模型參數(shù)、權(quán)重等,因此出圖的的風(fēng)格、畫風(fēng)已經(jīng)相對固定。
好處就是可以直接拿來用,缺點(diǎn)就是想要再去微調(diào)十分麻煩,于是有了后面的lora、embedding等模型。這些屬于附加模型,應(yīng)用在checkpoint模型上,可以輕易對其進(jìn)行微調(diào),而且容易訓(xùn)練,十分方便。
②:功能欄
????????文生圖/txt2img:功能單一,只需要輸入prompt,就可以生成畫作,但是很多時候并不符合期望....
????????圖生圖/img2img:相比文生圖可控性更強(qiáng),畢竟有個圖片打底。有很多功能,例如根據(jù)線稿繪圖、修復(fù)、修補(bǔ)原圖、擴(kuò)展原圖等;
????????說到圖生圖,前兩天看到一個很有意思:

? ? ? ? 附加功能/Extras:好像就是放大圖像用的;
????????上面三個功能是有關(guān)聯(lián)性的,比如:使用文生圖創(chuàng)建一個大體滿意的的圖像,然后到圖生圖完善細(xì)節(jié),最后放大出圖,完美。
????????圖像信息/PNG info:如果原圖在出圖時保存了生成信息,那么把原拖進(jìn)來就可以看到各種參數(shù),對于C站那些留圖不留種的十分友好;

????????后面的merger以及train都是訓(xùn)練的內(nèi)容,我沒啥研究因此不先涉及;
????????再后面的是我安裝的插件界面,最后面就是UI的設(shè)置以及擴(kuò)展插件界面。
③:prompt/文生圖、圖生圖
????????提示框分為正面提示(prompt)和反面提示(Negative prompt)。

a.正面提示:
????????對于想要得到的圖像內(nèi)容進(jìn)行描述。Stable Diffusion更容易理解booru提示詞,booru應(yīng)該是個圖片數(shù)據(jù)庫,里面包含了各種圖片的關(guān)鍵詞,這些關(guān)鍵詞我們就可以拿來用作prompt。所以prompt一般以詞的形式出現(xiàn),而不是句子。
權(quán)重:
????????一般的,prompt越靠前權(quán)重越大,意思就是ai對這個詞越敏感,在出圖中表現(xiàn)為對這個詞優(yōu)先還原。可以通過語法來調(diào)節(jié)權(quán)重,表現(xiàn)形式為(單詞:數(shù)字)
,數(shù)字通常在0~2之間。
????????如high quality
默認(rèn)權(quán)重是1;(high quality)
和(high quality:1.1)
是等效的,圓括號不加數(shù)字表示*1.1倍,((high quality))==(high quality:1.21)
,不建議嵌套括號,看著難受不說,還可能會造成混亂。
????????同樣的還有方括號不加數(shù)字,表示/1.1,[high quality]==(high quality:0.91)
。直接選中詞然后按ctrl+↑↓
即可快速增加和減少權(quán)重,會表現(xiàn)為(high quality:數(shù)字)
的形式。
總結(jié)一下:
????????還有更復(fù)雜的分步[關(guān)鍵詞1:關(guān)鍵詞2:數(shù)字]
、嵌套[關(guān)鍵詞1|關(guān)鍵詞2]
、融合關(guān)鍵詞1|關(guān)鍵詞2
等等,等我搞懂再補(bǔ)充....
順序與內(nèi)容:
????????前面說過,越靠前的詞權(quán)重越大,因此對于內(nèi)容的描述,盡量按照一定的順序來,可以減少很多錯誤嘗試。比如,按照畫質(zhì),藝術(shù)風(fēng)格,主體,細(xì)節(jié),姿勢,背景的順序,只寫必要的詞、相似的放在一起等等。
????????說到這個畢竟我不是專業(yè)的,很難看出圖好不好,所以還是參考專家的話吧

翻譯一下:

????????另外需要補(bǔ)充的一點(diǎn),除非是基礎(chǔ)模型,一般訓(xùn)練好的模型都有一些隱藏設(shè)置,比如說Trigger Words
會自動觸發(fā)一些固定風(fēng)格,或者是會自動舍棄一些prompt,具體模型還是要具體分析,不能一概而論。
????????不知道怎么寫也沒關(guān)系,網(wǎng)上總是不缺大神。一個是安裝SD Web UI的tag補(bǔ)全插件,一個是網(wǎng)友自建的咒語網(wǎng)站。
b.反向提示:
????????反向提示就是描述你不想在圖中出現(xiàn)的東西。
????????我的建議是一開始只寫基礎(chǔ)的,如lowres,worst quality, low quality,后面再根據(jù)圖中出現(xiàn)的錯誤添加,比如出現(xiàn)多余的手指、腿等,就添加extra fingers,extra legs。
④:參數(shù)設(shè)置

采樣器 /Sampling method:
????????選擇采樣算法,我沒怎么嘗試,都是看別人用什么我就用什么。這里節(jié)選查資料時看到的解釋:


采樣迭代步數(shù) /Sampling Steps
????????生成圖片的迭代步數(shù),每多一次迭代都會給 AI 變更靠近prompt。更高的步數(shù)需要花費(fèi)更多的計算時間,步數(shù)越大,圖像細(xì)節(jié)越多,但是和采樣器相關(guān)聯(lián),詳見上圖。
分辨率(寬度和高度)
????????吃顯存,雖然說分辨率越大細(xì)節(jié)越多,即使硬件跟得上,也不建議設(shè)置過大。因?yàn)槲覀兪褂玫哪P涂赡芫褪窃谛》直媛氏掠?xùn)練的,如果設(shè)置得到過大,會有極高的幾率出現(xiàn)各種畸形。尤其不建議橫圖比例,基本必出畸形,保持正方形或者豎圖即可,橫圖可以使用圖生圖的inpating功能。
????????同時應(yīng)根據(jù)需要出圖的內(nèi)容設(shè)置,比如頭像或者半身照,默認(rèn)512即可;七分或者全身可以考慮768或者1024。
????????如果實(shí)在是想要高分辨率,就可以使用采樣器下方的高分辨率修復(fù)功能。這個同樣要選擇高清算法,如果對原始圖很滿意,這個地方直接無或者在重繪強(qiáng)度調(diào)整到0.3以下,還是那個原因,高分重繪很容易畸形。
生成批次和生成數(shù)量/Batch count、 Batch size
????????批次不同細(xì)節(jié)不同,需要計算時間;生成數(shù)量是指的每批同時生成的圖片數(shù)量,吃顯存。
提示詞引導(dǎo)系數(shù)/CFG Scale
????????就是留給AI自由發(fā)揮的空間。越大,越靠近prompt;越小,越奔放。
圖像生成種子/seed
????????-1表示每一次都是隨機(jī)種子;種子一致,參數(shù)一致,模型一致,應(yīng)該再加上個GPU一致,理論上就能生成一模一樣的圖片。
????????對生成圖片不滿需要修改時,要保持種子一致,才會保持大體的構(gòu)圖一致。
面部修復(fù)、無縫貼圖、高分辨率修復(fù)
????????面部修復(fù)這個基本可以直接忽略;無縫貼圖就是生成一個瓷磚;高分修復(fù)上面說過,這個很吃顯存。
⑤:我也不知道這個叫什么

????????這里主要說一下左側(cè)的斜箭頭以及中間的可選附加模型。
????????斜箭頭是自動填充,點(diǎn)擊會自動填充上一次出圖的prompt、參數(shù);另一個作用上一篇講過了,就是如果我們復(fù)制了別人的Generation Data,可以直接粘貼在prompt框里,然后點(diǎn)擊小箭頭,別人的prompt、參數(shù)就會自動填充到我們的界面里。
????????可選附加模型用于輸入prompt,點(diǎn)擊以后下方會多處一欄菜單,里面是我們安裝的各種附加模型。

????????只需要點(diǎn)擊一下,就會生成對應(yīng)模型權(quán)重1的tag,直接修改即可,不用再手動輸入。
⑥:輸出欄
????????此處會顯示預(yù)覽以及成品,不用多說。
????????下方第一個文件夾按鈕,是打開輸出目錄,只能在服務(wù)端打開;
????????保存按鈕是保存當(dāng)前圖像,如果有多個,可以用第三個按鈕打包下載;
????????后面分別是將當(dāng)前圖像發(fā)送到圖生圖界面和附加功能界面。
求點(diǎn)贊O(∩_∩)O哈哈~