手機(jī)站首頁散文詩歌雜文隨筆日記小小說

散文網(wǎng) » 興趣 »繪畫 » AI繪畫：SD Web UI（三）基礎(chǔ)使用教程

AI繪畫：SD Web UI（三）基礎(chǔ)使用教程

2023-03-22 01:03 作者:bjl1015 0人讀過 | 我要投稿

基于Stable Diffusion Web UI項(xiàng)目，感謝各位大大的無私奉獻(xiàn)

前兩篇內(nèi)容：

AI繪畫：Stable Diffusion Web UI之插件及模型安裝

AI繪畫：Stable Diffusion Web UI本地搭建之Windows

有需要的的小伙伴可以在合集中查看。

? ? ????前面兩篇說了如何在本地搭建Stable Diffusion Web UI以及如何安裝插件及模型，這次記錄一下WEB UI最基本的使用。主要是以文生圖/txt2img為主。

????????如果按照我前面的教程做了漢化，那么這個界面理解起來就比較容易了。

①：checkpoint模型

????????此處是選擇我們安裝的checkpoint模型，以前是ckpt格式，現(xiàn)在大部分是safetensors格式。這個格式相比ckpt，就是突出個safe，如果你不能使用safetensors格式，那么就是Web UI的版本太低了，git pull就OK。在WebUI運(yùn)行中安裝了新模型，需要點(diǎn)擊右側(cè)藍(lán)色刷新按鈕或者重啟UI（Reload UI）。

關(guān)于checkpoint

大概分為CHECKPOINT TRAINED以及CHECKPOINT MERGE，分別是別人訓(xùn)練好的和融合好的，它是大型模型，里面集合了模型參數(shù)、權(quán)重等，因此出圖的的風(fēng)格、畫風(fēng)已經(jīng)相對固定。

好處就是可以直接拿來用，缺點(diǎn)就是想要再去微調(diào)十分麻煩，于是有了后面的lora、embedding等模型。這些屬于附加模型，應(yīng)用在checkpoint模型上，可以輕易對其進(jìn)行微調(diào)，而且容易訓(xùn)練，十分方便。

②：功能欄

????????文生圖/txt2img：功能單一，只需要輸入prompt，就可以生成畫作，但是很多時候并不符合期望....

????????圖生圖/img2img：相比文生圖可控性更強(qiáng)，畢竟有個圖片打底。有很多功能，例如根據(jù)線稿繪圖、修復(fù)、修補(bǔ)原圖、擴(kuò)展原圖等；

????????說到圖生圖，前兩天看到一個很有意思：

? ? ? ? 附加功能/Extras：好像就是放大圖像用的；

????????上面三個功能是有關(guān)聯(lián)性的，比如：使用文生圖創(chuàng)建一個大體滿意的的圖像，然后到圖生圖完善細(xì)節(jié)，最后放大出圖，完美。

????????圖像信息/PNG info：如果原圖在出圖時保存了生成信息，那么把原拖進(jìn)來就可以看到各種參數(shù)，對于C站那些留圖不留種的十分友好；

????????后面的merger以及train都是訓(xùn)練的內(nèi)容，我沒啥研究因此不先涉及；

????????再后面的是我安裝的插件界面，最后面就是UI的設(shè)置以及擴(kuò)展插件界面。

③：prompt/文生圖、圖生圖

????????提示框分為正面提示（prompt）和反面提示（Negative prompt）。

a.正面提示：

????????對于想要得到的圖像內(nèi)容進(jìn)行描述。Stable Diffusion更容易理解booru提示詞，booru應(yīng)該是個圖片數(shù)據(jù)庫，里面包含了各種圖片的關(guān)鍵詞，這些關(guān)鍵詞我們就可以拿來用作prompt。所以prompt一般以詞的形式出現(xiàn)，而不是句子。

權(quán)重：

????????一般的，prompt越靠前權(quán)重越大，意思就是ai對這個詞越敏感，在出圖中表現(xiàn)為對這個詞優(yōu)先還原。可以通過語法來調(diào)節(jié)權(quán)重，表現(xiàn)形式為(單詞：數(shù)字)，數(shù)字通常在0~2之間。

????????如high quality默認(rèn)權(quán)重是1；(high quality)和(high quality:1.1)是等效的，圓括號不加數(shù)字表示*1.1倍，((high quality))==(high quality:1.21)，不建議嵌套括號，看著難受不說，還可能會造成混亂。

????????同樣的還有方括號不加數(shù)字，表示/1.1，[high quality]==(high quality:0.91)。直接選中詞然后按ctrl+↑↓即可快速增加和減少權(quán)重，會表現(xiàn)為(high quality:數(shù)字)的形式。

總結(jié)一下：

????????還有更復(fù)雜的分步[關(guān)鍵詞1:關(guān)鍵詞2:數(shù)字]、嵌套[關(guān)鍵詞1|關(guān)鍵詞2]、融合關(guān)鍵詞1|關(guān)鍵詞2等等，等我搞懂再補(bǔ)充....

順序與內(nèi)容：

????????前面說過，越靠前的詞權(quán)重越大，因此對于內(nèi)容的描述，盡量按照一定的順序來，可以減少很多錯誤嘗試。比如，按照畫質(zhì),藝術(shù)風(fēng)格,主體,細(xì)節(jié),姿勢,背景的順序，只寫必要的詞、相似的放在一起等等。

????????說到這個畢竟我不是專業(yè)的，很難看出圖好不好，所以還是參考專家的話吧

翻譯一下：

????????另外需要補(bǔ)充的一點(diǎn)，除非是基礎(chǔ)模型，一般訓(xùn)練好的模型都有一些隱藏設(shè)置，比如說Trigger Words會自動觸發(fā)一些固定風(fēng)格，或者是會自動舍棄一些prompt，具體模型還是要具體分析，不能一概而論。

????????不知道怎么寫也沒關(guān)系，網(wǎng)上總是不缺大神。一個是安裝SD Web UI的tag補(bǔ)全插件，一個是網(wǎng)友自建的咒語網(wǎng)站。

b.反向提示：

????????反向提示就是描述你不想在圖中出現(xiàn)的東西。

????????我的建議是一開始只寫基礎(chǔ)的，如lowres,worst quality, low quality，后面再根據(jù)圖中出現(xiàn)的錯誤添加，比如出現(xiàn)多余的手指、腿等，就添加extra fingers,extra legs。

④：參數(shù)設(shè)置

采樣器 /Sampling method：

????????選擇采樣算法，我沒怎么嘗試，都是看別人用什么我就用什么。這里節(jié)選查資料時看到的解釋：

采樣迭代步數(shù) /Sampling Steps

????????生成圖片的迭代步數(shù)，每多一次迭代都會給 AI 變更靠近prompt。更高的步數(shù)需要花費(fèi)更多的計算時間，步數(shù)越大，圖像細(xì)節(jié)越多，但是和采樣器相關(guān)聯(lián)，詳見上圖。

分辨率（寬度和高度）

????????吃顯存，雖然說分辨率越大細(xì)節(jié)越多，即使硬件跟得上，也不建議設(shè)置過大。因?yàn)槲覀兪褂玫哪Ｐ涂赡芫褪窃谛》直媛氏掠?xùn)練的，如果設(shè)置得到過大，會有極高的幾率出現(xiàn)各種畸形。尤其不建議橫圖比例，基本必出畸形，保持正方形或者豎圖即可，橫圖可以使用圖生圖的inpating功能。

????????同時應(yīng)根據(jù)需要出圖的內(nèi)容設(shè)置，比如頭像或者半身照，默認(rèn)512即可；七分或者全身可以考慮768或者1024。

????????如果實(shí)在是想要高分辨率，就可以使用采樣器下方的高分辨率修復(fù)功能。這個同樣要選擇高清算法，如果對原始圖很滿意，這個地方直接無或者在重繪強(qiáng)度調(diào)整到0.3以下，還是那個原因，高分重繪很容易畸形。

生成批次和生成數(shù)量/Batch count、 Batch size

????????批次不同細(xì)節(jié)不同，需要計算時間；生成數(shù)量是指的每批同時生成的圖片數(shù)量，吃顯存。

提示詞引導(dǎo)系數(shù)/CFG Scale

????????就是留給AI自由發(fā)揮的空間。越大，越靠近prompt；越小，越奔放。

圖像生成種子/seed

????????-1表示每一次都是隨機(jī)種子；種子一致，參數(shù)一致，模型一致，應(yīng)該再加上個GPU一致，理論上就能生成一模一樣的圖片。

????????對生成圖片不滿需要修改時，要保持種子一致，才會保持大體的構(gòu)圖一致。

面部修復(fù)、無縫貼圖、高分辨率修復(fù)

????????面部修復(fù)這個基本可以直接忽略；無縫貼圖就是生成一個瓷磚；高分修復(fù)上面說過，這個很吃顯存。

⑤：我也不知道這個叫什么

????????這里主要說一下左側(cè)的斜箭頭以及中間的可選附加模型。

????????斜箭頭是自動填充，點(diǎn)擊會自動填充上一次出圖的prompt、參數(shù)；另一個作用上一篇講過了，就是如果我們復(fù)制了別人的Generation Data，可以直接粘貼在prompt框里，然后點(diǎn)擊小箭頭，別人的prompt、參數(shù)就會自動填充到我們的界面里。

????????可選附加模型用于輸入prompt，點(diǎn)擊以后下方會多處一欄菜單，里面是我們安裝的各種附加模型。

????????只需要點(diǎn)擊一下，就會生成對應(yīng)模型權(quán)重1的tag，直接修改即可，不用再手動輸入。

⑥：輸出欄

????????此處會顯示預(yù)覽以及成品，不用多說。

????????下方第一個文件夾按鈕，是打開輸出目錄，只能在服務(wù)端打開；

????????保存按鈕是保存當(dāng)前圖像，如果有多個，可以用第三個按鈕打包下載；

????????后面分別是將當(dāng)前圖像發(fā)送到圖生圖界面和附加功能界面。

求點(diǎn)贊O(∩_∩)O哈哈~

標(biāo)簽：AI繪畫 SD Web UI