StableDiffusion升級版SDXL:一鍵運行包ComfyUI和18G模型分享!
今天主要分享兩個東西,一個是ComfyUI軟件包,一個是SDXL的兩個模型。
有這兩個東西就可以快速出圖了
先來簡單介紹一下SDXL的特點。
Stable Diffusion XL 或 SDXL 是最新的圖像生成模型,與以前的 SD 模型(包括 SD 2.1)相比,它專為更逼真的輸出而定制,具有更詳細的圖像和構(gòu)圖。
借助 Stable Diffusion XL,您現(xiàn)在可以通過改進的臉部生成來制作更逼真的圖像,在圖像中生成清晰的文字,并使用更短的提示創(chuàng)建更美觀的藝術(shù)作品。
根據(jù)官網(wǎng)的介紹和我的關(guān)注點,大概總結(jié)一下幾個特征。
基于1024×1024訓練,更加高清,v2是768,V1.5是512。
模型很大,體積很大,參數(shù)很大,35/66億。
可以在圖片中顯示清晰的文字
人物和人臉生成效果更好
提供了多種圖像風格,大概15種。
提示詞更短,理解力上升,默認效果提升了好多。
XSDL0.9可以在官方網(wǎng)站DreamStudio在線體驗,也可以在本地離線使用。本地使用的話就需要ComfyUI和XSDL0.9的官方模型。
ComfyUI和Stable-Diffusion-WebUI的作用差不多,也是用來做AI繪畫。
關(guān)于這個軟件,大概知道以下幾點就夠了。
一個是這個軟件的界面和webui有較大的差異。
一個是它全面支持SD1.x, SD2.x 和 SDXL等AI繪畫模型。
當然也支持lora,Hypernetworks,Embeddings/Textual inversion
官方提供了集成包,支持CPU和GPU,愜意的很。
支持英偉達,ADM(Linux),蘋果電腦。
可以兼容Stable Diffusion WebUI。
然后說一下模型
目前官方只在Huggingface上發(fā)布了模型,需要填寫一個表格才能獲取。官方分享了兩個模型,一個叫Base ?12.9GB ,一個叫refiner 5.65GB(適合圖生圖)。
XSDL軟硬件要求:
操作系統(tǒng) Win10/WIN11/Linux
內(nèi)測 16GB RAM
顯卡 Nvidia RTX20+ ,AMD (Linux)
顯存 8GB+ RAM
這是官方給出的說明,我自己測試了win10/10,3060/3070都可以正常運行。
下面具體地說一下,怎么使用軟件和模型,生成圖片。
1.獲取軟件并解壓
下載鏈接:https://xueshu.fun/2748/
里面放了兩個版本的軟件,一個是包含了模型,解壓即可使用。一個是單純的軟件,下載之后添加模型即可使用。
2. 確認模型放置正確

查看如圖所示的位置,確保至少有一個模型文件。兩個都有的話,最好了。
3. 啟動軟件
確認模型已經(jīng)就位,其他就不用管了,直接點擊bat文件啟動即可。
壓縮包里面提供了兩個bat,一個是cpu,一個是GPU,根據(jù)自己情況選擇就好了。最好是有顯卡,直接選GPU。CPU的速度...
點擊bat之后,軟件很快就會啟動完成。
啟動成功后,會出現(xiàn)一個網(wǎng)址,并且會自動調(diào)用瀏覽器,打開這個網(wǎng)址。
4. 使用軟件
第一次使用軟件可能有點不知所措,不要慌,你基本不需要改什么,就能出圖了。
我稍微介紹一下,每個塊的功能。
①模型加載器(Load Checkpoint)
這個模塊主要用來加載模型,通過左右兩個箭頭可以切換模型。也可以點擊中間區(qū)域,會出現(xiàn)一個下拉列表,點擊其中一個即可選中。
選中后不會立即加載,等出圖的時候才會加載。
②提示詞輸入(CLIP Text Encode)
這就是最主要的一部分了。
這是提示詞輸入框,輸入你想要的圖的描述詞,注意要寫英文。不會的可以中文翻譯成英文。
③負向提示詞(CLIP Text Encode)
這里寫的就是你不要出現(xiàn)的東西。比如默認不要文字Text,不要水印WaterMark。
④分辨率設置(Empty Latent Image)
這里主要設置圖像的大小和一次生成的數(shù)量。大小默認可能是512×512,但是這個模型表現(xiàn)最佳的像素應該是1024×1024。我是直接切換成了1024。
數(shù)量的話默認1就可以了。如果你想批量生成,那么改一下這里就可以了。
點擊中間區(qū)域,就會跳出一個輸入框,輸入數(shù)字后,按回車就可以了。
⑤采樣器設置(Ksamper)
這里主要是設置生成參數(shù),和SDW基本類似,不懂就先不用管。
⑥ VAE設置
這個沒什么好說的,默認就好了。
⑦ 結(jié)果預覽
生成后的圖片會顯示在這里。這里有一個叫filename_prefix設置項目,作用是設置生成圖片的前綴。如果你出圖比較多,要區(qū)分不同的前綴,可以在這里改,一般不用動它。
⑧操作面板
這個面板剛打開的時候可能吸附在右上角,你可以拖動到任意位子。
這個面板上其實只要關(guān)注Queue Prompt就好了。在設置好所有參數(shù)之后,點擊這個按鈕就會開始出圖了。相當于SDW的"生成" 按鈕。
Save:保存當前配置
Load:加載已經(jīng)存在的配置
Refresh : 刷新界面
ClipSpace: 不太清楚
Clear:清除界面上的東西
Load Default : 重置界面
我們什么設置都不改直接點擊"Queue Prompt" ,軟件就會開始加載模型了。
根據(jù)你的配置不同,加載時間長短不一樣。比如我某一臺電腦中,加載了400多秒。加載的時候,內(nèi)存占用也不小。
另外一臺電腦就比較快,內(nèi)存用的也比較少。具體是什么原因還沒有排查過,可能和CPU,內(nèi)存,硬盤有關(guān)系。
這個軟件,會用綠色框來表示,當前的進度。綠色框在哪里,就表明運行到哪個步驟了。
第一次運行,模型加載處消耗的會消耗比較多的時間,后面出圖的時候基本消耗在Ksampler這里。
雖然模型很大,但是軟件出圖的時間也還好,3060上大概在10幾秒。
軟件默認的提示詞應該是"beautiful scenery nature glass bottle landscape, , purple galaxy bottle," ?大概就是生成一個紫色的"星空瓶"(這個名字是我們家娃說的)。
如果不是這個提示詞,可以點擊"Load Default" ,就會自動設置好所有參數(shù)了,包括提示詞。
生成之后,拖動邊角,可以改變這個圖片的大小。到這一步,我們就算是已經(jīng)用上XSDL0.9版本了,等1.0出來之后,只要把模型加進來就可以了。
另外,嘗試了一下昨天的關(guān)鍵詞"一個在火星上騎著白馬的宇航員" ,出效果的穩(wěn)定性感覺上沒有1.0版機器人高,但是也能出類似的圖片。
這是全部參數(shù)默認,沒有加任何附加內(nèi)容的效果圖!后面配套和攻略出來了,應該還會有巨大的提升。
另外,這個軟件還能和SDW配合使用,只要在配置文件里面做一個簡單的配置。
找到extra_model_paths.yaml.example文件,打開,修改里面的base_path。把這個地址改成你SDW文件所在地址。
設置完成后,保存文件,把.example后綴去掉。
然后重新啟動ComfyUI就可以讀取SDW里面的模型文件了。
這樣就不需要把模型搬來搬去了。
好了, 該說的都說了。
我相信只要電腦配置夠,人人都能玩起來。
ComfyUI是官方提供一鍵運行包,用起來相當方便。