史詩級(jí)升級(jí),AI繪圖圈迎來SDXL 1.0


2023年7月27日,AI繪圖圈一個(gè)里程碑的日子。
今天,Stability AI正式發(fā)布了下一代文生圖模型—SDXL 1.0。官方聲稱,SDXL 1.0擁有目前所有開放式圖像模型中最大的參數(shù)數(shù)量,采用了創(chuàng)新的新架構(gòu),包括一個(gè)擁有35億參數(shù)的基礎(chǔ)模型和一個(gè)66億參數(shù)的優(yōu)化模型。
在月初的時(shí)候,Stability AI放出了SDXL 0.9的試玩版,我進(jìn)行了介紹,并講解了當(dāng)時(shí)支持SDXL 0.9的工具ComfyUI。
短短兩周,最常用的Stable Diffusion工具WebUI迅速緊跟升級(jí),對(duì)SDXL 0.9進(jìn)行了支持(事實(shí)上,0.9和1.0區(qū)別不大,所以1.0發(fā)布后,WebUI就支持1.0了)。
在SDXL1.0發(fā)布后幾小時(shí),WebUI也跟著做了個(gè)版本號(hào)更新,升級(jí)為1.5.1。
SDXL 1.0的試用非常簡單,只需要把兩個(gè)大模型文件拷貝到models\Stable-diffusion 即可(同時(shí)需要專用的VAE模型,文末附下載)。
經(jīng)過簡單的試用,發(fā)現(xiàn)有些插件需要等待升級(jí)。
簡單總結(jié)下SDXL1.0的特點(diǎn):
1、絕大多數(shù)lora都無法在SDXL1.0的模型下使用。
也就是說,如果使用SDXL1.0的模型,提示詞里不要出現(xiàn)lora。
當(dāng)然了,很多模型創(chuàng)作者正在連夜改模型,預(yù)計(jì)很快將涌現(xiàn)出一大批支持SDXL1.0的新模型。
2、、SDXL1.0的模型對(duì)自然語言的理解能力遠(yuǎn)遠(yuǎn)大于Stable Diffusion 1.5。
在Stable Diffusion1.5下,我們往往需要用各種復(fù)雜的提示詞來強(qiáng)調(diào)畫面的細(xì)節(jié),甚至還要給出特定的權(quán)重。而SDXL1.0能夠輕松的理解自然語言。
可以直接輸入句子(英文),然后繪制出驚喜的效果。
3、SDXL1.0繪制的畫面細(xì)膩程度非常高。
如果是照片模式(比如輸入相機(jī)參數(shù)),則畫面逼近真實(shí)拍攝。

4、修臉的After Detailer插件支持SDXL1.0。
5、Roop插件支持SDXL1.0。
6、ControlNet暫不支持SDXL1.0。
不過,官方放出了正在適配中的新版ControlNet的預(yù)覽效果,非常驚艷。

7、SDXL1.0繪圖賞析:
(1)彈吉他的男人
提示詞:
Canon 6D, 35mm, standing in the sunset of the city, smiling and playing the guitar as a man , HDR,UHD,8K, best quality ?
負(fù)面提示詞:
nsfw,logo,text,badhandv4,EasyNegative,ng_deepnegative_v1_75t,rev2-badprompt,verybadimagenegative_v1.3,negative_hand-neg,mutated hands and fingers,poorly drawn face,extra limb,missing limb,disconnected limbs,malformed hands,ugly,FastNegativeV2,aid291,NegfeetV2
作為一個(gè)攝影師,我比較喜歡用相機(jī)參數(shù),發(fā)現(xiàn)SDXL1.0對(duì)相機(jī)參數(shù)理解蠻到位。

(手指依然畫的很糟糕)
(2)一個(gè)夾雞蛋的牛肉漢堡
提示詞:
Canon 6D, 35mm, HDR,UHD,8K, best quality ,A hamburger with beef and eggs in it

這個(gè)真實(shí)度,貌似可以商業(yè)應(yīng)用了。
(3)換個(gè)動(dòng)漫畫風(fēng):山谷里的巨大機(jī)器人
提示詞:
Anime style, giant robots in the valley

讓人驚訝的是,同一個(gè)模型,在沒有使用任何lora(還沒有創(chuàng)作者改好)的情況下,畫出的真實(shí)風(fēng)格和動(dòng)漫風(fēng)格完全不同!
這在Stable Diffusion 1.5的時(shí)代,幾乎是不可能的,一般需要兩個(gè)不同的模型才能實(shí)現(xiàn)。
(4)抱著貓的女孩
提示詞:
Sony A7,50mm,A girl holding a cat on the streets of the city , best quality, HDR,UHD,8K

這次我換了索尼相機(jī),我比較喜歡用定焦,選了50mm焦段。
(5)第一個(gè)適配SDXL的“民間”模型:DreamShaper
SDXL發(fā)布后,迅速涌現(xiàn)了一大批支持的模型,其中最知名的是DreamShaper。

DreamShaper是C站最受歡迎且下載量最高的模型之一,在SDXL0.9發(fā)布的時(shí)候,該模型就做了適配。SDXL1.0發(fā)布后,迅速推出了DreamShaper XL1.0 Alpha2。
從版本號(hào)可以看出,這個(gè)版本尚不完善。
作者的介紹:
盡管這仍然是一個(gè)alpha版本,但我認(rèn)為與基于xl0.9的第一個(gè)alpha版本相比已經(jīng)有了很大改進(jìn)。
對(duì)于你需要的工作流程,你需要Math插件進(jìn)行舒適配置(或者手動(dòng)重新實(shí)現(xiàn)某些部分)。
基本上,我先用DreamShaperXL生成第一張圖片,然后將其上采樣到2倍大小,最后使用DreamShaperXL本身或者適合的1.5模型(如DreamShaper7或AbsoluteReality)進(jìn)行img2img(圖生圖)。
相比SDXL1.0它做得更好的地方是什么?
- 不需要refiner。只需做高分辨率修復(fù)(上采樣+i2i)
- 更美觀的人物
- 邊緣模糊減少
- 75%更好的龍
- 更好的NSFW
我的眼神比較好,更好的NSFW,嗯,果然是LSP們的最愛。當(dāng)然了,本文是絕對(duì)不可能放NSFW圖的。
提示詞:
photo of beautiful age 18 girl, pastel hair, freckles sexy, beautiful, close up, young, dslr, 8k, 4k, ultrarealistic, realistic, natural skin, textured skin

果然很夢(mèng)幻,要比SDXL1.0發(fā)布的模型更美膩。

8、各種下載:
(1)SDXL1.0兩個(gè)大模型:
https://www.123pan.com/s/ueDeVv-A20I.html?提取碼:lgyh
(2)SDXL1.0專用VAE:
https://www.123pan.com/s/ueDeVv-920I.html?提取碼:lgyh
(3)DreamShaper XL1.0 Alpha2:
https://www.123pan.com/s/ueDeVv-E20I.html?提取碼:lgyh