學(xué)習(xí)筆記|讓數(shù)字生命更真實(shí):模型(chekpoint)和微調(diào)模型(lora)

經(jīng)過(guò)前面幾期的學(xué)習(xí),我們知道了如何搭建和使用Stable Diffusion。
不過(guò),當(dāng)你興沖沖的敲入一段英文單詞后,卻發(fā)現(xiàn)生成的圖片和預(yù)期效果相去甚遠(yuǎn)。有時(shí)候抄襲一段提示詞,居然畫(huà)面完全不一樣。
比如最近C站流行賽博朋克邊緣行者的露西,我生成的是這樣:

編輯
你生成的可能是這樣:

編輯
發(fā)生了什么?
因?yàn)橛缅e(cuò)了模型。
一、CKPT和lora
1、大模型
大模型特指標(biāo)準(zhǔn)的latent-diffusion模型。擁有完整的TextEncoder、U-Net、VAE。
由于想要訓(xùn)練一個(gè)大模型非常困難,需要極高的顯卡算力,所以絕大多數(shù)人不會(huì)訓(xùn)練大模型。
2、CKPT
經(jīng)過(guò)訓(xùn)練的圖片合集,被稱作模型,也就是chekpoint
CKPT的全稱為CheckPoint(檢查點(diǎn)),完整模型的常見(jiàn)格式,模型體積較大,一般真人版的單個(gè)模型的大小在7GB左右,動(dòng)漫版的在2-5個(gè)G之間。
早期的CKPT后綴名是ckpt,如今新的CKPT后綴名都是safetensors
3、VAE
全稱:VAE全稱Variational autoencoder。變分自編碼器,負(fù)責(zé)將潛空間的數(shù)據(jù)轉(zhuǎn)換為正常圖像。
后綴格式:后綴一般為.pt格式。
4、Lora
是一種體積較小的繪畫(huà)模型,是對(duì)大模型的微調(diào)。與每次作畫(huà)只能選擇一個(gè)大模型不同,lora模型可以在已選擇大模型的基礎(chǔ)上添加一個(gè)甚至多個(gè)。一般體積在幾十到幾百兆左右。
Lora的后綴名也是safetensors,對(duì)于小白來(lái)說(shuō),容易和ckpt造成誤解,所以講一下如何安裝。
二、CKPT和lora的安裝
對(duì)于絕大部分用戶來(lái)說(shuō),主要用得到的模型文件就兩種,一種是CKPT,一種是lora。
最好的模型下載網(wǎng)站,是傳說(shuō)中的C站,civitai.com(需科學(xué)上網(wǎng))。
CKPT的安裝路徑是models\stable-diffusion 拷貝過(guò)來(lái)即可使用(只需刷新,無(wú)需重啟服務(wù))。
Loar的安裝路徑容易搞錯(cuò),Stable Diffusion的安裝目錄下默認(rèn)有個(gè)models\lora ,但很多教程都提醒并非這個(gè)lora目錄,
而是另一個(gè):extensions\sd-webui-additional-networks\models\lora
然而事實(shí)上,默認(rèn)解壓縮好的Stable Diffusion是沒(méi)有后面這個(gè)路徑的,也不要手工創(chuàng)建,需要在Stable Diffusion的網(wǎng)頁(yè)界面進(jìn)行如下操作。
1、找到“擴(kuò)展”(英文界面的話是Extensions-Available)

編輯
2、點(diǎn)擊“加載擴(kuò)展列表”(Load from),會(huì)生成一個(gè)巨長(zhǎng)的清單

編輯
在清單里搜到Kohya-ss Additional Networks script, models,然后點(diǎn)擊安裝(install)
3、下載完成后,在已下載點(diǎn)擊“應(yīng)用更改并重載”(Apply and restart UI)。

編輯
重啟完成后,會(huì)多了個(gè)“Additional Networks”選項(xiàng)。
這個(gè)時(shí)候再去看安裝目錄,發(fā)現(xiàn) extensions\sd-webui-additional-networks\models\lora 出現(xiàn)了。
簡(jiǎn)單記憶的話:

編輯
1個(gè)G以上的safetensors拷貝到這里:
models\stable-diffusion
1個(gè)G以內(nèi)的safetensors拷貝到這里:
extensions\sd-webui-additional-networks\models\lora
不過(guò),如果偷懶,都拷貝到 models\stable-diffusion ,也不是不能用... ...
三、賽博朋克lora舉例
以賽博朋克lora為例。
1、下載AOM2的CKPT模型
https://www.123pan.com/s/ztzbVv-aTqEh.html
(請(qǐng)將地址復(fù)制到瀏覽器)
該模型文件大約5.2G,下載后拷貝到models\stable-diffusion
這是一個(gè)動(dòng)漫風(fēng)格的模型。
2、下載賽博朋克露西lora
https://www.123pan.com/s/ztzbVv-3j5Eh.html
該模型文件大約144m,下載后拷貝到extensions\sd-webui-additional-networks\models\lora3、Stable Diffusion模型選擇AOM2(abyssorangemix2SFW_abyssorangemix2Sfw)

編輯
4、lora選擇lucyCyberpunk_35Epochs

編輯
權(quán)重調(diào)整至0.6-0.8之間為最佳。
5、文生圖部分
提示詞輸入:lucy \(cyberpunk\), 1girl, arm up, asymmetrical hair, belt, bodysuit, covered mouth, covered navel, detached sleeves, grey eyes, hip vent, holding, holding weapon, looking at viewer, night, night sky, pouch, short hair, sky, solo, weapon, white hair, wire, short shorts, shorts, open jacket,
反向提示詞輸入:(painting by bad-artist-anime:0.9), (painting by bad-artist:0.9), watermark, text, error, blurry, jpeg artifacts, cropped, (normal quality:1.3), signature, username, artist name, (worst quality, low quality:1.5), lowres, bad anatomy, logo, poorly drawn face,fused fingers, (poorly drawn hand), NG_DeepNegative_V1_75T, nipples
6、其他
Vae選擇anything4或者4.5

編輯
采樣方法使用DPM++ 2M Karras
迭代次數(shù)選擇24
CFG選擇8
隨機(jī)種子輸入 2722022565
7、點(diǎn)擊生成

編輯
由于AI有時(shí)候會(huì)抽風(fēng),可以多生成一些,選取最滿意的。

編輯