分享下我目前調(diào)試出來(lái)速度最優(yōu)的stablediffusion配置
先說(shuō)明一下,我機(jī)器比較垃圾,還是3700X CPU 48G DDR 2400?內(nèi)存,4090?顯卡 ,PCIE 3.0 SSD.
目前我在windows?下調(diào)試出來(lái)的SD最優(yōu)最穩(wěn)定配置如下
cuda: 11.8
cudnn: 8700
driver: 531.29?
arch: AMD64
cpu: AMD64 Family 23 Model 113 Stepping 0, AuthenticAMD
system: Windows
release: Windows-10-10.0.22621-SP0
python: 3.10.11
2.0.0+cu118 autocast? half
NV新版531.61之后的顯卡驅(qū)動(dòng)顯卡驅(qū)動(dòng),會(huì)更加積極調(diào)用內(nèi)存來(lái)彌補(bǔ)顯存不足,直接導(dǎo)致了生成過(guò)程中VAE模型最后渲染的部分嚴(yán)重卡頓,我嘗試過(guò)最新版,速度有很大下降,不建議使用。
包括新版的CUDA,效果都不算理想。優(yōu)化模式我選擇:sdp none
這是我測(cè)試的結(jié)果,可以參考,但是具體還是要執(zhí)行system?info?的基準(zhǔn)測(cè)試來(lái)調(diào)試最合適你機(jī)器的方案。
https://github.com/vladmandic/sd-extension-system-info
安裝這個(gè)插件即可。
—————————————————————————————————————————
關(guān)于加速,
GitHub - NVIDIA/Stable-Diffusion-WebUI-TensorRT項(xiàng)目
關(guān)于GitHub - NVIDIA/Stable-Diffusion-WebUI-TensorRT項(xiàng)目,用了它就不能用unet,controlnet 和其他生態(tài)基本不能用
可以用Lora,需要用TensorRT LoRA去創(chuàng)建一個(gè)lora引擎,剛才已測(cè)試。它會(huì)根據(jù)你當(dāng)下選擇的大模型+lora生成一個(gè)獨(dú)立的Lora+大模型的引擎
速度會(huì)有略微提升,但是毫無(wú)疑問(wèn),所有unet?相關(guān)功能都不能用了。
用animatediff就別想著用了。
如果你只想要畫圖,那可以用這個(gè),如果需要更多動(dòng)畫生產(chǎn),不建議使用這個(gè)。