周末繼續(xù)肝,AI作畫離線版V3.0來(lái)了!

V2.0版本還是有些細(xì)節(jié)沒(méi)有修補(bǔ)完,因?yàn)楹罄m(xù)想要繼續(xù)加其他功能,但2.0的架構(gòu)已經(jīng)不滿足我的需求。
所以周末繼續(xù)肝,改架構(gòu)。
定為3.0版本吧。
V2.0+版本用戶請(qǐng)注意,V3.0版本啟用新的架構(gòu),所以pic_disco.zip這個(gè)壓縮包要重新下載了,激活碼不變,vgg16-397923af.pth的這個(gè)文件移動(dòng)到軟件目錄的models文件夾即可。
V3.0版本:2022-05-14
1、相比V2.0+版本,引入新的內(nèi)核架構(gòu),測(cè)試性能提升5%~10%;
2、上個(gè)版本爆顯存的彈窗指示不夠完善,刪掉此功能,爆顯存依然通過(guò)黑窗CUDA OUT OF MEMORY查看;
3、啟動(dòng)時(shí),黑窗的引起誤會(huì)的warning去除掉了;
4、簡(jiǎn)化V2.0版本的安裝要求,將移動(dòng)到C盤用戶文件夾下的vgg16-397923af.pth模型,也歸屬到models文件夾,現(xiàn)在安裝就很簡(jiǎn)單了,兩部操作:解壓到pic_disco文件夾;models文件夾移動(dòng)到pic_disco文件夾即可完成安裝。
來(lái)幾張網(wǎng)友用離線版跑的圖:




后面是給新用戶看的,老用戶可以不看!
01 軟件概覽
軟件名字叫做:AI作畫(Disco Diffusion 5.2)小工具離線版V3.0,基于GitHub上的開(kāi)源項(xiàng)目Disco Diffusion。如下,軟件主界面,還是以操作簡(jiǎn)單為主。

02 軟件體驗(yàn)
軟件非常大,因?yàn)橛泻芏嚯x線模型。下載完成后,按照網(wǎng)盤里的word教程即可進(jìn)行體驗(yàn)。
一、安裝
1、解壓pic_disco.zip,生成pic_disco目錄;
2、網(wǎng)盤里的models文件夾移動(dòng)到pic_disco目錄中;?
3、打開(kāi)軟件,進(jìn)入軟件目錄pic_disco,雙擊打開(kāi)DD5_V3.0.exe程序即可。
二、作圖配置
主目錄pic_disco文件夾的settings.json就是作圖配置文件,當(dāng)然3.0版本通過(guò)界面進(jìn)行設(shè)置了。
1、描述詞設(shè)定:描述詞之前手動(dòng)修改json文件經(jīng)常有小伙伴少輸入標(biāo)點(diǎn)導(dǎo)致出錯(cuò),界面化可以避免這個(gè)問(wèn)題,如下默認(rèn)的描述,每段(回車換行算一段)都是同一描述的不同權(quán)重關(guān)鍵詞。

上面的描述對(duì)應(yīng)的手動(dòng)修改json如下,也就是界面化無(wú)需引號(hào)、逗號(hào)來(lái)分割同一描述的不同權(quán)重部分。

同時(shí)加入,權(quán)重和為0的報(bào)警,節(jié)省時(shí)間。

2、幫助相關(guān):對(duì)于大多數(shù)參數(shù),都加入了幫助按鈕,鼠標(biāo)劃到對(duì)應(yīng)幫助圖標(biāo),駐留即可顯示參數(shù)含義,如下所示,當(dāng)然大多數(shù)都是翻譯的官方文檔,加入自己的一點(diǎn)注解。

如果想要加入自己對(duì)參數(shù)的注釋,可以修改軟件目錄下的tip.json,如下對(duì)應(yīng)的描述修改即可,\n為換行。

3、參考圖:參考圖也人性化了,直接點(diǎn)擊按鈕選擇圖片即可。

4、輸出圖片目錄:pic_disco\images_out;
5、過(guò)程圖片:pic_disco\progress.png,每幾個(gè)step(頻率display_rate可配置)更新一次圖片。
三、顯卡要求
可能需要至少6GB顯存,以下為測(cè)試情況:
(1) RTX2060 6G獨(dú)顯,圖片尺寸256x512可行;
(2) RTX1070 8G獨(dú)顯,250steps耗時(shí)預(yù)估2小時(shí),圖片尺寸1280x720;
(3) RTX2070S 8G獨(dú)顯,450steps耗時(shí)預(yù)估16分鐘,圖片尺寸960x448;
(4) RTX3090 24G獨(dú)顯,450steps耗時(shí)預(yù)估10分鐘,圖片尺寸1280x720。
注:默認(rèn)參數(shù)因?yàn)檫x了3個(gè)CLIP模型,如果想要尺寸更大,少選幾個(gè)模型即可,但效果肯定有所影響,諸如6G獨(dú)顯的2060顯卡,之選如下第一個(gè)模型,尺寸768×512都沒(méi)問(wèn)題:

1、爆顯存
下面這些都是圖片設(shè)置過(guò)大導(dǎo)致的爆顯存,或者6GB以下的顯卡:
(1) Unable to find a valid cuDNN algorithm to run convolution
(2) CUDA out of memory
2、黑圖
很多小伙伴生成的圖一直是黑的,這種貌似是10代及以下顯卡,目前發(fā)現(xiàn)的1060、1660、1660ti都有問(wèn)題,原因是中途生成NAN數(shù)據(jù),解決方案正在尋找。
五、激活
軟件點(diǎn)擊生成按鈕后,會(huì)彈出激活窗設(shè)定,按照指示聯(lián)系我獲取激活碼即可。
04 小結(jié)
這個(gè)項(xiàng)目確實(shí)很有意思,唯一的問(wèn)題就是對(duì)顯卡要求高,最起碼得6G以上獨(dú)顯,想要高清720P,得8~12G獨(dú)顯左右,另外還有一些坑要填,諸如很多網(wǎng)友感興趣的gobig、中途暫停、描述里添加藝術(shù)家、色彩等關(guān)鍵詞庫(kù)等,這個(gè)得慢慢來(lái)了,但后續(xù)版本肯定會(huì)有,感興趣的可以體驗(yàn)一下3.0了,更詳細(xì)的作圖參數(shù)、教程多刷刷B站相關(guān)視頻即可。
05 本期內(nèi)容獲取
(1)百度網(wǎng)盤鏈接:鏈接:https://pan.baidu.com/s/1B0g4MPFe_drP_hRjgEnKGg?提取碼:95kh
(2)天翼網(wǎng)盤鏈接:https://cloud.189.cn/t/ZZ7vuyZrMvmm?(訪問(wèn)碼:7dn8)
(3)谷歌網(wǎng)盤鏈接:https://drive.google.com/drive/folders/1mBtw3oz9rCsQflt5xzDw08Z9VRMDoB_T?usp=sharing