新增對稱模式繪畫,AI作畫Disco Diffusion離線版V3.5來啦!

本周V3.5帶來了對稱繪制模式,這個功能可以實現(xiàn)對稱風格的圖畫生成,包括水平、垂直、水平垂直全對稱的形式,如下為我測試的各種對稱風格圖片,從圖中看到也不一定非常對稱哈:






V3.5版本:2022-06-181、添加Disco Diffusion V5.3的對稱功能,可以在參數(shù)設置里設置水平和垂直對稱;??2、修復AI圖片高清放大功能放大中文路徑圖片無法保存的問題;??3、網(wǎng)盤里刪減無用的包,現(xiàn)在軟件體積整體變小了,且模型庫分為必裝的模型包和可選的模型包,可選模型包僅在需要的時候下載即可。
再來幾張我用離線版跑常規(guī)模式DD5跑的圖:







01?軟件概覽
軟件名字叫做:AI作畫離線版V3.5(基于Disco Diffusion 5.3),基于GitHub上的開源項目Disco Diffusion,目前僅支持靜態(tài)圖生成。如下,軟件主界面,還是以操作簡單為主:

如下參數(shù)設置界面,靜圖生成的相關(guān)參數(shù)都囊括在內(nèi)了,如下新增的水平和垂直對稱模式,可以設置開啟和關(guān)閉:

02?軟件體驗
軟件非常大,因為有很多離線模型,當然下載過2代的,這些模型可以復用哈。下載完成后,按照網(wǎng)盤里的word教程即可進行體驗。
一、安裝
1、解壓AI作畫離線版V3.5完整版.zip,生成AI作畫離線版V3.5完整版目錄;
2、網(wǎng)盤里安裝必備模型包1.zip、安裝必備模型包2.zip兩個壓縮包是AI作畫等功能必備的模型,都解壓到AI作畫離線版V3.5完整版目錄中;
3、網(wǎng)盤里安裝可選模型包.zip這個壓縮包是AI作畫等功能可選的模型,顯存大的用戶可以下載,也是解壓到AI作畫離線版V3.5完整版目錄中;
4、進入軟件目錄AI作畫離線版V3.5完整版,雙擊打開DD5_V3.5.exe程序即可,稍等,第一次打開慢。?
注:后續(xù)網(wǎng)盤目錄會發(fā)布更新的版本,諸如DD_V3.5升級到DD_V3.6.zip,下載解壓到AI作畫離線版V3.5完整版,然后打開DD_V3.6.exe即可運行3.6版本,提示覆蓋的覆蓋就行。軟件界面如下所示:

二、作圖配置
軟件目錄文件夾的settings.json就是作圖配置文件,當然3.0版本通過界面進行設置了。
1、描述詞設定:描述詞之前手動修改json文件經(jīng)常有小伙伴少輸入標點導致出錯,界面化可以避免這個問題,如下默認的描述,每段(回車換行算一段)都是同一描述的不同權(quán)重關(guān)鍵詞。

上面的描述對應的手動修改json如下,也就是界面化無需引號、逗號來分割同一描述的不同權(quán)重部分。

2、幫助相關(guān):對于大多數(shù)參數(shù),都加入了幫助按鈕,鼠標劃到對應幫助圖標,駐留即可顯示參數(shù)含義,如下所示,當然大多數(shù)都是翻譯的官方文檔,加入自己的一點注解。

如果想要加入自己對參數(shù)的注釋,可以修改軟件目錄下的tip.json,如下對應的描述修改即可,\n為換行。

3、參考圖:參考圖也人性化了,直接點擊按鈕選擇圖片即可,注意看參數(shù)旁邊的問號,一般加入?yún)⒖紙D時,skip_steps這個參數(shù)需要設置大一些。

參考圖的可玩性很高,比如下圖在第一張扇子基礎上就可以創(chuàng)作比較不錯的圖:



4、AI作畫引擎選擇:參數(shù)設置里提供兩種繪圖Diffusion模型引擎選擇,原版DD和像素版DD,如下圖設置:

像素模式作畫引擎也可以試試,如下就是像素風格的圖,也挺有意思:




5、AI高清放大:設置不同的放大模型和圖片放大倍數(shù),高清放大圖片輸出目錄為軟件目錄\images_out\AI_ultra_HD,當輸入的圖片尺寸很大時,容易超顯存,這時我們修改拼圖大小這個參數(shù)即可,比如設置拼圖大小512時,6G顯存選擇realesrgan_x4plus模型對1920*1080圖片進行4倍放大測試不超顯存。

AI高清放大是一個免費的獨立功能,如下軟件主界面點擊AI高清放大按鈕,選擇圖片(支持批量),即可高清放大圖片。

如下,小圖經(jīng)過高清放大的對比效果,二次元和三次元都能勝任。





6、AI繪畫輸出圖片目錄:軟件目錄\images_out;
7、AI圖片轉(zhuǎn)3D輸出視頻目錄:軟件目錄\video;AI圖片轉(zhuǎn)3D也是一個獨立免費功能,如下參數(shù)設置可以設置生成視頻時長和攝像頭位置(位置一般不改):

然后,如下軟件主界面點擊AI圖片轉(zhuǎn)3D,選擇圖片(支持批量),轉(zhuǎn)換圖片成如下的視頻形式,這個轉(zhuǎn)換速度較慢,5到30分鐘一張圖。

基本上就是原作項目介紹的這種效果,一張精圖轉(zhuǎn)換成3D的效果,不過相比原作我做了改進,支持原圖尺寸大小的視頻。

8、過程圖片:軟件目錄\progress.png,每幾個step(頻率display_rate可配置)更新一次圖片。
三、顯卡要求
需要至少5GB顯存,且必須是英偉達顯卡,AMD不支持。各種顯存測試參數(shù)可參考:https://docs.qq.com/sheet/DTGxSSkNJcnVhV1VP。
注:默認參數(shù)因為選了3個CLIP模型,如果想要尺寸更大,少選幾個模型即可,但效果肯定有所影響,諸如6G獨顯的2060或者1060顯卡,只選如下第一個模型,尺寸768×512都沒問題:

四、常見錯誤
1、爆顯存
下面這些都是圖片設置過大導致的爆顯存,或者5GB以下的顯卡:
(1) Unable to find a valid cuDNN algorithm to run convolution
(2) CUDA out of memory
2、黑圖
很多小伙伴生成的圖一直是黑的,這種貌似是10代及以下顯卡,目前發(fā)現(xiàn)的1660、1660s、1660ti都有問題,原因是中途生成NAN數(shù)據(jù),解決方案正在尋找,但1060沒有問題,看來問題都在16代顯卡上。
03?小結(jié)
這個項目確實很有意思,唯一的問題就是對顯卡要求高,最起碼得英偉達5G以上獨顯,另外還有一些坑要填,諸如很多網(wǎng)友感興趣的gobig、描述里添加藝術(shù)家、色彩等關(guān)鍵詞庫等,這個得慢慢來了,但后續(xù)版本肯定會有,感興趣的可以體驗一下3.5版本了,更詳細的作圖參數(shù)、教程多刷刷B站相關(guān)視頻即可。