AI作畫離線版V5.0,蘋果電腦也支持啦!

最近一直在做我軟件的移植工作,主要是將Windows平臺移動到mac平臺上,基本上把軟件的SD作畫、高清放大等核心功能移植過來,軟件依然是解壓即用,無需環(huán)境配置。
V5.0版本:2023-4-8
1、 蘋果版僅限于M系列芯片,目前功能完成SD作畫(支持sd模型導(dǎo)入、VAE模型、LORA模型),文生圖,圖生圖;
2、 支持高清放大圖片功能;
3、 支持音視頻轉(zhuǎn)文字功能;
4、 支持三次元生成功能;
5、 支持AI寫小說功能;
6、 其他windows端功能正在補充中。
01 軟件概覽
軟件名字叫做:AI作畫離線版V5.0(Stable Diffusion),基于GitHub上的開源項目Stable Diffusion。
如下,軟件主界面,還是以操作簡單為主:

安裝很簡單,按照如下步驟來就行
第一步:搜索找到終端,如下

打開終端,然后輸入sudo spctl --master-disable,回車,輸入密碼即可。

第二步:下載網(wǎng)盤的AI作畫離線版壓縮包,解壓;
第三步:解壓的路徑中找到DD5_V5,雙擊打開,注意第一次加載比較慢,幾十秒后會彈出如下主界面:

功能一:SD(Stable Diffusion)作畫
1、描述詞設(shè)定:描述詞句式基本和DD一樣,但SD作畫多了個負描述,負描述默認可以不寫,負描述如果寫,就代表不想讓繪畫結(jié)果出現(xiàn)的元素。

支持寫個開頭,然后如下點擊AI生成描述進行續(xù)寫描述,目前有一種自動寫描述引擎了:

2、繪圖參數(shù):圖片尺寸需要64的倍數(shù),當然隨便填寫尺寸也行,軟件會自動轉(zhuǎn)換;繪圖步數(shù)SD步數(shù)20就夠了,多了沒啥意義;繪制圖片輪數(shù)代表每次畫幾張圖;描述相關(guān)度默認數(shù)值就可以,當然可以嘗試10以上數(shù)值;隨機種子默認0,代表每次種子隨機,設(shè)置大于零的固定值,如果其他參數(shù)一樣,則SD出圖完全一樣。

3、參考圖:支持參考圖,不過參數(shù)比較簡單,基本上就是導(dǎo)入原圖,修改描述,設(shè)置圖片差異度參數(shù)即可,注意差異度參數(shù)范圍0-1,1代表與參考圖差異最大哈。另外,自適應(yīng)尺寸比較人性化,比如參考圖尺寸寬高為1024x512,繪圖參數(shù)尺寸設(shè)置512×512,默認無,代表不自適應(yīng),最終出的圖尺寸為512×512,固定寬代表,以繪圖參數(shù)尺寸設(shè)置的寬512為準,參考圖寬高比2比1,高自動修改為256,最終輸出512x256的圖。
如下,試試SD參考圖,實現(xiàn)真人參考圖用二次元描述實現(xiàn)真人二次元效果:


4、自定義SD模型選擇:支持選擇第三方ckpt、safetensors格式的SD模型以及VAE模型,如下所示,選擇模型所在路徑即可實現(xiàn)利用第三方SD模型作畫。注意的是導(dǎo)入的模型要區(qū)分是SD一代還是二代,在下拉列表里自行選擇,否則報錯。
支持lora、SD、VAE模型導(dǎo)入。

如下演示,三大模型相互結(jié)合畫的一些圖:






5、DeepDanbooru二次元TAG解析:如下點擊按鈕,支持二次元圖片的TAG解析,諸如NovelAI等模型比較有需求:

6、幫助相關(guān):對于大多數(shù)參數(shù),都加入了幫助按鈕,鼠標劃到對應(yīng)幫助圖標,駐留即可顯示參數(shù)含義,當然大多數(shù)都是翻譯的官方文檔,加入自己的一點注解。
7、導(dǎo)入配置:支持導(dǎo)入圖片輸出目錄images_out文件下的DD作畫json配置文件或者生成的圖片,如下點擊導(dǎo)入配置按鈕即可:

8、AI圖片描述解析:如下按鈕點擊,選擇圖片,稍等片刻即可顯示出描述,當然這個描述有所出入,但當作描述來用畫出的圖也確實不錯。
下面演示幾張圖,解析出來的描述:
a couple of people riding bikes down a road, a matte painting by Makoto Shinkai, featured on pixiv, rayonism, official art, anamorphic lens flare, matte painting

a group of iron man standing next to each other in the ocean, a comic book panel by Paul Pelletier, featured on deviantart, antipodeans, marvel comics, reimagined by industrial light and magic, imax

功能二:圖片AI高清放大
設(shè)置不同的放大模型和圖片放大倍數(shù),高清放大圖片輸出目錄為軟件目錄\images_out\AI_ultra_HD,支持2-10倍放大。

AI高清放大是一個獨立功能,軟件主界面點擊高清放大按鈕,選擇圖片(支持批量),即可高清放大圖片。
如下,小圖經(jīng)過高清放大的對比效果,二次元和三次元都能勝任。


功能三:三次元生成
點擊三次元生成按鈕,即可繪制多張三次元全身圖:


如下點擊AI寫小說按鈕,設(shè)置開頭,即可續(xù)寫不同輪數(shù)的文字:

點擊音視頻轉(zhuǎn)文字按鈕,選擇音頻或者視頻,即可進行語音識別,輸出字幕和文字版txt文件。
音視頻轉(zhuǎn)文字功能,支持100多個國家語言,若選擇漢語,則不過什么語言的音視頻,最終都會自動翻譯成中文字幕和txt文件,方便快捷,不過翻譯效果有限,最好還是選擇原視頻語言進行識別。

如下,選取的日文視頻演講識別字幕效果,紅框為軟件識別自動翻譯的字幕:

04 配置要求
需要M系列芯片,且mac os 12或者13版本。
05 小結(jié)
這個項目確實很有意思,感興趣的可以體驗一下5.0版本了,更詳細的作圖參數(shù)、教程多刷刷B站相關(guān)視頻即可。