Stable Diffusion 圖像生成mac環(huán)境搭建

圖像生成
說到圖像生成,大家首先會(huì)想到的是Mid Journey,stable diffution等。AI生產(chǎn)圖片已經(jīng)可以做到以假亂真的地步了,那么是不是設(shè)計(jì)的飯碗被端了呢? 其實(shí)不然。首先生成的圖片需要一定的學(xué)習(xí)成本,其次生成出來的圖片到實(shí)際預(yù)期的還是有一定的差距,需要二次開發(fā)。 那如果想嘗試一下自己生成一張美麗的照片,那么你可以往下接著看看。





環(huán)境安裝
本機(jī)設(shè)備信息
需要準(zhǔn)備下載的工具和環(huán)境
安裝python,版本大于3.9
如果發(fā)現(xiàn)沒有brew環(huán)境,則先搜索一下mac 怎么安裝brew環(huán)境,或者嘗試以下命令??
2. 安裝git環(huán)境
3. 下載stable diffution項(xiàng)目工程
cd stable diffution項(xiàng)目工程,到該項(xiàng)目的根目錄下
運(yùn)行./webui.sh
然后會(huì)下載相關(guān)的依賴庫,如果有超時(shí)就繼續(xù)再次運(yùn)行./webui.sh。運(yùn)行成功后會(huì)看到如下內(nèi)容:
4. 在瀏覽器中輸入地址:127.0.0.1:7860

6. 選擇模型
?項(xiàng)目中是沒有模型的,因此可以在以下網(wǎng)站下載一個(gè)你喜歡的模型,將其放在stable-diffusion-webui/models/Stable-diffusion/目錄下
https://civitai.com/
https://www.liblibai.com/?bd_vid=11719361535012367531#/
https://tusi.art/
https://www.liandange.com/
7.?點(diǎn)擊generate,在inter的mac電腦,會(huì)報(bào)錯(cuò)

參數(shù)介紹
Stable Diffusion checkpoint
選擇模型
txt2img
文字生成圖片
img2img
圖片生成圖片
Extras
這可“無損”放大圖片
PNG info
sd生成的圖片,通過這可以看到詳細(xì)的信息,比如prop等
Checkpoint Merger
合并不同的模型,生成新的模型
Train
自己煉 embedding 或者 hypernetwork
Settings 設(shè)置
設(shè)置頁面
Extensions
擴(kuò)展
Prompt
正向提示詞,用文字描述你想要生成的東西
negative Prompt
反向提示詞

tag語法
分隔:不同的關(guān)鍵詞tag之間,需要使用英文逗號(hào),分隔,逗號(hào)前后有空格或者換行是不礙事的
ex:1girl,loli,long hair,low twintails(1個(gè)女孩,loli,長發(fā),低雙馬尾)
混合:WebUi 使用 | 分隔多個(gè)關(guān)鍵詞,實(shí)現(xiàn)混合多個(gè)要素,注意混合是同等比例混合,同時(shí)混。
ex: 1girl,red|blue hair, long hair(1個(gè)女孩,紅色與藍(lán)色頭發(fā)混合,長發(fā))
增強(qiáng)/減弱:有兩種寫法
ex: ((loli)),((one girl)),(cat ears),[flower hairpin]和第一種寫法等價(jià)
ex: ,(loli:1.21),(one girl:1.21),(cat ears:1.1),(flower hairpin:0.9)
第一種 (提示詞:權(quán)重?cái)?shù)值):數(shù)值從0.1~100,默認(rèn)狀態(tài)是1,低于1就是減弱,大于1就是加強(qiáng)
第二種 (((提示詞))),每套一層()括號(hào)增強(qiáng)1.1倍,每套一層[]減弱1.1倍。也就是套兩層是1.1*1.1=1.21倍,套三層是1.331倍,套4層是1.4641倍。
漸變:比較簡單的理解時(shí),先按某種關(guān)鍵詞生成,然后再此基礎(chǔ)上向某個(gè)方向變化。
ex:a girl with very long [white:yellow:16] hair 等價(jià)為開始 a girl with very long white hair,16步之后a girl with very long yellow hair
[關(guān)鍵詞1:關(guān)鍵詞2:數(shù)字],數(shù)字大于1理解為第X步前為關(guān)鍵詞1,第X步后變成關(guān)鍵詞2,數(shù)字小于1理解為總步數(shù)的百分之X前為關(guān)鍵詞1,之后變成關(guān)鍵詞2
交替:輪流使用關(guān)鍵詞
[cow|horse] in a field比如這就是個(gè)牛馬的混合物,如果你寫的更長比如[cow|horse|cat|dog] in a field就是先朝著像牛努力,再朝著像馬努力,再向著貓努力,再向著狗努力,再向著馬努力
Sampling method
Euler a :富有創(chuàng)造力,不同步數(shù)可以生產(chǎn)出不同的圖片
Euler:最最常見基礎(chǔ)的算法,最簡單的,也是最快的。
DDIM:收斂快,一般20步就差不多了
LMS:eular的延伸算法,相對更穩(wěn)定一點(diǎn),30步就比較穩(wěn)定了
PLMS:再改進(jìn)一點(diǎn)LMS
DPM2:DDIM的一種改進(jìn)版,它的速度大約是 DDIM 的兩倍
采樣方法,采樣器
Sampling steps
30~50
步數(shù)越多,時(shí)間越長
采樣迭代步數(shù)
Hires. fix
放大算法:如果不知道選什么,一般無腦選“ ESRGAN_4x ”
重繪幅度:放大后修改細(xì)節(jié)的程度,從0到1,數(shù)值越大,AI創(chuàng)意就越多,也就越偏離原圖。
Upscale by :放大倍數(shù),在原有寬度和長度上放大幾倍,注意這個(gè)拉高需要更高的顯存的。
超分辨率,再通過算法提高圖片到高分辨率
Width && Height
寬 && 高,單位像素
常見的模型基本在512×512和768X768
分辨率過高,圖片質(zhì)量會(huì)隨著分辨率的提高而變差
CFG Scale
提示詞相關(guān)性,圖像與你的提示的匹配程度。
一般在5~15之間為好,7,9,12是3個(gè)常見的設(shè)置值。
Seed
隨機(jī)種子
相同的種子可以多次生成(幾乎)相同的圖像。
如果你用某個(gè)種子在某tag下生成了很棒的圖,保持種子數(shù)不變,而稍微改一點(diǎn)點(diǎn)tag,增減一點(diǎn)細(xì)節(jié),一般得到的圖也會(huì)不錯(cuò)。
Script
選擇None