(圖文+視頻)老鹿學Ai繪畫:Stable Diffusion的安裝、文生圖以及繪圖初體驗


秋葉Stable Diffusion離線整合包:
鏈接:https://pan.baidu.com/s/1mFVMrrTt3alIywrCHCLj7A?
提取碼:6666?
C站地址:https://civitai.com/(需魔法上網(wǎng))
更新不易 且看且珍惜
歡迎鹿友三連支持
今天分享內(nèi)容的視頻版如下,視頻已添加進度條,大家可以根據(jù)自己的需求拖動到想要觀看的部分:

以下是圖文版內(nèi)容:
正文共:3399字 68圖
預計閱讀時間:9分鐘
最近Ai繪圖真的太火了,擋都擋不住。
本著“不斷好奇,不停學習”的理念,我打算再開野鹿志的一個新支線任務:老鹿學Ai繪圖。
在開啟新的支線任務之前,這里先說明一下,由于我本人不是設計師,不是程序員,更不是專業(yè)的Ai從業(yè)者,僅僅是個業(yè)余軟件愛好者。
因此寫的內(nèi)容的大部分認知僅限于軟件操作以及從網(wǎng)絡上學來的一點點理論知識并加上自己的理解分享給大家。
如果過程中存在不夠?qū)I(yè),不夠準確的地方請各位鹿友見諒,我水平就這樣。(狗頭保命)

另外關于軟件的選擇,我只知道兩款最火的Ai繪圖工具:Midjourney和Stable Diffusion。
Midjourney的效果很好,使用起來相對學習成本低一些,但是它付費的,并且要使用完整功能一年下來費用也不低:

而Stable Diffusion作為開源軟件,我們可以通過一些操作進行離線免費使用,效果也不錯并且可玩性更高一些,因此我的選擇是Stable Diffusion。(以下簡稱SD)
使用離線版SD,mac系統(tǒng)和win系統(tǒng)都可以用,本文所有內(nèi)容均基于win系統(tǒng)進行介紹,mac系統(tǒng)的鹿友可能需要在網(wǎng)上找找其他相關的教程。
另外使用SD對系統(tǒng)的硬件也有一定的要求:
1、內(nèi)存至少16G,越大越好。
2、顯卡最好是N卡,顯存同樣越大越好:
至少4G,勉強能出圖。
6G稍微好一點,可能部分功能無法使用。
8G除了大模型訓練不行,其他功能都可以用。
12G及以上則無任何限制。(我的顯卡是1070 8G顯存)
3、A卡用戶應該也能用,這個需要自行測試,但是出圖可能會很慢。
由于我自己寫這篇文章的時候,也就只是周末玩了兩個下午,括弧捂嘴笑括弧完畢。
所以今天分享的文章旨在讓感興趣并且還完全沒有用過的鹿友能夠盡快用起來,至于軟件更多復雜的操作功能我們后面有機會再繼續(xù)分享。

01
軟件安裝
和其他的普通軟件不同,安裝SD離線版到本地步驟相對來說比較復雜,需要部署環(huán)境配置。
網(wǎng)上有很多教你從零開始部署環(huán)境配置的教程,感興趣的鹿友可以看看,不過對于我這種軟件愛好者來說體驗成本略高。
所以我這里使用的是B站up主@秋葉aaaki分享的整合包,即壓即用,非常方便,感謝大佬的分享:

為了讓安裝時候的界面和大家保持一致,我這里刪除了已經(jīng)安裝的SD重新和大家過一次流程。
當你下載完秋葉整合包以后里面有三個文件夾:

novelai-webui這個文件夾里就是SD離線版的主程序,里面是個壓縮包,把它解壓到一個有足夠空間的硬盤里。
SD解壓存放的硬盤空間一定要大,因為后期可能還會安裝額外的插件或者模型:

來到SD的解壓目錄,可以看到整合包里已經(jīng)包含了正常部署環(huán)境所需要的git和python還有啟動器,但默認情況下雙擊啟動器會報錯,報錯以后我們點擊否:

這時回到我們剛才下載的第二個叫做sd-webui啟動器的文件夾里,雙擊啟動器運行依賴并且安裝:

安裝完成之后再次雙擊啟動器,就可以正常打開了,啟動器也會自動檢測并配置你的顯卡型號以及顯存大?。?/p>
我們先來看看啟動器的頁面布局,如果你在SD使用過程中遇到報錯等問題,可以在疑難雜癥這個欄位使用掃描功能檢測,更多問題可以聯(lián)系開發(fā)者秋葉:

版本管理里面我們可以先更新一下啟動器的版本,直接點擊安裝就可以了:

模型管理里可以下載各種類別的模型,這個我們先不管它:

擴展管理里面可以更新以后我們要用到的插件之類的東西,管它呢,先一鍵更新再說:

最后小工具欄位是我們后面繪圖可能會用到的一些網(wǎng)站,大家感興趣可以點來看看:

接下來我們回到高級選項,默認情況下會勾選啟動完畢后自動打開瀏覽器,然后點擊一鍵啟動:

第一次啟動的時候,這里會彈出一個文本文檔,你需要在這里手動輸入我已閱讀并同意用戶協(xié)議,然后保存關閉文檔,否則無法進入下一步:

由于前面我們勾選了自動打開瀏覽器,所以當你看到這個頁面時,那么恭喜你已經(jīng)成功安裝SD,如果瀏覽器沒有自動打開,可以在地址欄手動輸入127.0.0.1:7860也可以:

SD安裝成功以后還沒有完,記得剛才我們下載的整合包里有三個文件夾么,第三個文件夾里是兩個SD官方的基礎主模型:

SD目前大體有五類模型,選擇好的模型對于Ai繪圖是非常重要的,至于這些模型有什么區(qū)別我們以后有機會再分享。
現(xiàn)在大家只需要跟著我操作就行了,把這兩個主模型復制到SD安裝目錄models\Stable-diffusion里:

回到SD的webui頁面,左上角第一個欄位就是主模型的選項卡,我們點擊藍色按鈕刷新,剛才的兩個主模型就加載出來了:

02
文生圖的界面概述
現(xiàn)在我們看到的SD界面就是剛?cè)胧肿畛R姷慕缑媪?文生圖,顧名思義就是文字生成圖片。
由于參數(shù)比較多,全部介紹完篇幅可能會很長,所以我們這里先簡單介紹幾個最容易影響繪畫的板塊。
頁面的左上方我們前面已經(jīng)介紹過了是選擇主模型的地方,旁邊是加載VAE的地方,至于VAE是什么我們以后再說,再接下來的Clip 跳過層我們暫時用不到,可以不管:

往下走是橫向的功能模塊包括文生圖、圖生圖等,同樣其他的功能我們以后再說。
下面兩個大的框就是我們的提詞框了,分別是正向提詞框和反向提詞框,簡單理解就是你想要什么和你不想要什么:

提詞框內(nèi)的內(nèi)容需要輸入英文,它本身支持自然語言的,但還是建議用逗號分隔的一個個的關鍵詞來寫。
例如一只狗站在草地上,我們可以寫成:A dog standing on the grass:

但是建議寫成1dog,stand,grass,大概是這個意思,和美丑沒有關系,只是方便我們以后加入更多提詞或者權重,這個以后再說:

右側(cè)的生成按鈕就不用說了,下面的第一個小箭頭鼠標停止在上面就會有功能提示。
可以將例如你在C站上復制的生成信息直接填寫到對應的欄位包括采樣等,如果當前你的提詞框為空則填入上一次的內(nèi)容。
這個我們后面再說,旁邊的垃圾桶按鈕就是清空這些信息:

有時候我們會有一些常用的提詞,可以按箭頭處的保存將它保存為模板方便再次使用,另外兩個分別是選擇模板和填寫模板:

另外秋葉的這個整合包是自動幫我們添加了一個通用起手式模板的,正向詞是杰作、高質(zhì)量,反向詞翻譯一下大概是這些:

由于我們用的是中文版的界面,所以紅色方框的內(nèi)容大家基本看都能看明白,這里只說簡單說幾個點:
采樣迭代步數(shù)越高圖像生成時間越長越貼近你的提詞描述,但是過高反而會出錯,通常20-30得手動嘗試。
采樣方法也就是采樣器的算法這個也需要手動嘗試,不同的采樣方式效果也會有差異,比較常用的是DPM++。
寬度和高度也就是分辨率的選擇和你的模型有關,相信的我們以后再說,總之記不能過高,否則畫出來的圖會出錯并且顯存也不夠。
提示詞相關性CFG數(shù)值越高越接近你的提詞信息,但是數(shù)值過高也會出錯,同樣需要手動嘗試。
隨機種子顧名思義根據(jù)你的提詞隨機生成一張圖:

隨機種子這里多說一句,例如你畫出的圖大體感覺你覺得不錯想要保留這個大效果,可以點擊旁邊的綠色按鈕,隨機種子就會固定到數(shù)值:

這個時候你再去添加提詞等,它就會盡量的在你原有的圖片感覺上去生成新的圖像,注意分辨率如果改變的話,同樣畫面也會改變:

右邊的文件夾按鈕可以打開我們畫圖的保存位置:

03
模型下載及繪圖初體驗
文生圖大概的參數(shù)我們過了一次就來自己動手繪圖試試吧,我前面提到了Ai繪圖你用的模型質(zhì)量很重要。
官方自帶的3個很基礎模型其實我們平常很少用,因此我們需要去下載其他更好的模型。
我們前面提到了在啟動器的插件管理里,可以直接下載各類模型,這里下載的好處是國內(nèi)網(wǎng)絡也可以直接下載,但缺點就是大部分模型你無法預覽,不知道它的內(nèi)容:

因此這里還是推薦大家可以通過C站去下載更多高質(zhì)量的模型,網(wǎng)址是:civitai.com,當然缺點很明顯,需要魔法:

例如我覺得這個叫Deliberate的模型不錯就可以直接點進去免費下載:

另外下載模型前我們需要注意這是一個什么類型的模型,它決定我們下載以后的存放位置以及使用方法。
這里可以看到模型類型寫的是Checkpoint,屬于主模型,再次說明更多模型的知識我們以后分享:

和官方的基礎主模型一樣,我們需要把它放到SD安裝目錄models\Stable-diffusion里,這個模型我同樣也會分享給大家:

安裝好以后我們刷新一下SD的頁面,就可以在左上角看見下載的模型了,或者點擊生成下面的紅色按鈕也可以找到:

現(xiàn)在模型有了,但是我們新手通常最頭疼的是不知道該怎么寫提詞,這里我的建議是先抄,看別人是怎么寫的提詞。
回到C站,點擊其中的一張你覺得不錯的圖下方符號會彈出這張圖片的生成信息:

然后點擊拷貝生成信息:

回到SD頁面將所有的信息復制到提詞框里然后點擊生成按鈕下面的小箭頭:

這樣包括正反提詞,采樣、采樣方式、種子等都會自動填寫到對應的欄位:

這時直接點擊生成就可以得到一張不錯的圖了,不過你可能會發(fā)現(xiàn)為什么我們參數(shù)都相同但是和原圖不一樣呢?
Ai繪圖確實即便參數(shù)一樣,也很難做到和原作者完全相同,這個我看有說法是和硬件算力也有關系:

在此基礎上我們可以把提詞中的信息改一改,例如我這里添加了紅色金屬、高科技、機械鎧甲等提詞。
不過現(xiàn)在鬼畜了,生成的圖里面多了一個手和胳膊出來:

我們這里可以在反向詞里找到這個“多余肢體”的提詞,把它放在最前面,提詞越靠前,代表它的權重越重,再生成一下看看,就好多了:

最后生成出來用ps簡單的加點文字潤色,一張看著挺唬人的海報就出來了:

以上就是今天想要分享的內(nèi)容,雖然生成出來的圖還不錯,但是個人感覺沒有什么成就感,哈哈哈。
更多詳細的內(nèi)容我們以后有時間再分享,希望今天的內(nèi)容對大家有所幫助,希望各位鹿友一鍵三連支持哦!
更多內(nèi)容歡迎關注公眾號:
本文由“野鹿志”發(fā)布
轉(zhuǎn)載前請聯(lián)系馬鹿野郎