學習筆記|畫下第一個AI小姐姐:搭建漢化版Stable Diffusion

顧城有一首詩非常美,詩里寫到:
我希望/能在心愛的白紙上畫畫/畫出笨拙的自由/畫下一只永遠不會/流淚的眼睛
一片天空/一片屬于天空的羽毛和樹葉/一個淡綠的夜晚和蘋果
畫下想象中/我的愛人/她沒有見過陰云
她的眼睛是晴空的顏色/她永遠看著我/永遠,看著/絕不會忽然掉過頭去
我也希望畫下永遠看著我的小姐姐,可惜,我不會畫畫怎么辦?
如今,AI給了一個機會。

現(xiàn)在在最火的AI繪圖工具莫過于midjourney,已經(jīng)可以生成近乎可以直接用來商用的AI圖片。
不過,midjourney有兩個門檻,一個是有些操作需要科學上網(wǎng),第二個是每月有一筆不大不小的費用(30美金)。
如果不是以繪圖為職業(yè),僅僅是興趣愛好,或者相對AI繪圖有一個相對較為底層的了解,或許有另外的不花錢的選擇。
Stable diffusion。
Stable diffusion是一個基于Latent Diffusion Models(潛在擴散模型,LDMs)的由文字生成圖像的(text-to-image)模型。
重要的是,它是開源+本地化部署的。
需要聲明的是,免費的,往往是最貴的,因為要有折騰的成本。
假如你是一個需要接商單的職業(yè)畫師,建議還是去花錢。
二、給小姐姐完整的一生(身):硬件
首先你要有一塊還算可以的Nvidia顯卡,20系30系都可以,當然了,如果上最新的40系,除了價格貴以外,還可能會有開車太快的眩暈感。
如果實在沒有顯卡,集顯用戶也不是不能操作,比如我曾經(jīng)用A家的集顯跑一個多鐘頭算AI小姐姐,同樣的參數(shù),在Nvidia 3060上只需要5秒。
在預算較低的情況下,3060是一個非常不錯的選擇,為了后續(xù)使用ChatGLM,我特意選了12G顯存的配置,內(nèi)存16G,硬盤換成了長江存儲顆粒的2T容量SSD。
最近長存顆粒殺紅眼了,2T只需要500塊。
本來我看好了一套深度學習的主機,要2萬塊,但想了想不如先從起步開始。
3060的全套配置(不含顯示器)下來,只需要6000塊。
三、選擇一個漢化好的安裝包
Stable diffusion是開源的,已經(jīng)有了不少的漢化的不錯的版本。
如果你是老手,請點擊右上角的關閉符號;
如果你是新手,本文會給你一個簡單到“一鍵式”使用的操作方式。
下載(秋葉一鍵包):
這個安裝包整合了Stable diffusion依賴的所有環(huán)境,可以一鍵啟動.
不過體積也比較大,差不多十幾個G,如果想要獲得很好的效果,還要下載安裝一些模型,一般模型都要幾個G,所以2T的硬盤是有必要的。
啟動界面說明:

生成引擎是選擇你要計算用的顯卡,顯存優(yōu)化根據(jù)你的顯卡實際容量進行選擇,監(jiān)聽端口默認7860,這個端口可以修改,如果開放遠程連接,則需要在系統(tǒng)的防火墻里進行配置,允許TCP協(xié)議通過7860(或修改后)的端口。
開放遠程連接的好處是可以在其他電腦(局域網(wǎng)內(nèi))甚至手機上連接該電腦,進行AI繪圖。這樣我只需要把臺式機塞在桌子底下,用筆記本連接進行繪圖即可。
如果擁有公網(wǎng)地址,則可以通過路由器配置端口映射在互聯(lián)網(wǎng)隨時訪問。
以win11為例,在防火墻和網(wǎng)絡防護--高級設置--入站規(guī)則,增加一個規(guī)則“7860”,規(guī)則的內(nèi)容為TCP協(xié)議允許7860特定端口被訪問。
三、開始你的第一張AI小姐姐吧:常見功能介紹
程序啟動成功后,系統(tǒng)會自動打開瀏覽器并跳轉(zhuǎn)到繪圖頁面。
如果在局域網(wǎng)里其他電腦訪問,可以采用?http://ip地址:7860?的方式。
最常用的是“文生圖”功能,也就是用文字觸發(fā)AI繪圖,現(xiàn)在大部分版本只支持英文,這對使用者輸入關鍵詞的能力非常高。

備注:這是一篇舊文,Stable Diffusion已經(jīng)廣泛流行,可參考價值不大,把之前發(fā)在其他平臺的文章逐步搬運過來,形成一個系列。