帶你快速理解Stable Diffusion中各種專業(yè)術(shù)語(yǔ)

學(xué)習(xí)Stable Diffusion人工智能繪畫,你需要對(duì)如下名詞、專業(yè)術(shù)語(yǔ)等有所理解才行。
下面帶你快速理解Stable Diffusion中各種專業(yè)術(shù)語(yǔ),用通俗易懂的話解釋如下:
checkpoint大模型
可以理解為AI繪圖的基礎(chǔ)數(shù)據(jù)庫(kù),是使用大量的數(shù)據(jù)訓(xùn)練出來(lái)的。一般文件比較大,2G以上。
VAE
全名Variational autoencoder,中文名變分自編碼器,作用可以理解為濾鏡+微調(diào),有的大模型有對(duì)應(yīng)的VAE,沒(méi)有的也可以選擇使用常用的
vae-ft-mse-840000-ema-pruned.safetensors,作用就是讓圖片看起來(lái)不那么灰蒙蒙的,會(huì)更加鮮艷。
LoRA
全稱Low-Rank Adaptation of LargeLanguage Models,直譯為大語(yǔ)言模型的低階適應(yīng),這是微軟的研究人員為了解決大語(yǔ)言模型微調(diào)而開發(fā)的一項(xiàng)技術(shù)。LoRA的作用是可以讓結(jié)果傾向于一種風(fēng)格,比如使用水墨風(fēng)LoRA可以使結(jié)果是水墨風(fēng)格,使用人物L(fēng)oRA可以使人物趨向于一種樣貌。
embedding
可以理解為把大量的提示詞(prompt、tag)打包在一起,就把他理解為提示詞合集也行,所以文件很小。和LoRA有點(diǎn)類似,比如使用冬天風(fēng)格的embedding可以使結(jié)果趨向于冬天。
ControlNet
Stable Diffusion中的一款很重要的插件,有了它可以讓Stable Diffusion能更精確的控制生成的結(jié)果。
之后將重點(diǎn)講解它的用法!持續(xù)更新。
各模型文件的存放位置
已經(jīng)整理好,如圖所示。


接著最近又接觸了幾個(gè)與人工智能編程相關(guān)的專業(yè)名詞,比如在Stable Diffusion界面最下面出現(xiàn)的一些專業(yè)術(shù)語(yǔ)。

Python
不用說(shuō)了,很火的編程語(yǔ)言,人工智能領(lǐng)域常用編程語(yǔ)言。比如我們的Ai繪圖軟件Stable Diffusion,90%的語(yǔ)言是用python編寫的。

Git
是一個(gè)版本管理工具或者版本控制系統(tǒng),是可以離線使用的存儲(chǔ)在本地的代碼倉(cāng)庫(kù),作用是可以記錄各種版本的修改,可以隨時(shí)回溯到以前的版本。
GitHub則是把代碼保存在云端的倉(cāng)庫(kù),是一個(gè)保存程序代碼的網(wǎng)站,很多國(guó)際上的技術(shù)大牛都在github上有自己的開源代碼?;氐饺斯ぶ悄苘浖table Diffusion,我們會(huì)發(fā)現(xiàn)他的主要程序是保存在GitHub上的,我們可以去隨意下載。我們也可以通過(guò)git clone等命令直接從GitHub上復(fù)制下載插件。
Pytorch
我們先來(lái)問(wèn)下Cursor(GPT3.5),他的解釋如下:
PyTorch是一個(gè)流行的開源機(jī)器學(xué)習(xí)框架,它提供了許多用于構(gòu)建和訓(xùn)練神經(jīng)網(wǎng)絡(luò)的工具和接口。它的主要優(yōu)點(diǎn)之一是它的動(dòng)態(tài)計(jì)算圖,這使得它更易于使用和調(diào)試。PyTorch還提供了許多預(yù)訓(xùn)練的模型和工具,使得構(gòu)建和訓(xùn)練深度學(xué)習(xí)模型變得更加容易。它也支持GPU加速,這使得它在處理大型數(shù)據(jù)集時(shí)更加高效。
總之,PyTorch是一個(gè)功能強(qiáng)大的機(jī)器學(xué)習(xí)框架,它提供了許多工具和接口,使得構(gòu)建和訓(xùn)練神經(jīng)網(wǎng)絡(luò)變得更加容易和高效。如果您需要更多關(guān)于PyTorch的信息,建議查看官方文檔。

Pytorch可以說(shuō)是torch的python版,然后增加了很多新的特性?;氐絊table Diffusion,可以看到頁(yè)面下面所用的torch版本。說(shuō)白了,其實(shí)就可以理解為torch是用來(lái)訓(xùn)練大模型的。
xFormers
是一個(gè)模塊化和可編程的Transformer建模庫(kù),可以加快圖像生成速度并減少顯存占用。是一種基于自注意力機(jī)制的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)模型,于2017年由Google公司提出,目前已成為自然語(yǔ)言處理領(lǐng)域中應(yīng)用最廣泛的模型之一。
Gradio
是MIT的開源項(xiàng)目,是一個(gè)快速構(gòu)建機(jī)器學(xué)習(xí)Web展示頁(yè)面的開源Python庫(kù)。只需要幾行代碼,就可以讓你的機(jī)器學(xué)習(xí)模型從抽象晦澀的代碼變成性感可愛的交互界面(交互式web頁(yè)面),讓沒(méi)有任何編程技能的用戶也能夠輕松使用和體驗(yàn)?zāi)P汀?/p>
Stable Diffusion的Web UI界面就是用gradio構(gòu)建的。


更多Stable Diffusion Ai繪畫教程請(qǐng)看本人主頁(yè) 或者頭條@好奇漫步,持續(xù)更新更多Ai相關(guān)學(xué)習(xí)教程,保持關(guān)注哦~