關(guān)于stable diffusion的prompt的基礎(chǔ)知識
提示詞的分類
提示詞(prompts)的意義是告訴AI需要什么樣的圖,所以需要盡可能清晰,準確,具體的描述清楚你的需求,可以按照以下類別來描述:
內(nèi)容型提示詞
主要是描述清楚畫面內(nèi)容,可以先使用中文描述之后使用翻譯軟件翻譯成英文,再粘貼到提示詞框中
人物及主體特征:服飾穿搭、發(fā)型發(fā)色、五官特點、面部表情、肢體動作
場景特征:室內(nèi)還是室外、大場景是什么、小細節(jié)的描述
環(huán)境光照:白天/黑夜、特定時間段、光環(huán)境、天空
畫幅視角:距離、人物比例、觀察視角、鏡頭類型
標準提示詞
基本是通用的,主要目的是描述清楚畫質(zhì)和畫風(fēng)
畫質(zhì):通用高畫質(zhì)、特定高分辨率
畫風(fēng):插畫風(fēng)、二次元、寫實系
“魔咒”
一些通用的魔咒,可以讓你的圖變得更好,我直接把這些放出來,每次出圖前直接復(fù)制到你的提示詞框和反提示詞框中即可:
正面提示詞后添加:(masterpiece:1,2), best quality, masterpiece, highres, original, extremely detailed wallpaper, perfect lighting,(extremely detailed CG:1.2), drawing, paintbrush,
負面提示詞后添加:NSFW, (worst quality:2), (low quality:2), (normal quality:2), lowres, normal quality, ((monochrome)), ((grayscale)), skin spots, acnes, skin blemishes, age spot, (ugly:1.331), (duplicate:1.331), (morbid:1.21), (mutilated:1.21), (tranny:1.331), mutated hands, (poorly drawn hands:1.5), blurry, (bad anatomy:1.21), (bad proportions:1.331), extra limbs, (disfigured:1.331), (missing arms:1.331), (extra legs:1.331), (fused fingers:1.61051), (too many fingers:1.61051), (unclear eyes:1.331), lowers, bad hands, missing fingers, extra digit,bad hands, missing fingers, (((extra arms and legs))),
提示詞權(quán)重分配的方法
基本規(guī)則
在某個提示詞上加英文半角的圓括號,權(quán)重就會變?yōu)?.1倍。每套一層括號,權(quán)重就乘以1.1倍。大括號是1.05倍,中括號是0.9倍
括號加數(shù)字權(quán)重, 可以直接在加了括號之后的提示詞上再加英文冒號以及數(shù)字,數(shù)字填幾就表示權(quán)重是多少
注意:如果某個提示詞的權(quán)重超過2,可能會扭曲畫面,最好控制在小于1.5左右
進階規(guī)則
混合:混合兩個描述同一對象的提示詞要素。舉例:white | yellow flower, #此處會生成白色和黃色混合的花
遷移:連續(xù)生成多個具有不同特征的對象,不斷遷移。舉例:[white|red|blue] flower, #此處會先生成白花,再生成紅花,再生成藍花
迭代:與采樣進程關(guān)聯(lián),一定階段之后再生成特定的對象。舉例:(white flower:bush:0.8), #此處進程達到80%(0.8)之前是白花,80%之后生成灌木
出圖參數(shù)
默認的采樣步數(shù)一般都是20,再增加采樣步數(shù)提升不大,如果算力夠強,可以設(shè)為30-40,最低不要設(shè)為10,不然出的圖質(zhì)量很糙
采樣方法的定義:AI進行圖像生成時使用的某種特定算法。實際使用的時候盡量使用帶有+的算法,比較穩(wěn)定

寬和高,指的是出圖時的分辨率,默認是512*512,但是可能會模糊,可以將分辨率提高至1000左右(當(dāng)然對硬件要求也更高,盡量不要超過1500,否則硬件扛不?。?。還有一種更好的方式,先采用低分辨率來生成圖片,再勾選高清修復(fù)嘗試放大
面部修復(fù)一般都要勾選上,平鋪一般不勾
提示詞相關(guān)性,一般設(shè)置在7-12之間即可,是控制圖片與提示詞的相關(guān)程度的
生成批次和每批數(shù)量。生成批次指的是AI會按照你的提示詞不斷地生成圖片,生成多張圖片。每批數(shù)量一般不要調(diào)太多,因為會使每一批同時生成多張圖片,非常耗顯存