最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

prompt 創(chuàng)作技巧,各參數(shù)效果分析及一份樣例

2023-04-21 20:58 作者:Noir_  | 我要投稿



導(dǎo)語:

????????注意到一些群友對 prompt 中的各個參數(shù)的效果理解得比較模糊,所以稍微寫一下各個參數(shù)的用途和效果,并串接一些作者使用到的技巧和理解,以及一份樣例 prompt。

????????其實不了解也沒有什么關(guān)系,畢竟即使是看上去很奇怪的 prompt,也不是不可能生成理想的圖。

????????不過了解一下的話,也許可以寫出更加穩(wěn)定的 prompt 也說不定。

????????本文面向的對象是有一定經(jīng)驗的創(chuàng)作者來著,所以難度會比較大。(其實主要是寫完之后感覺初學(xué)者不一定看得懂來著...)

注:其實我也不是很了解啦,各位隨便看看就好了。


目錄:

- (1)Clip skip

- (2)模型

- (3)CFG scale

- (4)TAG

? ?- (4-1)75

? ?- (4-2)連續(xù)性

? ?- (4-3)元素溢出

? ?- (4-4)泛化 TAG

? ?- (4-5)權(quán)重均衡

? ?- (4-6)負(fù)面TAG

- (5)小的總結(jié)

- (6)Sampler

- (7)Step

- (8)分辨率相關(guān)

- 樣例



正文:

(1)Clip skip:

????????首先談?wù)剬φw影響最大的參數(shù):Clip skip(在 setting 中設(shè)置)。

????????Clip Skip 是一個非常強(qiáng)的參數(shù),它表示將 Tag 抽取到 Clip 模型后,在后面生成圖像的過程中會跳過最后的多少層 Clip 提前停止。

????????具體的說,如果 TAG 描述為,“一個站在森林中的小女孩”,那么第一層 Clip 可能描述 “一個人”,第二層可能描述 “小女孩”,第三層可能是 “一個站著的小女孩”,以此類推。后面的層會比前面的層描述的更具體,這些層會共同組成 Clip,參與后面的圖像生成。而 Clip Skip 會控制系統(tǒng)忽略 Clip 的最后的若干層,這些層往往是描述的最具體,綜合性最高的那幾層。

????????簡單的講,它可以理解成一個增強(qiáng)版的 CFG,Clip Skip 越高,系統(tǒng)對 TAG 的服從度越低。這種服從度的降低主要表現(xiàn)在細(xì)節(jié)和各個 TAG 的協(xié)作上,對于一些復(fù)雜的修飾詞,Clip skip 升高會導(dǎo)致這些詞效果的驟降。

????????它作用于 CFG 之前,或者說,它作用于大多數(shù)參數(shù)之前。所以它的效力非常非常強(qiáng),尤其是它的最后一層,Clip skip = 1 和 Clip skip = 2 的效果差距會非常明顯。比如上面的 prompt,如果把 Clip skip 設(shè)為 1,那么就很有可能死圖(指生成的圖像不能被人類所接受)(原因是權(quán)重大的 TAG 太多了)。

(不過好像沒有看到 Clip skip = 0 的設(shè)置,也許它的最后一層是必須跳過的?)

????????因為 Clip skip 的效力非常非常強(qiáng),所以從某種意義上,它又不是那么重要了...因為它并不適合作為最后效果的精調(diào)參數(shù),而作為一個粗調(diào)參數(shù),絕大多數(shù)情況下它都是不需要改變的。如果要改變它,整個 prompt 就要重寫以保證穩(wěn)定性。這是不可接受也沒有必要的。

(嗯,prompt 的穩(wěn)定性指 prompt 穩(wěn)定生成效果比較好的圖像的能力)

????????比較推薦的設(shè)置是 Clip skip = 2,這樣 TAG 上的權(quán)重均衡會簡單很多。如果 Clip skip = 1 的話,各個 TAG 的效果就很強(qiáng),對 TAG 進(jìn)行加權(quán)時要非常謹(jǐn)慎(Clip skip = 2 時,TAG 的權(quán)重設(shè)到 1.5 都是可以的,但是 Clip skip = 1 時這么做往往會死圖)(不過如果不管 TAG 間的權(quán)重均衡,不使用加權(quán),那直接 Clip skip = 1 會更好也說不定?)

????????Clip skip 由 2->3 (以及之后的增加)影響不會很大(相比 1->2),不過 Clip skip = 2 時,TAG 的效力就已經(jīng)比較弱了,不建議再升高。

????????總之,這個參數(shù)既重要也不重要,重要在于它對最終效果影響很大,不重要在于反正我們一般也不會去動它...(它甚至沒有被放到主界面,而是放到了 setting 里)


(2)模型

????????這個大家應(yīng)該都知道是干什么用的(大概?),但是還有兩點需要注意:

????????第一點是,不同模型對同一個 TAG 的敏感程度是不相同的。

????????比如說,在同一個 Clip skip 下,Anything 的詞匯廣度(指能夠起作用的 TAG 詞匯數(shù)量)明顯優(yōu)于 Counterfeit。

????????從一個方向講,同一個 TAG 在不同模型下的效果也是不一樣的,比如說 small breasts,Anything 和 Counterfeit 都知道這個詞是在干什么,但是橘子會在做到這一點的時候,經(jīng)常會順便把這個部位裸露出來,就很讓人討厭...

????????第二點是,每個模型會有自己的特征權(quán)重。

????????這里的特征權(quán)重不是說模型的畫風(fēng),而是說模型在細(xì)節(jié)上的偏向,比如 Counterfeit 偏向粉發(fā),偏向大量的木頭作為背景,偏向無意義的延申的衣服布料,橘子偏向緊身衣,偏向背光,甚至是放大器也會有這種偏向,比如說 Latent (nearest-exact) 偏向花,偏向條紋等等。

????????這種特征權(quán)重往往不是我們所需要的,所以可以通過增加負(fù)面進(jìn)行刪除。

????????不過要注意的是,特征畫風(fēng)一般不能作為負(fù)面,像 3D 這種過于寬泛并且會攻擊橘子核心畫風(fēng)的詞,是不能直接加到負(fù)面里去的(這一部分會在后面具體說明)。? ? ? ? ? ? ? ? ? ? ? ?


(3)CFG scale:

????????這個參數(shù)的話,嗯,不好說。

????????簡單的講,它是對“系統(tǒng)對 TAG 服從程度”的精調(diào),CFG 越大,服從程度越高。

????????理論上講,CFG 只與 TAG 有關(guān)。對于不同的 TAG 權(quán)重組合,應(yīng)該使用不同的 CFG 進(jìn)行均衡。

????????但是不同模型對 CFG 的敏感程度也不一樣,每種模型適應(yīng)的 CFG 范圍各不相同。

????????所以,比起同時調(diào) TAG 和 CFG,也許根據(jù)模型將 CFG 固定,然后調(diào)整 TAG 會比較好?

????????模型對應(yīng)的 CFG,一般在那個模型的說明書中會有提到。

(沒有說明書的話...就慢慢試吧)

????????Anything 是個例外,正如其名,Anything 對任何 TAG,任何 CFG,都會有所表現(xiàn)。不會像某些模型一樣,CFG 調(diào)出舒適區(qū),就基本不能出圖了。


(4)TAG:

????????這個是 prompt 的核心。

????????所謂的 “普適的 TAG 表” 是沒有意義的,不同模型對 TAG 的廣度和深度都不同。

????????所以哪些 TAG 有用,效果好,哪些 TAG 間有沖突,哪些 TAG 可以相容,都只能通過實踐得出。

????????從這一點來說,對于 prompt 的創(chuàng)作,經(jīng)驗是非常重要的。

????????這里談?wù)撘幌?TAG 的一些特性:


(4-1)75:

????????嗯,WebUI TAG 右上角會有一個詞數(shù)顯示。如果詞數(shù)超過了 75 個,那么系統(tǒng)會將 TAG 每 75 個詞數(shù)分一組,各組之間通過 AND 連接。(這里的“詞數(shù)”并不是具體的描述,一個 TAG 可能對應(yīng)多個“詞數(shù)”)

????????這意味著,超過 75 個詞數(shù)后,很難精確地控制權(quán)重分配。

????????所以我使用的 TAG 一般都是 75 以內(nèi)的來著。


(4-2) 連續(xù)性:

????????同類 TAG 連在一起會比較好,嗎?

????????如果保證了 75 以內(nèi)的話,似乎很難說會不會更好。

????????不過距離近的 TAG 之間會更容易相連,這一點是確定的。

????????這意味著,耦合度高的 TAG 放到一起去,且不說會不會更好,至少不會出問題。而且 TAG 可讀性也會增加...所以還是把相關(guān)聯(lián)的寫到一起吧。


(4-3)元素溢出:

????????這個是元素沖突的一種。

????????舉個例子,TAG 中既有“白發(fā)”,又有“黑發(fā)”,那么二者會產(chǎn)生沖突,導(dǎo)致元素溢出。

????????元素溢出不意味著元素融合,所以畫面主體的頭發(fā)并不會既黑又白(一般情況下)

????????一般而言,結(jié)果會是沖突的一個對象加載到主體上,另一個加載到客體上。

????????比如 TAG 中有一只女孩和一只貓,白發(fā)加載到女孩上,黑發(fā)就會加載到貓上。

????????如果沒有客體,元素溢出就可能導(dǎo)致未曾預(yù)料的客體的產(chǎn)生。比如從單人變成多人。

????????利用這個特性,其實多人描寫是很簡單的。

????????另外,像 “白發(fā)”,“黑發(fā)” 這種明顯的沖突是很容易被注意到的。但是導(dǎo)致元素溢出的原因往往不會這么顯然。

????????比如說 `(white hair),short hair`,這個也可能導(dǎo)致元素溢出。

????????這一點的話,我之前的貼子里有說過的來著。


(4-4)泛化 TAG:

????????有一類 TAG 的影響是整體性的:這些 TAG 的效果,并不是向圖像中加入某些元素,而是向圖像中的所有元素,加入這類 TAG 代表的特性,這里稱呼它為泛化 TAG。

????????常見的泛化 TAG 包括大多數(shù)畫風(fēng)提示詞,大多數(shù)全局抽象詞等等。

????????這類詞有很多有趣的用法,之前的帖子里有提到過,這里略過。


(4-5)權(quán)重均衡:

????????TAG 的一個很理想的狀態(tài)是:內(nèi)部自均衡,外部與 CFG,模型,clip skip 相均衡。這種狀態(tài)下,prompt 的穩(wěn)定性會有顯著的提高。

????????內(nèi)部自均衡的話,要求各個 TAG 的權(quán)重之間相均衡,人物與背景的權(quán)重均衡,人物自身的權(quán)重均衡,背景自身的權(quán)重均衡。

????????外部均衡的話,要求 TAG 與模型特點相均衡,TAG 權(quán)重與 Clip + CFG 相均衡,CFG 與模型相均衡。

????????這個的話,不好說有什么訣竅吧...主要還是靠經(jīng)驗?


?(4-6)負(fù)面 TAG:

????????負(fù)面 TAG 是非常重要的。

????????和正面 TAG 一樣,負(fù)面 TAG 也要受 CFG,Clip,模型的影響。

????????好的負(fù)面 TAG 會給 prompt 的表現(xiàn)帶來較大的提升。

????????不過一句 EasyNegative 走天下...也不是不行...

????????嗯,負(fù)面的另一個作用在于均衡模型帶來的特征權(quán)重。

????????比如樣例中用 wood,stone 來均衡 Counterfeit 自帶的的木石背景,或者用特殊的負(fù)面限制橘子的 3D 效果(以前的帖子里有,不再贅述)。

????????最后,不要把泛化 TAG 寫到負(fù)面里,而應(yīng)該把它拆成多個實體 TAG 再寫到負(fù)面里。


(5)小的總結(jié):

????????上面是 Clip skip,模型,CFG,TAG 的效果...

????????這四部分是 prompt 的重點所在,控制著 “最終會產(chǎn)生關(guān)于什么的圖片”。


(6)Sampler:

????????這個不是很好說...

????????它的影響其實不是那么大,而且一般來說,每個模型都會有比較適合的 Sampler。

????????說到底常用的 Sampler 只有那么幾個...

????????而且 Sampler 不會影響權(quán)重均衡。

????????嘛,就...比較無所謂的。

????????不過不同的 Sampler 也會有不同的特色就是了。

????????upscaler 同理。


(7)Steps:

????????不同的模型對應(yīng)不同的采樣器,有不同的 Steps 要求。

????????超過 20 后,Steps 越大,一些地方會越精細(xì),但是細(xì)節(jié)會越少。

????????少于 20 的話,嗯...

????????一般 20 - 30 就夠了,具體還是要參照各個模型的說明書。


(8)分辨率相關(guān):

????????與分辨率相關(guān)的參數(shù)包括:Size, Hires upscale, denoising strength。

????????如果不使用高清修復(fù)的話,后面兩個參數(shù)不存在。

????????這三個參數(shù)是要均衡的,其中 Size 還需要和之前的 TAG 均衡。

????????Size 過大的話,TAG 要考慮增加權(quán)重,人物與背景之間得 TAG 均衡需要重新調(diào)整。

????????嗯,假設(shè) Size 和 TAG 已經(jīng)達(dá)到均衡了,那么下一步是根據(jù)需要確定 Hires upscale,然后根據(jù)生成的圖片的效果調(diào)整 denoising strength。

????????denoising strength 相對較小時,會有大量的噪點,upscaler 會按自己的喜好填充這些噪點。但是一般會有很明顯的雜亂表現(xiàn)。

????????denoising strength 相對較大時,放大前后的圖片區(qū)別會很大。這意味著...實際上真正影響圖片結(jié)果的就是放大的過程了...一般不會認(rèn)為這是很好的結(jié)果的...大概?

????????upscaler 的選擇對二者的均衡會有影響。

????????比如 Latent (nearest-exact) 對應(yīng)的 denoising strength 會顯著大于 LDSR。


# 結(jié)語:

????????只是隨便寫一寫來著,如果有問題可以評論區(qū)指出。

????????雖然大家練練 lora 很開心,但是 prompt 并不是隨便就可以丟掉的東西來著。

????????初學(xué)者可能會看不懂,這個是正常的(大概?


# 樣例:

? ? ? ?

? ? ??

?Prompt:

?正面 TAG:

(((masterpiece))),((best quality)),(((illustration)),((Chinese_style)),

(((beautiful detailed girl))),cat girl,tea,standing,

((delicate cute face)),blue_eyes,watery_eyes,

bob_cut,white_hair,flower,

(white hanfu),silky,pink,luxuriant,layered dress,

(in_spring),lake,beautiful_landscape,light particles,


負(fù)面 TAG:

EasyNegative,((wood,stone)),


其他參數(shù):


Model: Counterfeit-V2.5,

CFG scale: 10,

Sampler: DPM++ SDE Karras,

Steps: 30,

Size: 432x704, ?Hires upscale: 2, Hires upscaler: Latent (nearest-exact), Denoising strength: 0.54

Clip skip: 2,







prompt 創(chuàng)作技巧,各參數(shù)效果分析及一份樣例的評論 (共 條)

分享到微博請遵守國家法律
禄劝| 文安县| 金沙县| 曲靖市| 岳池县| 汾西县| 龙泉市| 鹿邑县| 启东市| 滦南县| 黔江区| 蒙山县| 抚松县| 浠水县| 怀仁县| 宁河县| 简阳市| 耒阳市| 彝良县| 惠安县| 渑池县| 榆中县| 东阿县| 静海县| 奇台县| 克什克腾旗| 甘肃省| 肥东县| 谢通门县| 扶余县| 宜宾县| 岫岩| 偏关县| 察哈| 邮箱| 东安县| 宣城市| 定边县| 福州市| 历史| 旬邑县|