【AI繪畫】兩種方法學會多人圖的制作(上)
寫在前面
這里是suye,今天帶來的是如何利用插件和局部重繪進行兩人以上的AI圖制作教程!
來看教程的各位小伙伴應該也跑過,或者說看過不少AI圖了。但是有沒有小伙伴注意到一個問題,那就是目前AI產(chǎn)出的圖片中,可以說99%都是單人圖,剩下1%中又有99%是簡單的雙人圖,既沒有辦法區(qū)分人物特征,動作也比較簡單,至于兩個人以上的圖片,那更是鳳毛麟角。
是因為AI畫不了多人圖嗎,到也不能這么說,一方面AI畫多人圖確實沒有單人圖來的容易,另一方面畫一張合格的多人圖所耗費的時間精力也遠超單人圖,因此也鮮有人去嘗試;所以今天帶來畫多人圖的教程,如果有幫到小伙伴們的話,就點個贊支持一下吧!
插件法
第一個方法是用Latent couple和Composable LoRA插件實現(xiàn)多人圖的制作,這兩個插件在之前專欄里出過教程,不了解的小伙伴可以去回顧一下:

開始教程前,我們先不用插件,光靠寫tag的方式出一下多人圖,方便對比:
首先是自然語言描述,不加lora的版本:

自然語言描述,加lora版本:

使用tag:
(((masterpiece))),(((bestquality))),((ultra-detailed)),(illustration),((anextremelydelicateandbeautiful)),dynamicangle,(floating:1.3),(beautifuldetailedeyes),(detailedlight),atdan, ( colorful:1.3),cowboy shot,3girls,
The sunlight in the evening spilled into the classroom, and three girls were sitting in the classroom. One girl had red horns, white hair, and was wearing a white Japanese school uniform. She was sitting on the desk with red arms, smiling at the girl sitting there. The other girl was facing the camera and sitting on the chair, expressionless, with green horns, black hair, green arms, and wearing a light green school uniform. There was also a girl standing there, Having blue horns, blue arms, blue hair, wearing a light blue school uniform, smiling at the two people,
?<lora:ark_年(origen,china dress):0.4>,origen, <lora:ark_令(originaloutfit,ling shorts;zhuoying,ling taoist robe):0.4>,originaloutfit,ling shorts, <lora:ark_夕(dusk):0.4>,dusk
很明顯,試圖使用自然語言進行區(qū)分三個人的嘗試失敗了,Stable Diffusion又不是ChatGPT,自然是無法理解自然語言的,加上lora后,Lora也因為無法區(qū)分而混成一團。
然后嘗試使用插件中提供的區(qū)分人物tag的格式再來一遍:
格式tag不加Lora:

格式tag加Lora:

使用tag:
(((masterpiece))),(((bestquality))),((ultra-detailed)),(illustration),((anextremelydelicateandbeautiful)),dynamicangle,(floating:1.3),(beautifuldetailedeyes),(detailedlight),atdan, ( colorful:1.3),cowboy shot,(3girls:1.4),Classroom, windows, desks, sunset,seifuku, school uniform, uwabaki,?
ANDhorns,white footwear, purple eyes, navel, long hair, pointy ears,streaked hair, midriff, multicolored hair, smile,stomach, bangs, tail, short shorts, breasts, white hair, shoes, bracelet, bead bracelet,earrings, braid, red hair, dragon horns, red skin,beads, bare legs,<lora:ark_年(origen,china dress):0.4>,origen, seifuku, school uniform, uwabaki, sitting on desk,
ANDhorns, pointy ears,black hair, dress, tail, red eyes, hair over one eye, long hair, red necktie, necktie, black footwear, dragon horns, dragon tail,? dragon girl, jewelry, multicolored hair,colored skin, earrings,green skin,<lora:ark_夕(dusk):0.4>,dusk, seifuku, school uniform, uwabaki, sitting at desk, sitting on chair, expressionless, from side,?
ANDlong hair, blue hair, horns,very long hair, multicolored hair, pointy ears, blue eyes, dragon horns, dragon, jewelry, earrings, tail, dragon tail, breasts, smile, dragon girl, braid, bangs, streaked hair, two-tone hair,<lora:ark_令(originaloutfit,ling shorts;zhuoying,ling taoist robe):0.4>,originaloutfit,seifuku, school uniform, uwabaki, standing,?
可以看到在不加Lora的情況下似乎能把人物特征分開了(其實只是分了個發(fā)色而已),但是加上Lora后三個人特征又混在了一起。
以上例子表明,在不使用插件的情況下,光靠tag想實現(xiàn)人物的區(qū)分基本上是不可能的,因此需要插件的幫助,接下來正式開始教程。
首先我們不開插件,也不開Lora,為什么呢?因為插件無法改變整體構圖,因此需要先在不使用插件的情況下完成構圖,再利用插件進行分區(qū)完善,跑幾張看看構圖:



啊這時候就有小伙伴會說了,這不是能出多人圖嗎?事實上這幅圖是在未加任何特征描述上出的,它的tag是:
(((masterpiece))),(((bestquality))),((ultra-detailed)),(illustration),((anextremelydelicateandbeautiful)),dynamicangle,(floating:1.3),(beautifuldetailedeyes),(detailedlight),atdan, ( colorful:1.3),cowboy shot,(3girls:1.4),Classroom, windows, desks, sunset,seifuku, school uniform, uwabaki,?
沒有任何角色描述,換句話說,純隨機抽卡,下一次就不是這三個妹子了,這顯然不是我們要的效果,事實上目前大多多人圖也僅能這么出,穩(wěn)定+省時,對于不需要具體角色的人來說也就夠了。
回到教程,根據(jù)試跑情況看,基本構圖都是將畫面平均分成三份,因此根據(jù)圖像的人物位置進行畫面分割,用到的就是Latent couple和Composable LoRA插件,分割后如下圖:

然后補充對應區(qū)塊的tag,補充完后就是上面不用插件的例二所使用的tag,這時候我們跑一遍試試效果:

怎么又只有一個人了???仔細檢查tag發(fā)現(xiàn),是沒有把整體畫面tag在分區(qū)tag中重寫,這也是很多小伙伴會犯的一個錯誤,由于整體tag權重僅有0.2,因此其中的3girls權重會被稀釋,導致最終畫面又只剩下一個人,那為什么之前測試的時候不加呢?因為之前測試中沒有分區(qū)賦權,在下面分區(qū)tag中重寫整體tag的話,相當于復寫了四遍整體tag,出圖效果會相當詭異:

因此在不使用插件時要刪去復寫部分,而使用插件時要添加復寫部分,添加后重新跑一遍:

這時候的效果就可以了,就可以添加Lora了,添加Lora需要不斷調整Lora權重,找到一個最適合的值,之后就是不斷地調整tag的值,找到一張不錯的圖,固定下種子進行微調:

good!再跑幾張——


后話
感覺好像是把上次的專欄又寫了一遍……
用插件法出多人圖優(yōu)點是不需要過多的操作,就是不斷地改參數(shù),改tag,和平常出圖沒什么區(qū)別,缺點是……
1,慢!開了插件,加了三個lora后,出圖速度起碼慢了一半不止,如果是顯卡差點的電腦怕是很難帶動。
2,死板!可以看到,三人,甚至是三人以上的構圖基本上都成畫面平分構圖,其他構圖基本別想了,對于控制畫面來說這點是個硬傷。
3,隨機!這次專欄不長,但是寫了很久,主要原因就是出圖效果太隨機了,有時候僅僅是一個權重的變動就可能導致畫面整個變換,經(jīng)常是改著改著,欸?人怎么少了一個?
4,由于是通過分塊控制,一旦不是那個分塊的角色某個部位或是整個人進入其他分塊,就會出現(xiàn)如下情況:


總的來說,雖然插件法可以畫多人圖,但限制頗多,下期將介紹利用局部重繪制作多人圖,相比插件法會有更好的效果。
點個贊加速up更新速度哦。