【AI繪畫】Stable Diffusion超分放大:高清修復(fù)(Hires.Fix)篇
以下圖片均為?https://www.bilibili.com/video/BV1ro4y1P7yV/?視頻中測試生成的圖像。
由于專欄對上傳圖像大小的限制,無法上傳大小超過 20MB 的?PNG 原圖,所以我只能將 PNG 轉(zhuǎn)成 JPG再上傳。
Latent(兩次線性)(2x放大)
跑圖顯卡:A10(性能介于 RTX A5000 和 RTX 3090之間)
原圖尺寸:512 x 832
超分放大后尺寸:1024 x 1664
單張圖耗時:約 20s

可以看到,Latent 放大算法在低重繪幅度下,生成的圖像是模糊的。
在該例子中:
0.3的圖像開始可用,前提是你喜歡這種朦朧感。
0.4~0.6的圖像的超分放大效果較好。
????0.4的圖像,背景仍然存在模糊感
????0.6的圖像,背景開始發(fā)生變化(左側(cè)的樹枝變成一堆綠葉)。
從0.7開始,畫面內(nèi)容出現(xiàn)較大變化。
????0.7的圖像背景與前面的圖像相比發(fā)生了較大的變化。另外,右側(cè)底部的手也出現(xiàn)了問題。????
????0.8的的圖像不僅背景有較大變化,人物的服裝也發(fā)生較大變化。
????0.9和1.0的圖像,直接古神化。
Latent(兩次線性)(4x放大)
跑圖顯卡:A10(性能介于 RTX A5000 和 RTX 3090之間)
原圖尺寸:512 x 832
超分放大后尺寸:2048?x 3328
單張圖耗時:約 4min

可以看到,4x放大的效果無論在那個重繪幅度下都挺差的。
在該例子中:
0.4之前的圖像都是模糊的。
0.5~0.6的圖像雖然不模糊,但畫面是扭曲的。
????0.4的圖像,背景仍然存在模糊感。
????0.6的圖像,背景開始發(fā)生變化(左側(cè)的樹枝變成一堆綠葉)。
從0.7開始,畫面直接放飛自我,直通古神。
R-ESRGAN 4x+?(2x放大)
跑圖顯卡:A10(性能介于 RTX A5000 和 RTX 3090之間)
原圖尺寸:512 x 832
超分放大后尺寸:1024 x 1664
單張圖耗時:約 20s

在該例子中:
0~0.5的圖像都比較正常。
????當(dāng)重繪幅度為0時,相當(dāng)于用后期處理直接進行超分放大。
從0.6開始,畫面內(nèi)容出現(xiàn)變化。
????0.6和0.7的圖像,背景發(fā)生變化。
????0.8的圖像,背景和人物服裝都發(fā)生了變化。
0.9和1.0的圖像,直接古神化。
R-ESRGAN 4x+?(4x放大)
跑圖顯卡:A10(性能介于 RTX A5000 和 RTX 3090之間)
原圖尺寸:512 x 832
超分放大后尺寸:2048?x 3328
單張圖耗時:約 4min

與 Latent 放大算法的情況不同,R-ESRGAN 4x+ 放大算法在低重繪幅度下的圖還是可以用的。
在該例子中:
0~0.3的圖像效果還是可以接受的。
????當(dāng)重繪幅度為0時,相當(dāng)于用后期處理直接進行超分放大。
從0.4的圖像開始,畫面背景逐漸變模糊。
? ? 0.6的圖像,右側(cè)底部的手出現(xiàn)了問題。
????0.7的圖像,手臂直接變成了頭發(fā)。
從0.8的圖像開始,畫面逐漸古神化。
Latent(nearest)與?Latent(nearest-exact)
2x放大
原圖尺寸:512 x 832
超分放大后尺寸:1024 x 1664

當(dāng)放大倍數(shù)為整數(shù)倍時,兩個 Latent 放大算法的區(qū)別不大。
1.5x放大
原圖尺寸:512 x 832
超分放大后尺寸:768 x 1248

當(dāng)放大倍數(shù)不是整數(shù)時,兩個 Latent 放大算法的區(qū)別就展現(xiàn)出來了。
可對比兩張圖像的以下部分:
頭頂?shù)暮Y(jié)、劉海、眼睛、耳環(huán)、脖子上的飾品、裙子的裝飾以及裙擺的裝飾等。
另外,用 Latent(nearest)放大算法生成的圖像,女孩的左肩位置存在類似頭發(fā)的偽影。