Stable Diffusion V2.1非標(biāo)準(zhǔn)分辨率圖像高清渲染
Stable Diffusion V2.1非標(biāo)準(zhǔn)分辨率圖像高清渲染
Stable Diffusion V2.1發(fā)布,支持非標(biāo)準(zhǔn)分辨率圖像高清渲染。
SD2.1在線體驗
在線體驗地址:http://acg.aiartwork.online/
模型包括:
NovelAI,NovelAI的模型訓(xùn)練使用了數(shù)千個網(wǎng)站的數(shù)十億張圖片,包括 Pixiv、Twitter、DeviantArt、Tumblr等網(wǎng)站的作品。
Waifu,waifu的模型可用于生成二次元的卡通形象,可以生成獨有的二次元動漫小姐姐和主人公
Stable diffusion-v2.1,以英文為輸入的通用圖像生成模型
這次發(fā)布,距離2.0大版本更新相距不到兩周時間。一方面體現(xiàn)了公司效率之高;但另一方面,也暴露了前代模型存在的諸多不足。
本次更新,主要有三大亮點。
減少人像過濾:可以澀澀,但不完全能
在2.0版本中,為了防止色情內(nèi)容和名人肖像的濫用,保護人類藝術(shù)家的權(quán)益,Stability AI使用了LAION的NSFW(不適宜辦公場所觀看)過濾器,過濾成人內(nèi)容。
但是,許多用戶反映,該過濾器過于保守,對于一些模棱兩可的圖像,只要機器認(rèn)定是NSFW的內(nèi)容,就會慘遭「和諧」。
這減少了模型訓(xùn)練數(shù)據(jù)集中的人物數(shù)量,導(dǎo)致用2.0創(chuàng)作的人像圖片都顯得異常詭異。

StabilityAI聽取了用戶的反饋,調(diào)整過濾器以減少限制。
在與LAION-5B的開發(fā)者合作分析了NSFW過濾器及其對訓(xùn)練數(shù)據(jù)的影響后,將設(shè)置調(diào)整得更加平衡。
調(diào)整后的版本在引入新的提示詞的基礎(chǔ)上,加入了許多之前版本的提示詞,以便在2.0中過濾掉的絕大多數(shù)圖像重新加入訓(xùn)練數(shù)據(jù)集,用以訓(xùn)練2.1版本。
但是官方也給各位老司機潑了盆冷水:2.1版本仍然會去除絕大多數(shù)成人內(nèi)容。
畢竟,減少過濾限制是為了提升人像精度。
2.1版本在2.0的模型上進行微調(diào),不僅可以輕松呈現(xiàn)美麗的建筑概念和自然風(fēng)光,也可以生成人物和流行文化的夢幻形象。

非標(biāo)準(zhǔn)分辨率圖像渲染加強,輕松制作8K大片
該模型還能夠渲染非標(biāo)準(zhǔn)分辨率的圖像。這可以幫助用戶完成各種創(chuàng)舉,例如使用極致的縱橫比,為用戶提供美麗的遠(yuǎn)景和史詩般的寬屏圖像。
2.0版本相較于1.0版本,最大的更新在于生成圖像,尤其是建筑概念和自然風(fēng)光圖像的質(zhì)量。
而2.1版本更是在建筑、室內(nèi)設(shè)計、野生動物和景觀場景方面的圖像質(zhì)量上,進行了又一次飛躍。


2.1版本之所以能輕松呈現(xiàn)美麗的建筑概念和自然風(fēng)光,主要依靠其更長的訓(xùn)練時長。
與模型2.0相比,新版本在LAION數(shù)據(jù)集上多訓(xùn)練了接近20萬個樣本。訓(xùn)練數(shù)據(jù)的增加,大大提升了非標(biāo)準(zhǔn)分辨率圖像的渲染能力。
加強反向提示詞,圖像更精致
反向提示詞(negative prompt)與提示相反,它允許用戶告訴模型不生成什么。
該版本加強了反向提示詞的應(yīng)用,用于消除不需要的細(xì)節(jié),進行圖像微調(diào),例如手部損壞、手指過多或失焦和圖像模糊。

用戶可以使用加權(quán)提示提示模型,對組合中的特定元素進行微調(diào),例如某些顏色、對象或?qū)傩浴?/p>
使用提示加權(quán)優(yōu)化整體圖像,以增加或減少合成元素,使用戶能夠更好地控制圖像合成。

根據(jù)沒有反向提示詞(左)和有反向提示詞(右)生成圖片的比較,可以發(fā)現(xiàn)后者在細(xì)節(jié)方面更加完美。
該圖中,反向提示用于告訴模型限制樹木、灌木叢、樹葉和綠色植物的突出程度,同時保持相同的初始輸入提示。

雖然此次版本更新未能完全開放NSFW內(nèi)容,但并不影響用戶使用的熱情。畢竟在AIGC領(lǐng)域,Stable Diffusion是當(dāng)之無愧的頂流。