解讀Google新繪畫AI,會(huì)如何影響你的工作?——“google MUSE A
2023-02-14 01:19 作者:戰(zhàn)爭(zhēng)學(xué)院拉克絲 | 我要投稿

MUSE
介紹
Muse是一種文本到圖像生成模型(Google新繪畫模型),其利用離散令牌作為圖像生成的基本單位,使得生成過(guò)程變得高效。
優(yōu)勢(shì)
Muse這種是對(duì)創(chuàng)作者更合適的工具。
自己得有能力,判斷,審美,整合,取其精華去其糟粕。
- 生成速度更快。
- 圖像的質(zhì)量和語(yǔ)義理解不會(huì)有所損失。
- 數(shù)量和空間關(guān)系正確
- 生成圖片上的文字更準(zhǔn)確
- 可以修改圖像。通過(guò)基于mask的訓(xùn)練,實(shí)現(xiàn)了霧-shot圖像編輯能力
- 零-shot
- 文本指導(dǎo)修復(fù)、擴(kuò)展
- 無(wú)遮罩編輯
論文
- 論文地址:https://arxiv.org/abs/2301.00704
- 參數(shù)量和stable diffusion的UNET差不多,900M左右。
- 引入mask來(lái)guide空間
- 把UNET替換成了純transformer
標(biāo)簽: