Stability AI 發(fā)布 Stable Doodle,一個(gè)草圖到圖像的工具
Stability AI 是一家專注于圖像生成模型 Stable Diffusion 的創(chuàng)業(yè)公司,它最近推出了一項(xiàng)新的服務(wù),可以將草圖轉(zhuǎn)換成圖像。這項(xiàng)草圖到圖像的服務(wù),名為 Stable Doodle,利用了最新的 Stable Diffusion 模型來分析草圖的輪廓,并生成一個(gè)“視覺上令人愉悅”的藝術(shù)效果。它從今天開始通過 ClipDrop 平臺(tái)提供,ClipDrop 是 Stability AI 在三月份通過收購(gòu) Init ML(一家由前谷歌員工創(chuàng)立的 AI 創(chuàng)業(yè)公司)而獲得的平臺(tái)。

Stable Doodle 面向?qū)I(yè)人士和新手,無論他們對(duì) AI 工具有多熟悉。Stability AI 在一篇與 TechCrunch 通過電子郵件分享的博客文章中寫道:“有了 Stable Doodle,任何具有基本繪畫技巧和網(wǎng)絡(luò)連接的人都可以在幾秒鐘內(nèi)生成高質(zhì)量的原創(chuàng)圖像?!?/p>
市場(chǎng)上有很多草圖到圖像的 AI 工具,包括開源項(xiàng)目和廣告支持的應(yīng)用。但 Stable Doodle 的獨(dú)特之處在于它允許對(duì)圖像生成進(jìn)行更“精確”的控制。Stability AI 堅(jiān)稱,在 Stable Doodle 的背后是一個(gè) Stable Diffusion 模型——Stable Diffusion XL——與騰訊的一個(gè)研發(fā)部門——應(yīng)用研究中心(ARC)開發(fā)的一個(gè)“條件控制解決方案”相結(jié)合。這個(gè)控制解決方案叫做 T2I-Adapter,它既允許 Stable Diffusion XL 接受草圖作為輸入,又指導(dǎo)模型進(jìn)行輸出藝術(shù)品的更好微調(diào)。

Stability AI 解釋說:“T2I-Adapter 使 Stable Doodle 能夠理解草圖的輪廓,并根據(jù)與模型定義的輪廓相結(jié)合的提示生成圖像。”
在 Stable Doodle 發(fā)布之前,本文作者沒有機(jī)會(huì)測(cè)試它。但 Stability AI 發(fā)給我看的精選圖片看起來相當(dāng)不錯(cuò),至少與啟發(fā)它們的涂鴉相比。除了草圖外,Stable Doodle 還接受一個(gè)提示來指導(dǎo)圖像生成過程,例如“一個(gè)舒適的椅子,‘等軸’風(fēng)格”或“穿著牛仔夾克的貓,‘?dāng)?shù)字藝術(shù)’風(fēng)格”。不過,定制也有限制——在發(fā)布時(shí),Stable Doodle 只支持 14 種藝術(shù)風(fēng)格。

Stability AI 設(shè)想 Stable Doodle 可以作為設(shè)計(jì)師、插畫家和其他專業(yè)人士的工具,來“節(jié)省寶貴的時(shí)間”和“最大化效率”。同時(shí),該公司也提醒說,輸出圖像的質(zhì)量取決于初始繪畫的細(xì)節(jié)、提示的描述性以及所描繪場(chǎng)景的復(fù)雜性。
該公司建議說:“作為草圖繪制的想法可以立即應(yīng)用到作品中,創(chuàng)建客戶的設(shè)計(jì)、演示文稿和網(wǎng)站的素材,甚至創(chuàng)建 logo?!?/p>
“未來,Stable Doodle 將使用戶能夠?qū)氩輬D。此外,我們還將包括針對(duì)特定垂直領(lǐng)域的用例,例如房地產(chǎn)應(yīng)用等。”
Stable Doodle 的優(yōu)勢(shì)和挑戰(zhàn)

Stable Doodle 的推出是人工智能圖像生成領(lǐng)域的一次重大創(chuàng)新,它為用戶提供了一種簡(jiǎn)單而有趣的方式,將他們的創(chuàng)意想法轉(zhuǎn)化為精美的圖像。與其他基于文本的圖像生成工具(如 Dall-E 等)相比,Stable Doodle 有以下幾個(gè)優(yōu)勢(shì):
它可以利用用戶的繪畫技巧和直覺,使圖像生成更加直觀和富有表現(xiàn)力。
它可以根據(jù)用戶的喜好和需求,提供不同的藝術(shù)風(fēng)格和效果。
它可以節(jié)省用戶的時(shí)間和精力,無需編寫復(fù)雜的文本提示或進(jìn)行多次迭代。
它可以適用于各種專業(yè)和個(gè)人場(chǎng)景,如設(shè)計(jì)、插畫、教育、娛樂等。
然而,Stable Doodle 也面臨著一些挑戰(zhàn)和局限性,例如:
它仍然需要用戶輸入一些文本描述來指導(dǎo)圖像生成,這可能會(huì)增加用戶的負(fù)擔(dān)和不便。
它目前只支持有限的藝術(shù)風(fēng)格,可能無法滿足用戶的多樣化和個(gè)性化需求。
它對(duì)草圖的質(zhì)量和復(fù)雜度有一定的要求,否則可能會(huì)導(dǎo)致生成的圖像不準(zhǔn)確或不理想。
它可能會(huì)引發(fā)一些版權(quán)和道德問題,如用戶是否擁有生成的圖像的所有權(quán)和使用權(quán),以及如何防止濫用或侵犯他人的知識(shí)產(chǎn)權(quán)等。
Stable Doodle 的市場(chǎng)前景和競(jìng)爭(zhēng)力
根據(jù) Mordor Intelligence 的報(bào)告,AI 圖像識(shí)別市場(chǎng)預(yù)計(jì)將從 2023 年的 439.36 億美元增長(zhǎng)到 2028 年的 1090.55 億美元,年復(fù)合增長(zhǎng)率為 19.94%。這一市場(chǎng)的主要驅(qū)動(dòng)因素包括 AI 技術(shù)在醫(yī)療、零售、安全等領(lǐng)域的廣泛應(yīng)用,以及大數(shù)據(jù)、物聯(lián)網(wǎng)、工業(yè) 4.0 和 5G 等技術(shù)對(duì) AI 圖像生成需求的推動(dòng)。
在這一市場(chǎng)中,Stable Doodle 面臨著來自其他草圖到圖像工具的激烈競(jìng)爭(zhēng)。根據(jù) SourceForge 的報(bào)告,Stable Doodle 的主要競(jìng)爭(zhēng)對(duì)手包括:
Postly:一個(gè)基于 Stable Diffusion 和 T2I-Adapter 的在線 AI 圖像生成工具,可以根據(jù)文本提示生成各種風(fēng)格和主題的圖像。
Artimator:一個(gè)完全免費(fèi)的 AI 藝術(shù)生成器,也基于 Stable Diffusion 和 DALL-E 的人工智能,并且可以幫助用戶輕松地創(chuàng)建驚人和最美麗的藝術(shù)品。
Fotor:一個(gè)提供在線 AI 草圖生成器的平臺(tái),可以將簡(jiǎn)單的繪圖轉(zhuǎn)換成動(dòng)態(tài)的圖像,為各行各業(yè)的專業(yè)人士和愛好者提供無限的圖像創(chuàng)造可能性。
Picsart:一個(gè)提供 Sketch AI 應(yīng)用程序的平臺(tái),使用人工智能將草圖轉(zhuǎn)換成數(shù)字圖像。
為了在這一市場(chǎng)中獲得競(jìng)爭(zhēng)優(yōu)勢(shì),Stable Doodle 需要不斷創(chuàng)新和改進(jìn)其服務(wù),例如:
它可以增加更多的藝術(shù)風(fēng)格和主題,以適應(yīng)用戶的多元化和個(gè)性化需求。
它可以提供更多的定制選項(xiàng),如調(diào)整圖像的大小、顏色、亮度、對(duì)比度等。
它可以提供更多的交互功能,如預(yù)覽、編輯、保存、分享、打印等。
它可以提供更多的教育和娛樂功能,如教程、挑戰(zhàn)、游戲等。
它可以解決一些版權(quán)和道德問題,如明確用戶的權(quán)利和責(zé)任,以及遵守相關(guān)的法律和規(guī)范等。
Stable Doodle 的未來展望和意義
Stable Doodle 是一個(gè)有前途的 AI 圖像生成工具,它展示了人工智能在創(chuàng)意領(lǐng)域的巨大潛力。它不僅可以為專業(yè)人士和新手提供一種簡(jiǎn)單而有趣的方式,將他們的創(chuàng)意想法轉(zhuǎn)化為精美的圖像,還可以為各種專業(yè)和個(gè)人場(chǎng)景提供有價(jià)值的服務(wù)。它也可以激發(fā)用戶的想象力和創(chuàng)造力,讓他們體驗(yàn)到 AI 的魅力和樂趣。