散文網(wǎng) » 生活 »日常 » Stability AI 發(fā)布 Stable Doodle，一個(gè)草圖到圖像的工具

Stability AI 發(fā)布 Stable Doodle，一個(gè)草圖到圖像的工具

2023-07-17 08:38 作者:風(fēng)中的瀟瀟醬 0人讀過 | 我要投稿

Stability AI 是一家專注于圖像生成模型 Stable Diffusion 的創(chuàng)業(yè)公司，它最近推出了一項(xiàng)新的服務(wù)，可以將草圖轉(zhuǎn)換成圖像。這項(xiàng)草圖到圖像的服務(wù)，名為 Stable Doodle，利用了最新的 Stable Diffusion 模型來分析草圖的輪廓，并生成一個(gè)“視覺上令人愉悅”的藝術(shù)效果。它從今天開始通過 ClipDrop 平臺(tái)提供，ClipDrop 是 Stability AI 在三月份通過收購(gòu) Init ML（一家由前谷歌員工創(chuàng)立的 AI 創(chuàng)業(yè)公司）而獲得的平臺(tái)。

Stable Doodle 面向?qū)I(yè)人士和新手，無論他們對(duì) AI 工具有多熟悉。Stability AI 在一篇與 TechCrunch 通過電子郵件分享的博客文章中寫道：“有了 Stable Doodle，任何具有基本繪畫技巧和網(wǎng)絡(luò)連接的人都可以在幾秒鐘內(nèi)生成高質(zhì)量的原創(chuàng)圖像?！?/p>

市場(chǎng)上有很多草圖到圖像的 AI 工具，包括開源項(xiàng)目和廣告支持的應(yīng)用。但 Stable Doodle 的獨(dú)特之處在于它允許對(duì)圖像生成進(jìn)行更“精確”的控制。Stability AI 堅(jiān)稱，在 Stable Doodle 的背后是一個(gè) Stable Diffusion 模型——Stable Diffusion XL——與騰訊的一個(gè)研發(fā)部門——應(yīng)用研究中心（ARC）開發(fā)的一個(gè)“條件控制解決方案”相結(jié)合。這個(gè)控制解決方案叫做 T2I-Adapter，它既允許 Stable Diffusion XL 接受草圖作為輸入，又指導(dǎo)模型進(jìn)行輸出藝術(shù)品的更好微調(diào)。

Stability AI 解釋說：“T2I-Adapter 使 Stable Doodle 能夠理解草圖的輪廓，并根據(jù)與模型定義的輪廓相結(jié)合的提示生成圖像。”

在 Stable Doodle 發(fā)布之前，本文作者沒有機(jī)會(huì)測(cè)試它。但 Stability AI 發(fā)給我看的精選圖片看起來相當(dāng)不錯(cuò)，至少與啟發(fā)它們的涂鴉相比。除了草圖外，Stable Doodle 還接受一個(gè)提示來指導(dǎo)圖像生成過程，例如“一個(gè)舒適的椅子，‘等軸’風(fēng)格”或“穿著牛仔夾克的貓，‘?dāng)?shù)字藝術(shù)’風(fēng)格”。不過，定制也有限制——在發(fā)布時(shí)，Stable Doodle 只支持 14 種藝術(shù)風(fēng)格。

Stability AI 設(shè)想 Stable Doodle 可以作為設(shè)計(jì)師、插畫家和其他專業(yè)人士的工具，來“節(jié)省寶貴的時(shí)間”和“最大化效率”。同時(shí)，該公司也提醒說，輸出圖像的質(zhì)量取決于初始繪畫的細(xì)節(jié)、提示的描述性以及所描繪場(chǎng)景的復(fù)雜性。

該公司建議說：“作為草圖繪制的想法可以立即應(yīng)用到作品中，創(chuàng)建客戶的設(shè)計(jì)、演示文稿和網(wǎng)站的素材，甚至創(chuàng)建 logo?！?/p>

“未來，Stable Doodle 將使用戶能夠?qū)氩輬D。此外，我們還將包括針對(duì)特定垂直領(lǐng)域的用例，例如房地產(chǎn)應(yīng)用等。”

Stable Doodle 的優(yōu)勢(shì)和挑戰(zhàn)

Stable Doodle 的推出是人工智能圖像生成領(lǐng)域的一次重大創(chuàng)新，它為用戶提供了一種簡(jiǎn)單而有趣的方式，將他們的創(chuàng)意想法轉(zhuǎn)化為精美的圖像。與其他基于文本的圖像生成工具（如 Dall-E 等）相比，Stable Doodle 有以下幾個(gè)優(yōu)勢(shì)：

它可以利用用戶的繪畫技巧和直覺，使圖像生成更加直觀和富有表現(xiàn)力。
它可以根據(jù)用戶的喜好和需求，提供不同的藝術(shù)風(fēng)格和效果。
它可以節(jié)省用戶的時(shí)間和精力，無需編寫復(fù)雜的文本提示或進(jìn)行多次迭代。
它可以適用于各種專業(yè)和個(gè)人場(chǎng)景，如設(shè)計(jì)、插畫、教育、娛樂等。

然而，Stable Doodle 也面臨著一些挑戰(zhàn)和局限性，例如：

它仍然需要用戶輸入一些文本描述來指導(dǎo)圖像生成，這可能會(huì)增加用戶的負(fù)擔(dān)和不便。
它目前只支持有限的藝術(shù)風(fēng)格，可能無法滿足用戶的多樣化和個(gè)性化需求。
它對(duì)草圖的質(zhì)量和復(fù)雜度有一定的要求，否則可能會(huì)導(dǎo)致生成的圖像不準(zhǔn)確或不理想。
它可能會(huì)引發(fā)一些版權(quán)和道德問題，如用戶是否擁有生成的圖像的所有權(quán)和使用權(quán)，以及如何防止濫用或侵犯他人的知識(shí)產(chǎn)權(quán)等。

Stable Doodle 的市場(chǎng)前景和競(jìng)爭(zhēng)力

根據(jù) Mordor Intelligence 的報(bào)告，AI 圖像識(shí)別市場(chǎng)預(yù)計(jì)將從 2023 年的 439.36 億美元增長(zhǎng)到 2028 年的 1090.55 億美元，年復(fù)合增長(zhǎng)率為 19.94%。這一市場(chǎng)的主要驅(qū)動(dòng)因素包括 AI 技術(shù)在醫(yī)療、零售、安全等領(lǐng)域的廣泛應(yīng)用，以及大數(shù)據(jù)、物聯(lián)網(wǎng)、工業(yè) 4.0 和 5G 等技術(shù)對(duì) AI 圖像生成需求的推動(dòng)。

在這一市場(chǎng)中，Stable Doodle 面臨著來自其他草圖到圖像工具的激烈競(jìng)爭(zhēng)。根據(jù) SourceForge 的報(bào)告，Stable Doodle 的主要競(jìng)爭(zhēng)對(duì)手包括：

Postly：一個(gè)基于 Stable Diffusion 和 T2I-Adapter 的在線 AI 圖像生成工具，可以根據(jù)文本提示生成各種風(fēng)格和主題的圖像。
Artimator：一個(gè)完全免費(fèi)的 AI 藝術(shù)生成器，也基于 Stable Diffusion 和 DALL-E 的人工智能，并且可以幫助用戶輕松地創(chuàng)建驚人和最美麗的藝術(shù)品。
Fotor：一個(gè)提供在線 AI 草圖生成器的平臺(tái)，可以將簡(jiǎn)單的繪圖轉(zhuǎn)換成動(dòng)態(tài)的圖像，為各行各業(yè)的專業(yè)人士和愛好者提供無限的圖像創(chuàng)造可能性。
Picsart：一個(gè)提供 Sketch AI 應(yīng)用程序的平臺(tái)，使用人工智能將草圖轉(zhuǎn)換成數(shù)字圖像。

為了在這一市場(chǎng)中獲得競(jìng)爭(zhēng)優(yōu)勢(shì)，Stable Doodle 需要不斷創(chuàng)新和改進(jìn)其服務(wù)，例如：

它可以增加更多的藝術(shù)風(fēng)格和主題，以適應(yīng)用戶的多元化和個(gè)性化需求。
它可以提供更多的定制選項(xiàng)，如調(diào)整圖像的大小、顏色、亮度、對(duì)比度等。
它可以提供更多的交互功能，如預(yù)覽、編輯、保存、分享、打印等。
它可以提供更多的教育和娛樂功能，如教程、挑戰(zhàn)、游戲等。
它可以解決一些版權(quán)和道德問題，如明確用戶的權(quán)利和責(zé)任，以及遵守相關(guān)的法律和規(guī)范等。

Stable Doodle 的未來展望和意義

Stable Doodle 是一個(gè)有前途的 AI 圖像生成工具，它展示了人工智能在創(chuàng)意領(lǐng)域的巨大潛力。它不僅可以為專業(yè)人士和新手提供一種簡(jiǎn)單而有趣的方式，將他們的創(chuàng)意想法轉(zhuǎn)化為精美的圖像，還可以為各種專業(yè)和個(gè)人場(chǎng)景提供有價(jià)值的服務(wù)。它也可以激發(fā)用戶的想象力和創(chuàng)造力，讓他們體驗(yàn)到 AI 的魅力和樂趣。

標(biāo)簽：AI