最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

AI繪畫|讓我們從最根本的原理開(kāi)始講起

2023-04-12 15:29 作者:酸梅干超人的電話亭  | 我要投稿

最近大火的 AI 繪畫,并不是一個(gè)全新的事物,早在2015年就已經(jīng)出現(xiàn)了基于 GAN (生成對(duì)抗網(wǎng)絡(luò)) 生成圖像的 AI 應(yīng)用實(shí)例,但因?yàn)榧夹g(shù)的不成熟,并沒(méi)有得到廣泛的推廣。

這兩年因?yàn)轱@卡算力的增長(zhǎng)和擴(kuò)散模型的出現(xiàn),AI 繪畫迎來(lái)了一波熱潮,大有要把 “低能” 的設(shè)計(jì)師干失業(yè)的兇猛勢(shì)頭,無(wú)論是網(wǎng)上的社區(qū)還是微信社群,都彌漫著一股恐慌的氣氛。

對(duì)于 UI 設(shè)計(jì)師來(lái)說(shuō),這種恐慌是無(wú)謂的、盲目的、幼稚的,但我光這么說(shuō)是沒(méi)用的,因?yàn)榭謶謥?lái)源未知。就像之前一篇分享的評(píng)論中,很多夸大 AI 作用的設(shè)計(jì)師 “既不懂項(xiàng)目,也不懂 AI 是什么”……

所以,項(xiàng)目的分享前面已經(jīng)做了很多,這篇分享主要用白話就和大家做一次基礎(chǔ)的掃盲:

  1. AI 插畫到底是什么

  2. 目前有哪些 AI 插畫工具

  3. 它們的生成方式和過(guò)程

  4. 相關(guān)的限制和阻力

  5. 可以應(yīng)用的具體場(chǎng)景


AI 繪畫是一種利用人工智能技術(shù) (其實(shí)就是機(jī)器學(xué)習(xí)算法) 創(chuàng)作視覺(jué)作品的方法。

AI 繪畫的應(yīng)用,是部分科學(xué)家和工程師,先搭建了可以學(xué)習(xí)圖像來(lái)自我完善和強(qiáng)化的技術(shù),接著提供給它成百上千萬(wàn)的圖像,讓它通這些養(yǎng)分快速成長(zhǎng),理解不同的具體事物、光影、風(fēng)格是什么。然后,當(dāng)我們輸入相關(guān)的文本信息指令時(shí),它就會(huì)通過(guò)這些文本內(nèi)容去匹配自己已經(jīng)理解和記錄的圖形要素,并將它們繪制出來(lái)。

說(shuō)是 AI,但它的本質(zhì)依然是一種算法,一種對(duì)規(guī)律的記憶和復(fù)現(xiàn),是一種數(shù)學(xué)化的總結(jié)和組合,并不是抽象的藝術(shù)思考和創(chuàng)作,距離多數(shù)人想象中真正的人工智能其實(shí)還差了很遠(yuǎn)。

目前市面上涌現(xiàn)出了一大批 AI 繪畫工具,這里我介紹其中最有代表性的幾個(gè):Stable diffusion、Midjourney、Adobe Firefly。


Stable Diffusion

Stable Diffusion (簡(jiǎn)稱SD) 是一個(gè)可以本地部署的 AI 程序,因?yàn)槠溟_(kāi)源的屬性,讓大多數(shù)不想花錢且動(dòng)手能力強(qiáng)的用戶可以快速搭建并生成任意數(shù)量的結(jié)果。也能依據(jù)自己的需求和畫風(fēng)進(jìn)行針對(duì)性的大模型訓(xùn)練,還可以擴(kuò)展相關(guān)的插件和模型,包括對(duì) VAE、Lora、Control net 等,包含了極多的設(shè)置選項(xiàng)和上限。


Midjourney

Midjourney (簡(jiǎn)稱MJ) 是市面上商業(yè)化最成功的在線 AI 繪畫服務(wù)商,是一款運(yùn)行在 Discord 上的程序(類似小程序),只需要進(jìn)行幾步簡(jiǎn)單的注冊(cè)和操作就能登錄使用。是目前影響力最大,使用人數(shù)最多的 AI 繪畫工具。

2022年有人拿著 MJ 生成的畫參加科羅拉多州立博物館舉辦的「Fine Art Exhibition」美術(shù)展,并獲得了一等獎(jiǎng),就是下面這張:

雖然不知道這個(gè)獎(jiǎng)項(xiàng)有多大的炒作成份,但是實(shí)打?qū)嵉淖?MJ 迎來(lái)了熱度的大爆發(fā),用戶量在一個(gè)月之間增長(zhǎng)了4倍。也由此可見(jiàn) MJ 在對(duì)藝術(shù)繪畫風(fēng)格的生成上有著不俗的能力。當(dāng)然 MJ 也有偏向二次元的 Niji 模型偏向真實(shí)攝影的 testp、V5 模型。


Adobe Firefly

Adobe Firefly 是 Adobe 自己開(kāi)發(fā)的 AI 工具,是這幾個(gè) AI 生成工具中最年輕的,前不久剛剛推出 beta 測(cè)試。作為一家以軟件工具作為核心業(yè)務(wù)的企業(yè),F(xiàn)irefly 自帶很深的生產(chǎn)力屬性,除了在生成過(guò)程中提供表單式的選項(xiàng)外,還支持對(duì)生成內(nèi)容進(jìn)行圖層分層,并導(dǎo)入到自家軟件。

雖然 Firefly 目前才剛剛起步,但以 AI 繪畫這種需要大量資源投喂的方向來(lái)說(shuō),Adobe 有得天獨(dú)厚的優(yōu)勢(shì),未來(lái)直接接入 PS、AI、AE 等工具是必然的,也是可以最貼合平面類設(shè)計(jì)工作的工具。

除了它們?nèi)齻€(gè)以外,還有別的很多繪圖工具,不管是正在快速迭代的,還是開(kāi)發(fā)中的,如 Dalle、NovelAI、NightCafe Creator、Tiamat、Imagen、Parti 等。

作為 AI 繪畫的起步階段,目前我們不能完全斷言哪個(gè)工具最后會(huì)成為效果最好,最適合我們的。但可以肯定的是,整個(gè)行業(yè)都在快速成長(zhǎng),現(xiàn)狀不能代表未來(lái)的格局。具體會(huì)發(fā)展到什么地步,就要拭目以待了。


就像把大象裝進(jìn)冰箱只需要三步,所有AI繪畫基本上都分為這幾個(gè)步驟:


模型的預(yù)訓(xùn)練

步驟中這個(gè)潛在空間的映射過(guò)程,就是模型預(yù)訓(xùn)練的結(jié)果,也就是說(shuō)你訓(xùn)練模型時(shí)是如何做文本到圖片的對(duì)應(yīng)的,那么生成時(shí)候就會(huì)大概率做同樣的對(duì)應(yīng)。

并且這種對(duì)應(yīng),是在模型訓(xùn)練完成就難以再修改的。因?yàn)槟P陀?xùn)練的數(shù)據(jù)量和計(jì)算力需求極為龐大,所以除非大公司有龐大的資源進(jìn)行模型訓(xùn)練,否則如果是使用現(xiàn)有的 AI 大模型,個(gè)人想要進(jìn)行微調(diào)幾乎是難以實(shí)現(xiàn)的。

舉個(gè)例子來(lái)說(shuō),現(xiàn)有的 MJ 因?yàn)槿鄙僮帜笖?shù)字字形的訓(xùn)練,所以生成的所有圖形幾乎都與具體的字形無(wú)關(guān),哪怕你給它指定了圖片中需要數(shù)字「0」,它也做不到,因?yàn)樗X瓜里沒(méi)有這樣的東西。

就像我讓你畫一個(gè)王鷲,你連這動(dòng)物見(jiàn)都沒(méi)見(jiàn)過(guò),怎么可能畫得出來(lái)。模型的作用就像你對(duì)世界的認(rèn)識(shí),沒(méi)有輸入和學(xué)習(xí),就沒(méi)有認(rèn)識(shí)。

?

圖片生成器

市面上有好幾個(gè)不同的方案來(lái)實(shí)現(xiàn)圖片的最終生成,例如 MJ、Firefly 主要采用的GAN (生成對(duì)抗網(wǎng)絡(luò)),以及 SD 使用的擴(kuò)散算法,還有 VAE (變分自動(dòng)解碼器)等等。

不過(guò)不管它們具體使用的方法是什么,其過(guò)程大致抽象如下:生成器首先生成一個(gè)低分辨率的圖片,每一層神經(jīng)網(wǎng)絡(luò)會(huì)在此基礎(chǔ)上添加不同層級(jí)的特征和細(xì)節(jié),就好像 AI 慢慢地把一副模糊的,低細(xì)節(jié)的畫,畫得更清晰、細(xì)節(jié)更豐富。

在這個(gè)過(guò)程中,我們不能夠進(jìn)行人為干預(yù),你想要更改其中的某些細(xì)節(jié),就需要重新修改 Prompt (描述詞),讓 AI 重新生成,并且還無(wú)法保證你的此次修改能否起效。因?yàn)槲覀儫o(wú)法理解 AI 是如何拆解你的 Prompt 并對(duì)應(yīng)到圖片上去的,對(duì)使用者來(lái)說(shuō),這就是一個(gè)「黑箱」。


具體的圖像生成

每個(gè) AI 繪畫工具都會(huì)有一個(gè)關(guān)鍵字輸入框,通過(guò)對(duì)應(yīng)語(yǔ)法輸入相關(guān)的指令和描述,來(lái)生成圖像。而每個(gè)工具對(duì)文本的理解和模型不同,即使用一樣的描述生成的東西也不一樣。根據(jù)前面預(yù)訓(xùn)練的說(shuō)明,不同模型擅長(zhǎng)的和畫不了的東西也不一樣。

所以,下面我們就用一組基本一樣的關(guān)鍵詞,在不同的工具中生成對(duì)應(yīng)的結(jié)果:


這里要強(qiáng)調(diào),想要獲得越理想的結(jié)果,描述就要越準(zhǔn)確,而且畫面結(jié)果越復(fù)雜,需要描述的字?jǐn)?shù)也就越多。需要氛圍感越強(qiáng),情緒的描寫也就需要越生動(dòng)。想象下那些描寫生動(dòng)的文學(xué)作品,能讓我們腦子里有畫面,語(yǔ)言的描述方式就越細(xì)致、越特別。

比如搭配 GPT-4生成的MJ描述文本:

當(dāng) AI 幫助我們完成一幅畫的時(shí)候,有很多元素它可以進(jìn)行自定的補(bǔ)全,比如畫個(gè)人,你可以不指定他有牙齒,但只要你打入 open smile 的話AI自然會(huì)根據(jù)正常情況去畫出牙齒。

但我們進(jìn)入到非常規(guī)的情況,比如 UI 設(shè)計(jì),每一個(gè) UI 界面都有它自己的獨(dú)特性 —— 字段不同。也就是出現(xiàn)在這個(gè)畫布中的所有內(nèi)容信息不一致,這個(gè)是絕對(duì)不可能依托腦補(bǔ)實(shí)現(xiàn)的。

那么,即使有團(tuán)隊(duì)開(kāi)發(fā)了非常強(qiáng)大的文生圖 AI 繪圖工具,也一樣需要把畫面中出現(xiàn)的字段全部輸入一遍,即使再簡(jiǎn)單的字段,你也需要描述它在畫面中出現(xiàn)的特征、權(quán)重、交互和屬性。

你們可以想象下如果用文本方式去指定下面這些頁(yè)面應(yīng)該怎么完成:



AI 繪畫再?gòu)?qiáng)大,能生成再多讓你驚嘆的畫面,它也有自身的局限性。就像前面說(shuō)的,它不是真正的 AI,僅僅只是 “一種對(duì)規(guī)律的記憶和復(fù)現(xiàn),是一種數(shù)學(xué)化的總結(jié)和組合”。


一. 依賴模型

之前說(shuō)過(guò),AI生成的圖像是什么風(fēng)格,極大程度依賴于它是如何接受訓(xùn)練的,市面上有很多專門針對(duì)特定風(fēng)格的模型,都是這一特性之下出現(xiàn)的產(chǎn)物。

但這也并不能保證市面上有的模型就能百分之一百滿足你的工作需要,有些工作方向符合條件的團(tuán)隊(duì),可以自己訓(xùn)練模型,想要模型的效果好,就需要投入很多的人力去進(jìn)行手工的篩選和打標(biāo),且最終的模型效果很難保證。

而 UI 這個(gè)領(lǐng)域目前沒(méi)有這樣模型,AI 也并沒(méi)有建立對(duì) UI 中不同元素的認(rèn)識(shí)和理解,也就是讓它生成 UI 界面是隨機(jī)抄下這些元素進(jìn)行組合來(lái)但根本不清楚自己在做什么。


二. 隨機(jī)生成

生成器在生成低細(xì)節(jié)圖片時(shí),基本上就確定了構(gòu)圖,但這種確定是隨機(jī)的確定,也就是說(shuō)你通常很難指定圖片中的某樣?xùn)|西,在圖片中的哪個(gè)具體的位置。這種隨機(jī)性會(huì)消耗設(shè)計(jì)師大量的精力來(lái)進(jìn)行 rerolling,直到 AI 恰好隨到了一個(gè)比較符合你預(yù)期的構(gòu)圖。

但這樣一來(lái),就太依賴 AI 的即興發(fā)揮了,而在 UI 設(shè)計(jì)中,一個(gè)界面從上到下應(yīng)該包含哪些模塊,每個(gè)模塊里包含哪些字段是指定的非常具體的,和它的隨機(jī)性是完全背離的。


三. 指向性差

之前所舉的 MJ 無(wú)法生成具體的數(shù)字/字母,就是一個(gè)指向性差的例子。

MJ 雖然非常擅長(zhǎng)畫人物,畫山水,畫建筑,但它非常不擅長(zhǎng)畫抽象的人造物。除了字形之外,它還不能在已有的 IP 形象基礎(chǔ)上進(jìn)行姿勢(shì)、風(fēng)格、3D 化變體;對(duì)圖標(biāo)、logo 的描繪也比較差 (幾乎不可用);對(duì)元素進(jìn)行秩序排列也比較難做好。它太喜歡細(xì)節(jié)了,這些對(duì)人類來(lái)說(shuō)更簡(jiǎn)單的東西反而畫不明白。

尤其是在 UI 的領(lǐng)域中,我們往往對(duì)元素的制定有精確到像素的需要,已這種方式去要求 AI 顯然是本末倒置的,只能增加更多的工作量。


四. 難以微調(diào)

AI 繪畫的每一副圖片都要重新生成一次,比如在 MJ 中,你隨機(jī)無(wú)數(shù)次生成出接近自己想要的東西,但是要你要微調(diào)里面的內(nèi)容時(shí),卻會(huì)發(fā)現(xiàn)做不到,每次調(diào)整就是生成一張新的圖。

而在 SD 中,雖然可以使用圖片局部編輯,但是那個(gè)編輯僅僅是根據(jù)周邊環(huán)境對(duì)這個(gè)區(qū)域重新生成,能不能獲得你要的結(jié)果還是得碰運(yùn)氣。這在 UI 界面輸出的流程中是不可接受的,因?yàn)槲覀儠?huì)在確定的設(shè)計(jì)稿中替換元素位置,或者用指定元素替代現(xiàn)有元素。

手動(dòng)操作特別容易,但是AI的生成模式和我們?nèi)粘5氖謩?dòng)設(shè)計(jì)過(guò)程是完完全全不同的,所以它沒(méi)辦法支持,最后還是得靠我們自己去動(dòng)手完成。


AI 插畫確實(shí)可以在一些設(shè)計(jì)的領(lǐng)域起到革命性的作用,但目前多數(shù)是加快這些工作的效率和質(zhì)量,而不是直接替代,下面羅列一些具體的應(yīng)用場(chǎng)景。


插畫

首先肯定是插畫的領(lǐng)域,這個(gè)是目前 AI 做的最好也最成熟的方向。不管是游戲 CG 還是概念插畫、運(yùn)營(yíng)插畫,它都可以很好的完成。

當(dāng)然,基于前面說(shuō)到的那些缺點(diǎn),商用環(huán)境下是不會(huì)直接使用生成的結(jié)果上線的,而是要在這個(gè)基礎(chǔ)上使用 PS 進(jìn)行修改,或直接以此作為靈感重繪。

所以,要求稍高的商業(yè)插畫即使引入 AI 依舊需要專業(yè)的插畫師來(lái)操作,只是對(duì)他們的要求多了一項(xiàng)使用 AI 得技能。而最底層的插畫工人確實(shí)失業(yè)風(fēng)險(xiǎn)已經(jīng)近在眼前。


游戲UI

游戲 UI 也是插畫的一部分,只是繪制的范圍更小。過(guò)去游戲 UI 繪制界面中的圖標(biāo)是非常痛苦吃力的,一個(gè)簡(jiǎn)單的寶箱可能就要畫很多版本,絞盡腦汁。而 AI 繪畫就可以快速生成大量的版本,這些圖直接拿來(lái)修改或臨摹一遍,大大縮短了出圖時(shí)間。

這也是 AI 插畫目前影響最大的地方,因?yàn)橛螒蝽?xiàng)目組是非常嚴(yán)格控制成本的,而 AI 帶來(lái)的效率提升,讓個(gè)人生成力飛躍,那么自然不再需要那么多的游戲 UI。只要團(tuán)隊(duì)跑通對(duì)應(yīng)的流程,就可以立馬開(kāi)始裁員,精簡(jiǎn)團(tuán)隊(duì)的名額,這在各個(gè)頭部大廠已經(jīng)實(shí)際發(fā)生了。


平面包裝

平面包裝方向也是一個(gè)重點(diǎn)依賴抽象圖形的領(lǐng)域,對(duì)精確度的要求并不高,所以往往有一個(gè)模糊的方向和概念,設(shè)計(jì)師是樂(lè)于接受隨機(jī)生成結(jié)果和樣式的。

根據(jù)目前的實(shí)際產(chǎn)出案例質(zhì)量,包裝設(shè)計(jì)除了外部輪廓,可以大量依賴 AI 來(lái)生成需要噴刷的視覺(jué)圖案。但要記住圖案僅僅是包裝設(shè)計(jì)的一小部分,它的結(jié)果依舊需要專業(yè)的設(shè)計(jì)師來(lái)審視、篩選和修改(需要鋪開(kāi)和添加指定文字),所以會(huì)成為一個(gè)非常好的工具而不是直接取代包裝設(shè)計(jì)師。


服裝設(shè)計(jì)/攝影

在服裝領(lǐng)域,設(shè)計(jì)和攝影都不同程度受到 AI 影響。服裝設(shè)計(jì)很多時(shí)候仰賴一些抽象的靈感和思路,而 AI 的隨機(jī)性可以很好的提供給設(shè)計(jì)師靈感,但不管生成的圖質(zhì)量有多高,都需要專業(yè)的設(shè)計(jì)師根據(jù)成本、流行、材料、季節(jié)的關(guān)系對(duì)它進(jìn)行調(diào)整,重新繪制和打版。

而在成衣環(huán)節(jié),很多時(shí)候要拍攝模特圖片是要花費(fèi)很大成本和時(shí)間的,而將設(shè)計(jì)好的服裝在模特身上“試穿”已經(jīng)成為可以實(shí)現(xiàn)的功能。雖然目前還有很多缺陷,但可以遇見(jiàn)的是未來(lái)肯定會(huì)有專用的產(chǎn)品上線,對(duì)低端商拍和模特行業(yè)產(chǎn)生直接的影響。


建筑/室內(nèi)

還有就是因?yàn)?Controlnet 的應(yīng)用,AI插畫可以生成更細(xì)膩、豐富的室內(nèi)建筑、室內(nèi)效果圖了,往往產(chǎn)出的質(zhì)量還不錯(cuò),遠(yuǎn)超低端設(shè)計(jì)師的工作效果。

但是,光靠這種效果圖能完成最終建筑或室內(nèi)設(shè)計(jì)嗎?想想也知道不可能,因?yàn)閷?shí)際場(chǎng)景包含的各種限制、參數(shù)、需求是沒(méi)辦法有效反饋給AI讓它解決的。所以這些效果圖依舊只是飛機(jī)稿,為設(shè)計(jì)師提供靈感的工具。

但可以相見(jiàn)的是,如果 AI 生成效果圖那么好,未來(lái)如果能結(jié)合 3D 模型(如Sketchup)直接生成,而掠過(guò)使用3D軟件渲染的步驟,那么一方面出圖的時(shí)間大大縮短,另一方面設(shè)計(jì)師和客戶的溝通將變得無(wú)比高效。

之所以最后提那么多應(yīng)用的場(chǎng)景,就是為了讓大家明白一件事,AI 目前的能做的事情,僅僅是 —— 生成位圖。

除了需求比較基礎(chǔ)和低級(jí)的低端插畫市場(chǎng),商業(yè)項(xiàng)目直接使用 AI 生成結(jié)果上線,只會(huì)引發(fā)災(zāi)難性的后果。即使 Adobe 走的更快一點(diǎn),提供了圖層的區(qū)分,但也僅僅是不同層的位圖而已,還是要設(shè)計(jì)師打開(kāi) PS/AI 做調(diào)整。

因?yàn)橐曈X(jué)圖像僅僅是不同設(shè)計(jì)領(lǐng)域中的一個(gè)部分而已,是需要結(jié)合進(jìn)工作流和考慮各種外部影響的,這些判斷是需要專業(yè)設(shè)計(jì)師來(lái)完成的。

隨著 AI 的發(fā)展,不同的設(shè)計(jì)領(lǐng)域都會(huì)引入 AI 繪圖結(jié)合進(jìn)設(shè)計(jì)流程,但說(shuō)到底它只是一個(gè)工具,不可能包辦整個(gè)項(xiàng)目都出發(fā)到落地的所有細(xì)節(jié),因?yàn)檫@些關(guān)鍵的信息是在三次元中產(chǎn)生的,而項(xiàng)目又不是工業(yè)生產(chǎn)線,可以完全標(biāo)準(zhǔn)化運(yùn)作。

搞清楚這些內(nèi)容的想法,你就不會(huì)輕易被恐慌情緒牽著鼻子走,做一個(gè)無(wú)知且惶恐的局外人了。



結(jié)尾

如果后面有時(shí)間,我們也會(huì)在這個(gè)基礎(chǔ)上進(jìn)一步更新成系列新的教學(xué),指導(dǎo)大家如何安裝和使用 SD、MJ、Firefly,并輸出對(duì)應(yīng)的內(nèi)容。

想要看到這些的話,就記得多分享、點(diǎn)贊、留言~我們下篇再賤…


新課開(kāi)課倒計(jì)時(shí)一個(gè)月了,課前預(yù)習(xí)內(nèi)容都準(zhǔn)備好了,趕緊來(lái)變強(qiáng)~詳情請(qǐng)看??課程介紹:


AI繪畫|讓我們從最根本的原理開(kāi)始講起的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
积石山| 招远市| 巩义市| 伽师县| 沂水县| 左云县| 古蔺县| 胶州市| 凤阳县| 乃东县| 桑植县| 旺苍县| 承德市| 通山县| 拉萨市| 崇信县| 谢通门县| 蒲城县| 沈丘县| 荃湾区| 丹寨县| 永顺县| 万全县| 余干县| 苏州市| 宁国市| 怀安县| 洱源县| 隆安县| 永州市| 太白县| 永定县| 长治市| 广水市| 临清市| 綦江县| 乌海市| 九寨沟县| 瑞安市| 城口县| 华容县|