最易讀懂的AI繪畫發(fā)展史 | 設(shè)計史太濃

關(guān)于AI繪畫,過去已經(jīng)談過一次。

?
相關(guān)觀點至今沒變,屬于生產(chǎn)工具升級,生產(chǎn)關(guān)系暫時不變。
?
比如還沒看到相關(guān)報道有某個企業(yè)老板自習(xí)AI繪畫,辭去公司插畫師的新聞。
?
好像沒有。
?
這里頭有外行看熱鬧,內(nèi)行看門道,新手兩邊看的情況。
?
當(dāng)然,還有無數(shù)好事者的吶喊助威,各懷心思。
?
Ai繪畫目前更像一個人工智能玩具、素材制作、靈感參考、繪畫新工具的存在。
?
我們要敬畏它,學(xué)習(xí)它,運用它,但不要過分焦慮。
?
道理不復(fù)雜。
?
你連身邊同事都還沒比過,怎么好意思擔(dān)心人工智能。
?
而且這里頭有兩個重要問題有待解決,其一是版權(quán)。
?
如果AI生成圖像跟成名藝術(shù)家過于相像,容易形成抄襲一類維權(quán)糾紛。
?
這里頭容易埋坑,就是一但立法跟上,可能會對過去應(yīng)用進(jìn)行責(zé)任追討,律師事務(wù)所自然喜聞樂見,摩拳擦掌。
?
比如現(xiàn)在的圖片侵權(quán)可以是5年前取證,現(xiàn)在告你,問你怕不!
?
其二是如果不用以圖生圖方式,其實主流的兩大ai工具M(jìn)idJourney與Stable Diffusion都有較明顯的風(fēng)格化問題。
?
容易一眼看穿出身,形成我們設(shè)計圈常說的素材感很強,模板感很強的感受。
?
比如我看目前朋友圈的大量分享確實一眼就知道ai出品,有時候兩眼。
?
看多了,新鮮感就會消退,而且就實際商業(yè)應(yīng)用而言,受不受歡迎不好說。
?
免費做應(yīng)該還行,甲方如果付費了應(yīng)該并不希望你用ai弄一套東西給他。
?
但ai進(jìn)步實在太快,以上說法也許很快不能作數(shù),因此文章有效期7天。
?
今天的話題并非要進(jìn)一步評價ai繪畫,而是跟大家講述它的發(fā)展史。
?
從歷史角度,還原一下妖怪的誕生。
?
故事,要從70年代說起。
?
一、偽人工智能
?
這段歷史,幾乎每個人都會從一位英國藝術(shù)家說起,此人名為科恩(Harold Cohen)。
?
生于1928年的科恩在2016年去世,一生致力于研究如何采用計算機程序創(chuàng)作藝術(shù)。
?
科恩早年就學(xué)藝術(shù),隨后再學(xué)編程,文理兼修,打通任督二脈,也就是藝術(shù)與科技的屏障。
?
因此,1972年在他手上誕生了“亞倫”(AARON)程序。
?
這個程序被視為ai繪畫始祖,個人認(rèn)為相對牽強。
?
當(dāng)然我所謂的牽強要看怎么定義“ai繪畫”,就目前ai繪畫的形態(tài)來看,“亞倫”更像打印機。
?
因為“亞倫”創(chuàng)作的真的是畫,畫在紙上那種(或者畫布)。
?
由于“亞倫”至今不開源,而且科恩已經(jīng)去世,其作畫原理細(xì)節(jié)目前是個迷。
?
但按理解,就是通過編寫好的程序指導(dǎo)機械化操作,跟如今工廠的機械臂差不多。
?
我曾在《平面設(shè)計史》系列第46回介紹過喬布斯大神“Mac”電腦的誕生。
?
Mac電腦首次集成可以處理圖像及文字的軟件,繪畫由此真正進(jìn)入可視化的電腦時代。
?
世界上第一款圖文設(shè)計軟件也由蘋果公司開發(fā),隨著Mac電腦一起發(fā)布,名為“MacPaint”,(“麥克油漆”)。
?
當(dāng)年的產(chǎn)品發(fā)布會上喬布斯還為大家現(xiàn)場展示過這款軟件繪制的浮世繪圖像,創(chuàng)作者是美國女平面設(shè)計師蘇珊·卡雷(Susan Kare)
?
這其實也可屬于ai繪畫歷史的一部分,就是生產(chǎn)工具的升級。
?
當(dāng)時而言,對繪畫界的震懾威力也不小,大家也很恐慌,很焦慮。
?
傳統(tǒng)畫家都說糟糕了,老子要失業(yè)。
?
再然后,默默學(xué)習(xí),默默適應(yīng),默默發(fā)展,默默變成自然。
?
歷史就是這么有趣。
?
二、悶聲干大事
?
Mac之后,科技分別在計算機+互聯(lián)網(wǎng)領(lǐng)域奔跑。
?
那時候,我們對科技進(jìn)步感知其實還不夠明顯。
?
但從喬布斯2007年推出iphone手機后大家就明顯感覺科技發(fā)展“提速”了。
?
此后驚喜不斷,高潮迭起,一環(huán)扣一環(huán),大家應(yīng)接不暇。
?
其中,就有不少人在默默耕耘人工智能。
?
于是乎,重要的拐點發(fā)生在2012年。
?
這一年谷歌兩位AI大神帶領(lǐng)團隊做了個試驗,耗資100萬美元,1000臺電腦,16000個CPU,用時3天,基于Youtube平臺1000萬個貓臉圖片,用深度學(xué)習(xí)模型程序生成了一個模糊的貓臉。
?
兩位大神分別是華裔人工智能科學(xué)家吳恩達(dá)跟美國計算機科學(xué)家杰夫·迪恩(Jeff Dean)。
?
試驗中生成的貓臉像被揍過一樣,如果不說明,一眼還不容易看出來,但它的誕生注定要寫進(jìn)歷史。
?
因為這其實才是AI繪畫真正意義上的起點。
?
這里要用通俗的概念科普下,什么是“深度學(xué)習(xí)模型”。
?
簡單說來就是需要向這個“模型”大量“投喂”外部標(biāo)注好的訓(xùn)練數(shù)據(jù),然后讓它根據(jù)輸入的預(yù)期效果進(jìn)行反復(fù)調(diào)整與匹配進(jìn)行輸出。
?
這樣說吧,蒸汽機剛發(fā)明的時候,按燃料熱值產(chǎn)出效率才3%,“深度學(xué)習(xí)模型”的產(chǎn)生效率可能只有它的百萬分之一,所以超貴。
?
但不管如何,貓臉的誕生讓大家備受鼓勵,各路人工智能領(lǐng)域大神開始一路狂飆,悶聲干大事。
?
很快時間就去到2014年,加拿大蒙特利爾大學(xué)有個爺們提出了“生成對抗網(wǎng)絡(luò)”算法進(jìn)行AI繪畫,簡稱“GAN”。
?
GAN的原理是它擁有兩個深度神經(jīng)網(wǎng)絡(luò)模型,一個叫生成器(Generator)一個叫判別器(Discriminator)。
?
為了方便理解,可以做個比喻,生成器就像乙方,負(fù)責(zé)做圖,判別器就像甲方,負(fù)責(zé)說不行。
?
每次乙方做完一張圖出來甲方就說不行,要改,乙方改完出來甲方還說不行,繼續(xù)改。
?
如此循環(huán)上萬次(很短時間內(nèi)發(fā)生),直到雙方筋疲力盡,甲方?jīng)Q定妥協(xié),乙方也準(zhǔn)備不要尾款算了,然后就輸出一個最終結(jié)果。
?
坦白說,GAN的輸出效果已經(jīng)讓人驚艷,一度成為AI繪畫的主流方向。
?
但缺點是非常費硬件(顯卡),出圖過程經(jīng)常直接黑屏,而且它對局部圖像的理解能力差,很難局部修改,圖片分辨率也較低。
?
到了2015年,谷歌推出過一個叫“深夢”(Deep Dream)的圖像生成工具,這些畫作全部都像有一堆疙瘩,生成痕跡明顯。
?
但也打出AI繪畫旗號,而且還專門辦了個展,其實比較出戲,這里不多聊。
?
同在這一年,一種重要的人工智能技術(shù)也誕生,就是“智能圖像識別”。
?
意思是計算機可以運用語言去描述一張圖片,就像父母拿著卡片問2歲寶寶這啥,寶寶會答:大象。
?
這個技術(shù)當(dāng)然更先進(jìn)些,比如你給一張高啟強的圖片它識別,它會給出一系列標(biāo)簽,比如:男性、黃種人、中年、老大之類。
?
這跟AI繪畫有什么關(guān)系呢?
?
就是有研究人員開始根據(jù)技術(shù)反過來想,如果給它文字標(biāo)簽描述,是否也可以生成圖片呢?
?
結(jié)果模型真的能根據(jù)文字生成一堆小圖片,如此一來,這個邏輯成為AI繪畫的新研究方向。
?
三、潘多拉魔盒
?
2015年之后其實還有很多這方面不同的嘗試與研究,但普遍屬于上述技術(shù)的不同優(yōu)化。
?
真正讓AI迎來質(zhì)的飛躍是在2021年,網(wǎng)紅人工智能公司OpenAI推出了AI繪畫產(chǎn)品DALL· E。
?
這個版本的出圖水平還很一般,但已經(jīng)完全是根據(jù)文字提示來進(jìn)行作畫了。
?
2022年,DALL·E-2版本推出,水平大幅提升,AI繪畫就是這個階段開始獲得廣泛關(guān)注的。
?
而且更關(guān)鍵的是OpenAI公司開源了DALL· E的深度學(xué)習(xí)模型CLIP(Contrastive Language-Image Pre-Training)。
?
CLIP模型訓(xùn)練AI同時做兩件事情,其一是理解自然語言,其二是視覺分析。
?
然后通過不停訓(xùn)練來優(yōu)化兩者對應(yīng)程度,比如將馬桶跟馬桶圖像完全對應(yīng)上,如果馬桶對了茅坑就得再來。
?
最后形成“咒語繪畫”這樣的局面。
?
問題來了,過去的AI繪畫模型其實也有干這件事情,為什么CLIP如此優(yōu)秀?
?
明顯,就是CLIP做訓(xùn)練的量遠(yuǎn)遠(yuǎn)超過過去任何模型,據(jù)說大致是40億個以上的“文本-圖像”數(shù)據(jù)。
?
而且跟過去其它模型不同的是這些數(shù)據(jù)是免費的,并非人力成本天價的標(biāo)注圖像。
?
因為雞賊的CLIP采用的居然是廣泛散布在互聯(lián)網(wǎng)上的各種圖片。
?
這些互聯(lián)網(wǎng)圖片一般都帶有各種文本描述,比如標(biāo)題、注釋,甚至標(biāo)簽等等,這些天然資源就是最佳的訓(xùn)練樣本。?
?
果然是思路一變,市場一片。
?
隨后就很快出現(xiàn)不少超級厲害的應(yīng)用工具。
?
比如2022年2月,Somnai等幾個開源社區(qū)做了一款A(yù)I繪圖生成器——Disco diffusion。
?
2022年3月份,由Disco diffusion的核心人員參與建設(shè)的AI生成器Midjouney也正式發(fā)布。
?
Disco diffusion跟Midjouney問世后都在不停進(jìn)步。
?
2022年8月時候,美國游戲設(shè)計師杰森(Jason Allen) 就憑借一幅 AI 繪畫作品《太空歌劇院》(Théatre D'opéra Spatial),斬獲美國科羅拉多州博覽會美術(shù)競賽一等獎。
?
當(dāng)杰森公布這是一張由Midjouney創(chuàng)作的AI繪畫作品時,引發(fā)了大部分參賽者的憤怒。
?
也引發(fā)新一輪針對人工智能技術(shù)的討論,焦慮與恐懼。
?
再隨后就到了2023年,相關(guān)發(fā)生的事情大家歷歷在目,此處不必重復(fù)。
?
四、未來的展望
?
AI從繪畫進(jìn)一步拓展到不同領(lǐng)域可以說是必然發(fā)生的了。
?
但關(guān)于展望,我感覺應(yīng)該盡量積極點。
?
就是AI技術(shù)將被多國政府聯(lián)合馴化,結(jié)合到經(jīng)濟發(fā)展中產(chǎn)業(yè)化,創(chuàng)造出更多崗位。
?
如同10年前不敢想象人居然可以全職就對著手機說話,并且優(yōu)秀的還賺不少錢。
?
直播與短視頻產(chǎn)業(yè)帶動了很多故事策劃、文案創(chuàng)作、視頻拍攝、特效制作、服裝道具、音視頻硬件、場地租賃等等商業(yè)需求。
?
也盤活了過去很多傳統(tǒng)行業(yè)。
?
這些事情是抖音1.0無法想象的,他們也許最初只想做一款成功的娛樂應(yīng)用。
?
而AI最初也只是想盡量干出人類能干的事情。
?
更關(guān)鍵的是,AI只能知道過去人類想過什么,永遠(yuǎn)不知道人類接下來會想什么。
完整圖文版本請加入知識星球“設(shè)計史太濃”。
