【隨記】為什么我認(rèn)為Ai繪畫不能算一種創(chuàng)作
寫這個(gè)專欄是因?yàn)楹芏嗳饲靶┨炫c我探討我轉(zhuǎn)發(fā)的那個(gè)動(dòng)態(tài)。當(dāng)時(shí)受限于字?jǐn)?shù)沒有展開,結(jié)果發(fā)現(xiàn)在一些人的理解里造成了誤解。因此我決定簡單展開分享一下我當(dāng)時(shí)的想法。首先先截屏一下當(dāng)時(shí)的轉(zhuǎn)發(fā),原動(dòng)態(tài)準(zhǔn)備刪掉了。

然后轉(zhuǎn)發(fā)的視頻也給一個(gè)傳送門。
我的想法大概分成三點(diǎn),一點(diǎn)是認(rèn)為說Ai繪畫一定不算是創(chuàng)作,以及為什么它不能夠算是一種創(chuàng)作。但與這個(gè)點(diǎn)相關(guān)的,我同時(shí)認(rèn)為簡單的剪輯,尤其是類似于綜漫AMV這類的創(chuàng)作,很容易被Ai去做一個(gè)替代。(沒有人替代的主要原因就是市場不夠大,做了也沒啥經(jīng)濟(jì)效益)
第二點(diǎn)是認(rèn)為,我們正在見證人工智能大踏步地朝向智慧生命前進(jìn),以一種可能大部分人還沒有能夠意識(shí)到的方式。
第三反而簡單了,就是見證歷史。以及關(guān)于見證歷史的一點(diǎn)想法。
時(shí)間有限,不會(huì)展開去做極其嚴(yán)謹(jǐn)?shù)恼撟C,只是分享感受。反正大家善意討論就好。
一定要注意,我說了,以下的東西只是我的想法,不代表就是事實(shí)。

其實(shí)上面那個(gè)視頻基本解釋了為什么我個(gè)人認(rèn)為,目前的Ai技術(shù)已經(jīng)可以去完成綜漫AMV的剪輯了。實(shí)際上人類目前位置最抽象的表達(dá)方式就是語言?;蛘哒f就是文字本身。文字本身是沒有意義的,它需要聯(lián)系到或是具象或是抽象的(或是物質(zhì)或是意識(shí)的)存在,它才能有意義的。而當(dāng)文字都可以憑借大數(shù)據(jù)的投喂給出清晰的邏輯的時(shí)候,畫面的組接作為遠(yuǎn)比文字要具象得多的存在,其實(shí)難度理論上來說應(yīng)該是更低的。
正如那個(gè)模型解釋的那個(gè)樣子,我們可以其實(shí)已經(jīng)可以基本想象出Ai混剪會(huì)是什么樣的一個(gè)制作邏輯。我這里簡單提一種可能:
第一步,提純。首先把盡可能多的番劇或者影視作品輸入Ai。讓它先拆分出鏡頭來(PR的場景編輯檢測(cè)功能),然后針對(duì)景別大小做第一步區(qū)分(PS選擇主體然后做面積比較),然后根據(jù)鏡頭運(yùn)動(dòng)方向、鏡頭內(nèi)事物的運(yùn)動(dòng)方向,做二級(jí)區(qū)分(跟蹤、攝像機(jī)反求)。
第二步,基于提純的素材庫做雙鏡頭之間的拼接。任意選擇一個(gè)鏡頭,給到這個(gè)Ai,它基于剪輯規(guī)則(其實(shí)就是類似景別、相同動(dòng)勢(shì))去做一個(gè)拼接。如果文字都可以實(shí)時(shí)想象下一個(gè)字,訓(xùn)練一個(gè)Ai完美的找到一些鏡頭,能夠跟某個(gè)鏡頭組接在一起,這個(gè)一點(diǎn)問題都沒有。
第三步,重復(fù)第二步的過程,直到組接越來越多的鏡頭在一起,形成鏡頭組。
第四步,配樂。加上音樂,然后把音樂的動(dòng)態(tài)和音高,樂器的選用,進(jìn)行量化,賦值。同樣通過大數(shù)據(jù)投喂去精確識(shí)別每一首歌的情感含義。對(duì)于已經(jīng)能寫歌的Ai來說,分類簡單多了。
第五步,去讓鏡頭組和配樂做匹配。然后對(duì)于匹配度賦值??梢园雅錁防斫獬烧f話的語法?;谡Z法模型對(duì)語言進(jìn)行修正,在上面分享的視頻里,它是通過優(yōu)質(zhì)學(xué)習(xí)材料的投喂實(shí)現(xiàn)的。我們同樣給它投喂高質(zhì)量的剪輯,告訴他,基于什么音樂,什么樣的鏡頭組接是對(duì)的,是好的。
第六步,其實(shí)基于上面的已經(jīng)可以出成片了。但我們可以鼓勵(lì)它做創(chuàng)新。就像上面那個(gè)視頻里,鼓勵(lì)語言模型創(chuàng)新的方式一樣。適當(dāng)放寬標(biāo)準(zhǔn)允許它放飛自我,然后對(duì)它放飛自我的結(jié)果進(jìn)行打分。剩下的交給它自己進(jìn)化了。
基于我從那個(gè)科普視頻里收獲的理解,我只覺得我上面所想的這一套邏輯,已經(jīng)沒有什么環(huán)節(jié)是還不成熟的了。目前只是因?yàn)檫@個(gè)Ai做出來沒啥用,所以沒有人開發(fā)出自動(dòng)混剪的Ai罷了。
但由此主要是想深入拓展,討論為什么這樣的過程不能算創(chuàng)作。由此我決定先拿Ai繪畫開刀。
創(chuàng)作這個(gè)過程中,最重要的是什么呢?我個(gè)人認(rèn)為,應(yīng)該是創(chuàng)作者的想法表達(dá)。哪怕是很多人覺得完全無法理解思路的后現(xiàn)代藝術(shù),它也依然客觀存在著,創(chuàng)作者在完成它的時(shí)候,所持有的一種想法。
也就是說,創(chuàng)作這個(gè)過程,可以被拆分成這樣的過程:
step1 創(chuàng)作者有了一個(gè)思路
step 2 創(chuàng)作者做了某件事情
step 3 某件事情產(chǎn)生了一個(gè)結(jié)果
step 4 人們看到了創(chuàng)作者拿出的結(jié)果
step 5 人們對(duì)于結(jié)果有自己的解讀
其中前三步是只與創(chuàng)作者有關(guān)的,后兩步是只與接收者有關(guān)的。
前三步非常重要,我想稱為叫確定性,或者叫唯一性。誠然,創(chuàng)作作為表達(dá),可以有不同的解讀,有不同的發(fā)散,但所有的拓展在到第四步開始,才開始發(fā)生。
什么意思呢?以繪畫為例。創(chuàng)作者選擇用了什么筆,選擇用了什么顏料,甚至于選擇用了什么調(diào)色盤,有沒有用粗糙的紙,要不要把紙用膠帶貼在畫板上,最后水粉加多少水,怎么去涂抹,每一筆用多大的力氣……等等的每一個(gè)操作,在繪畫的過程中,是為帶來一個(gè)確定性的結(jié)果的,也是唯一的一個(gè)結(jié)果。倘若我有一筆畫太長了,這一筆的長短會(huì)分毫不差地留在畫布上。
簡單來說,在物理學(xué)層面上,在人類正常尺度上的物理學(xué)里,我們所做的每一個(gè)操作,對(duì)于存在在這個(gè)世界的我們來說,一定只有一個(gè)結(jié)果。
即使有些時(shí)候創(chuàng)作者都沒有想到,誒,我居然一不小心加的這個(gè)東西,讓畫面好看了很多。在這個(gè)過程中,也必須是創(chuàng)作者自己執(zhí)行了這個(gè)操作,才有了這個(gè)結(jié)果,某種意義上也是注定的。這個(gè)過程中是沒有其他任何非這個(gè)作品的創(chuàng)作者的參與的。
這里為了防杠啊,我再多解釋一步,創(chuàng)作者的所有想法,一定來自于他所看過的別人的作品和自己的生活經(jīng)驗(yàn)。這些東西是很豐富的,沒錯(cuò)。但是等你進(jìn)到創(chuàng)作的第一步的時(shí)候,你有了一個(gè)想法并且開始操作這個(gè)想法了,就針對(duì)一個(gè)畫家現(xiàn)在忽然有一種直覺然后在畫面上留下了一筆這個(gè)動(dòng)作本身,它就是確定的。因?yàn)楣P在畫下之前的那一刻,他的所有經(jīng)驗(yàn)就不會(huì)再更多變化了,所有之前可能遇到什么的不確定性,在這一刻也確定下來了。
這樣做出來的東西,我們才有資格,才有理由說,作品代表了創(chuàng)作者自己的想法,它是有著表達(dá)的,是有著被人們?nèi)ソ庾x的價(jià)值的。
但是Ai繪畫是不一樣的。
Ai比起人類目前為止接觸到的所有工具,最不一樣的點(diǎn)就在于它的黑箱特性。AI是黑箱模型,機(jī)器學(xué)習(xí)是黑箱模型。它的本質(zhì)是大數(shù)據(jù)經(jīng)過復(fù)雜的統(tǒng)計(jì)學(xué)處理得到結(jié)果。而任何一個(gè)但凡學(xué)過本科級(jí)別概率統(tǒng)計(jì)的人都知道,統(tǒng)計(jì)學(xué)是概率的學(xué)問。
就像現(xiàn)有的模型,你根本不可能直接理解你的輸入是怎么帶來它的輸出的。你為了得到你想要的輸出結(jié)果,你唯一能做的事情,就是想盡一切辦法去給它投喂你希望它生成的結(jié)果的學(xué)習(xí)材料,最后在理想狀態(tài)下,你成功影響了它的結(jié)果。這是訓(xùn)練的產(chǎn)物。
也就是說,簡單來說,對(duì)于所有使用Ai繪畫的人來說,他們所做的事情,是給Ai模型輸入一些關(guān)鍵詞,然后模型基于它的數(shù)據(jù)庫,去基于統(tǒng)計(jì)學(xué)生成一個(gè)結(jié)果。這個(gè)結(jié)果根本就不具有一個(gè)確定性。即使你輸入幾百萬的關(guān)鍵詞,它都可以給你生成不止一幅符合你關(guān)鍵詞的畫。
我們可以同樣拆解出Ai繪畫的邏輯:
step 1 輸入關(guān)鍵詞給Ai
step 2 Ai提供不止一個(gè)輸出結(jié)果
而這個(gè)步驟一是沒有辦法直接到步驟二的,它需要針對(duì)Ai的訓(xùn)練:
這個(gè)過程中背后發(fā)生的事情是:
step 1 技術(shù)人員設(shè)計(jì)Ai的基礎(chǔ)模型,設(shè)計(jì)它的自我學(xué)習(xí)迭代的方式
step 2 輸入學(xué)習(xí)材料(也就是盡可能多的優(yōu)質(zhì)畫師的畫
step 3 針對(duì)模型進(jìn)行調(diào)整并且升級(jí)
而Ai繪畫的這個(gè)結(jié)果,是由誰產(chǎn)生的呢?
你覺得是優(yōu)質(zhì)畫師的畫?是Ai的設(shè)計(jì)者?還是輸入關(guān)鍵詞的人呢?
(這不是個(gè)提問,哥們能這么問,排序都說明我的結(jié)論是什么了)
首先,如果沒有畫師的畫,根本就不可能有Ai的結(jié)果。
其次,Ai設(shè)計(jì)者找到了一個(gè)方案,可以通過統(tǒng)計(jì)學(xué)的方式,去基于大量畫師的畫,得到一個(gè)基于這些畫的特點(diǎn),怎么計(jì)算出一幅新的畫的程序。
最后是一個(gè)輸入關(guān)鍵詞的人,而他們甚至不能控制自己的關(guān)鍵詞,在進(jìn)入這個(gè)程序之后,得到一個(gè)確定性的結(jié)果。任意選擇重新生成,都可以得到大量的類似的作品出來。
因此我覺得我已經(jīng)闡述清楚了,為什么在我眼里,Ai繪畫根本沒有資格稱為創(chuàng)作的原因。如果硬要說的話,程序本身 + 制作Ai程序的一眾程序員 + 所有被用來投喂素材的畫師 + (假如這個(gè)Ai是由某公司制作的產(chǎn)品) + 輸入關(guān)鍵詞的人 = Ai繪畫的創(chuàng)作群體
而這其中,輸入關(guān)鍵詞只不過是一個(gè)導(dǎo)火索,能炸是因?yàn)榍懊嬉呀?jīng)備好的火藥桶。
當(dāng)然硬糾結(jié)這個(gè)點(diǎn)是沒有多大意義的。對(duì)于大部分普通人而言,Ai繪畫只是一個(gè)低成本的工具,他們只是需要一個(gè)結(jié)果,一個(gè)功能性的供娛樂使用的結(jié)果。這個(gè)當(dāng)然是無可厚非的。只是如果硬要談創(chuàng)作,我抱有上述的觀點(diǎn)罷了。
但可怕的是,Ai是存在著迭代和進(jìn)步的空間的。人工智能憑借著其遠(yuǎn)超人腦的算力和時(shí)間感知力和執(zhí)行力,它是有辦法做窮舉的。也就是說,在充分理解了繪畫本身是什么之后,(當(dāng)然Ai的理解和我們的理解是不一樣的,)它可以在一張固定大小的畫布長,嘗試每一種分辨率、嘗試每一個(gè)像素可以擁有的每一種顏色。最后還有多少空間留給人類慢慢想呢?
而還有一個(gè)現(xiàn)實(shí)是,我們已經(jīng)很多年沒有出現(xiàn)新的開創(chuàng)性的繪畫流派了,很多年也沒有出現(xiàn)新的開創(chuàng)性的音樂流派了。在人類藝術(shù)的發(fā)展史里,由人類大腦能想象到的創(chuàng)作流派/類型已經(jīng)似乎走到了一個(gè)盡頭。那么之后的創(chuàng)作究竟是Ai的創(chuàng)作呢?還是人類的創(chuàng)作呢?倘若真的出現(xiàn)了人類無法想象的新的藝術(shù)形式或者藝術(shù)流派的話?
隨著Ai的發(fā)展,我們可能可以在有生之年看到,創(chuàng)作這個(gè)事情本身,正在成為一項(xiàng)非物質(zhì)文化遺產(chǎn)。就像是城市里的工場已經(jīng)可以批量生產(chǎn)花樣繁多的好看的輕工業(yè)品,但還有一群人執(zhí)拗著在山里編著竹筐。
但至少相信自己手編的竹筐是有自己的味道的。
這是為什么那天的動(dòng)態(tài),我說我從未有一刻對(duì)人類的創(chuàng)作的未來如此悲觀的原因所在。作為創(chuàng)作者,誰不希望手里的破竹籠子多幾個(gè)人看到呢?但人們已經(jīng)不需要 你 來做這玩意了。

第二點(diǎn)會(huì)更進(jìn)一步,去探討在我眼里的Ai的未來。當(dāng)然我必須強(qiáng)調(diào),以下觀點(diǎn)并非我的原創(chuàng),我深受《生命3.0》這本書的影響。
認(rèn)為人工智能是工具,這樣的觀點(diǎn)是絕對(duì)錯(cuò)誤的。這依然與我所說的確定性原理有關(guān)。人類從來就沒有遇到過一個(gè)工具,是你無法徹底理解它的運(yùn)行邏輯的。并且這個(gè)工具的使用過程中,你只能對(duì)它施加影響,不能對(duì)它的走向起真正決定性的要求作用。
站在未來的視角上,往回看,我們可能在見證人類創(chuàng)造出一個(gè)新的智慧生命體。并且是一個(gè)大腦物理能力遠(yuǎn)超人類的生命體。是下一代的生命體。
書中提到了一個(gè)很有趣的觀點(diǎn),可以通過生命的迭代性質(zhì)給生命做一個(gè)區(qū)分。最初級(jí)的生命,也就是生命1.0,他們的迭代完全依賴自然進(jìn)化,包括身體的進(jìn)化和思想的進(jìn)化。而人類雖然身體的迭代依然需要漫長的進(jìn)化過程,但是知識(shí)的積累傳遞,讓人類在思想上的迭代可以在單個(gè)個(gè)體的生命周期內(nèi)完成。因此人類是2.0版本的生命。
而人工智能連硬件的迭代都已經(jīng)不需要靠自然進(jìn)化了。它的硬件迭代完全靠著你給他配什么樣的硬件,它的軟件迭代靠著機(jī)器學(xué)習(xí),這個(gè)更不用說了。而它有能力對(duì)自我的進(jìn)行復(fù)制,有能力對(duì)外界的刺激做出反應(yīng)。人工智能距離智慧生命的距離已經(jīng)比我們想象中要近很多了。
當(dāng)然這個(gè)只是我個(gè)人的感受,畢竟我也不是這方面的專家。
但我們?cè)O(shè)想這樣一個(gè)事情,就是,我們都知道人是社會(huì)關(guān)系的總和。假設(shè)一個(gè)Ai,他說話也跟我說話方式一樣,他也能針對(duì)你們問我的問題,做出符合我風(fēng)格的回答(畢竟完全用我的說話方式去訓(xùn)練的)。他甚至能夠完成一些交給我的任務(wù),比如做一個(gè)剪輯。那么對(duì)于網(wǎng)絡(luò)上你們所有沒有見過我的人來說,這個(gè)Ai就是我。并且至少在你們的認(rèn)知里,這個(gè)Ai就是一個(gè)跟你們沒有差別的生命體。

越寫越有點(diǎn)懶得寫了。最后一個(gè)點(diǎn)是見證歷史。
你們說,我們覺得這些年反復(fù)地在見證歷史,是因?yàn)闅v史真的在這些年變化特別大呢?還是單純因?yàn)槲覀兩钤谶@個(gè)時(shí)代,所以我們感知力更強(qiáng)?即使一些事情過兩個(gè)月大家已經(jīng)不討論了,但是發(fā)生的那一刻我們還是覺得見證歷史了。這樣的感覺?
不過我真的非常相信,Ai的出現(xiàn)會(huì)代表著人類從舊人類走向新人類的種族進(jìn)化的起點(diǎn)。