散文網(wǎng) » 科技 »自然 » 【隨記】為什么我認(rèn)為Ai繪畫不能算一種創(chuàng)作

【隨記】為什么我認(rèn)為Ai繪畫不能算一種創(chuàng)作

2023-03-19 03:15 作者:AircraftDesigner 0人讀過 | 我要投稿

寫這個(gè)專欄是因?yàn)楹芏嗳饲靶┨炫c我探討我轉(zhuǎn)發(fā)的那個(gè)動(dòng)態(tài)。當(dāng)時(shí)受限于字?jǐn)?shù)沒有展開，結(jié)果發(fā)現(xiàn)在一些人的理解里造成了誤解。因此我決定簡單展開分享一下我當(dāng)時(shí)的想法。首先先截屏一下當(dāng)時(shí)的轉(zhuǎn)發(fā)，原動(dòng)態(tài)準(zhǔn)備刪掉了。

當(dāng)時(shí)轉(zhuǎn)發(fā)的動(dòng)態(tài)的截屏

然后轉(zhuǎn)發(fā)的視頻也給一個(gè)傳送門。

我的想法大概分成三點(diǎn)，一點(diǎn)是認(rèn)為說Ai繪畫一定不算是創(chuàng)作，以及為什么它不能夠算是一種創(chuàng)作。但與這個(gè)點(diǎn)相關(guān)的，我同時(shí)認(rèn)為簡單的剪輯，尤其是類似于綜漫AMV這類的創(chuàng)作，很容易被Ai去做一個(gè)替代。（沒有人替代的主要原因就是市場不夠大，做了也沒啥經(jīng)濟(jì)效益）

第二點(diǎn)是認(rèn)為，我們正在見證人工智能大踏步地朝向智慧生命前進(jìn)，以一種可能大部分人還沒有能夠意識(shí)到的方式。

第三反而簡單了，就是見證歷史。以及關(guān)于見證歷史的一點(diǎn)想法。

時(shí)間有限，不會(huì)展開去做極其嚴(yán)謹(jǐn)?shù)恼撟C，只是分享感受。反正大家善意討論就好。

一定要注意，我說了，以下的東西只是我的想法，不代表就是事實(shí)。

其實(shí)上面那個(gè)視頻基本解釋了為什么我個(gè)人認(rèn)為，目前的Ai技術(shù)已經(jīng)可以去完成綜漫AMV的剪輯了。實(shí)際上人類目前位置最抽象的表達(dá)方式就是語言?；蛘哒f就是文字本身。文字本身是沒有意義的，它需要聯(lián)系到或是具象或是抽象的（或是物質(zhì)或是意識(shí)的）存在，它才能有意義的。而當(dāng)文字都可以憑借大數(shù)據(jù)的投喂給出清晰的邏輯的時(shí)候，畫面的組接作為遠(yuǎn)比文字要具象得多的存在，其實(shí)難度理論上來說應(yīng)該是更低的。

正如那個(gè)模型解釋的那個(gè)樣子，我們可以其實(shí)已經(jīng)可以基本想象出Ai混剪會(huì)是什么樣的一個(gè)制作邏輯。我這里簡單提一種可能：

第一步，提純。首先把盡可能多的番劇或者影視作品輸入Ai。讓它先拆分出鏡頭來（PR的場景編輯檢測(cè)功能），然后針對(duì)景別大小做第一步區(qū)分（PS選擇主體然后做面積比較），然后根據(jù)鏡頭運(yùn)動(dòng)方向、鏡頭內(nèi)事物的運(yùn)動(dòng)方向，做二級(jí)區(qū)分（跟蹤、攝像機(jī)反求）。

第二步，基于提純的素材庫做雙鏡頭之間的拼接。任意選擇一個(gè)鏡頭，給到這個(gè)Ai，它基于剪輯規(guī)則（其實(shí)就是類似景別、相同動(dòng)勢(shì)）去做一個(gè)拼接。如果文字都可以實(shí)時(shí)想象下一個(gè)字，訓(xùn)練一個(gè)Ai完美的找到一些鏡頭，能夠跟某個(gè)鏡頭組接在一起，這個(gè)一點(diǎn)問題都沒有。

第三步，重復(fù)第二步的過程，直到組接越來越多的鏡頭在一起，形成鏡頭組。

第四步，配樂。加上音樂，然后把音樂的動(dòng)態(tài)和音高，樂器的選用，進(jìn)行量化，賦值。同樣通過大數(shù)據(jù)投喂去精確識(shí)別每一首歌的情感含義。對(duì)于已經(jīng)能寫歌的Ai來說，分類簡單多了。

第五步，去讓鏡頭組和配樂做匹配。然后對(duì)于匹配度賦值?？梢园雅錁防斫獬烧f話的語法?；谡Z法模型對(duì)語言進(jìn)行修正，在上面分享的視頻里，它是通過優(yōu)質(zhì)學(xué)習(xí)材料的投喂實(shí)現(xiàn)的。我們同樣給它投喂高質(zhì)量的剪輯，告訴他，基于什么音樂，什么樣的鏡頭組接是對(duì)的，是好的。

第六步，其實(shí)基于上面的已經(jīng)可以出成片了。但我們可以鼓勵(lì)它做創(chuàng)新。就像上面那個(gè)視頻里，鼓勵(lì)語言模型創(chuàng)新的方式一樣。適當(dāng)放寬標(biāo)準(zhǔn)允許它放飛自我，然后對(duì)它放飛自我的結(jié)果進(jìn)行打分。剩下的交給它自己進(jìn)化了。

基于我從那個(gè)科普視頻里收獲的理解，我只覺得我上面所想的這一套邏輯，已經(jīng)沒有什么環(huán)節(jié)是還不成熟的了。目前只是因?yàn)檫@個(gè)Ai做出來沒啥用，所以沒有人開發(fā)出自動(dòng)混剪的Ai罷了。

但由此主要是想深入拓展，討論為什么這樣的過程不能算創(chuàng)作。由此我決定先拿Ai繪畫開刀。

創(chuàng)作這個(gè)過程中，最重要的是什么呢？我個(gè)人認(rèn)為，應(yīng)該是創(chuàng)作者的想法表達(dá)。哪怕是很多人覺得完全無法理解思路的后現(xiàn)代藝術(shù)，它也依然客觀存在著，創(chuàng)作者在完成它的時(shí)候，所持有的一種想法。

也就是說，創(chuàng)作這個(gè)過程，可以被拆分成這樣的過程：

step1 創(chuàng)作者有了一個(gè)思路

step 2 創(chuàng)作者做了某件事情

step 3 某件事情產(chǎn)生了一個(gè)結(jié)果

step 4 人們看到了創(chuàng)作者拿出的結(jié)果

step 5 人們對(duì)于結(jié)果有自己的解讀

其中前三步是只與創(chuàng)作者有關(guān)的，后兩步是只與接收者有關(guān)的。

前三步非常重要，我想稱為叫確定性，或者叫唯一性。誠然，創(chuàng)作作為表達(dá)，可以有不同的解讀，有不同的發(fā)散，但所有的拓展在到第四步開始，才開始發(fā)生。

什么意思呢？以繪畫為例。創(chuàng)作者選擇用了什么筆，選擇用了什么顏料，甚至于選擇用了什么調(diào)色盤，有沒有用粗糙的紙，要不要把紙用膠帶貼在畫板上，最后水粉加多少水，怎么去涂抹，每一筆用多大的力氣……等等的每一個(gè)操作，在繪畫的過程中，是為帶來一個(gè)確定性的結(jié)果的，也是唯一的一個(gè)結(jié)果。倘若我有一筆畫太長了，這一筆的長短會(huì)分毫不差地留在畫布上。

簡單來說，在物理學(xué)層面上，在人類正常尺度上的物理學(xué)里，我們所做的每一個(gè)操作，對(duì)于存在在這個(gè)世界的我們來說，一定只有一個(gè)結(jié)果。

即使有些時(shí)候創(chuàng)作者都沒有想到，誒，我居然一不小心加的這個(gè)東西，讓畫面好看了很多。在這個(gè)過程中，也必須是創(chuàng)作者自己執(zhí)行了這個(gè)操作，才有了這個(gè)結(jié)果，某種意義上也是注定的。這個(gè)過程中是沒有其他任何非這個(gè)作品的創(chuàng)作者的參與的。

這里為了防杠啊，我再多解釋一步，創(chuàng)作者的所有想法，一定來自于他所看過的別人的作品和自己的生活經(jīng)驗(yàn)。這些東西是很豐富的，沒錯(cuò)。但是等你進(jìn)到創(chuàng)作的第一步的時(shí)候，你有了一個(gè)想法并且開始操作這個(gè)想法了，就針對(duì)一個(gè)畫家現(xiàn)在忽然有一種直覺然后在畫面上留下了一筆這個(gè)動(dòng)作本身，它就是確定的。因?yàn)楣P在畫下之前的那一刻，他的所有經(jīng)驗(yàn)就不會(huì)再更多變化了，所有之前可能遇到什么的不確定性，在這一刻也確定下來了。

這樣做出來的東西，我們才有資格，才有理由說，作品代表了創(chuàng)作者自己的想法，它是有著表達(dá)的，是有著被人們?nèi)ソ庾x的價(jià)值的。

但是Ai繪畫是不一樣的。

Ai比起人類目前為止接觸到的所有工具，最不一樣的點(diǎn)就在于它的黑箱特性。AI是黑箱模型，機(jī)器學(xué)習(xí)是黑箱模型。它的本質(zhì)是大數(shù)據(jù)經(jīng)過復(fù)雜的統(tǒng)計(jì)學(xué)處理得到結(jié)果。而任何一個(gè)但凡學(xué)過本科級(jí)別概率統(tǒng)計(jì)的人都知道，統(tǒng)計(jì)學(xué)是概率的學(xué)問。

就像現(xiàn)有的模型，你根本不可能直接理解你的輸入是怎么帶來它的輸出的。你為了得到你想要的輸出結(jié)果，你唯一能做的事情，就是想盡一切辦法去給它投喂你希望它生成的結(jié)果的學(xué)習(xí)材料，最后在理想狀態(tài)下，你成功影響了它的結(jié)果。這是訓(xùn)練的產(chǎn)物。

也就是說，簡單來說，對(duì)于所有使用Ai繪畫的人來說，他們所做的事情，是給Ai模型輸入一些關(guān)鍵詞，然后模型基于它的數(shù)據(jù)庫，去基于統(tǒng)計(jì)學(xué)生成一個(gè)結(jié)果。這個(gè)結(jié)果根本就不具有一個(gè)確定性。即使你輸入幾百萬的關(guān)鍵詞，它都可以給你生成不止一幅符合你關(guān)鍵詞的畫。

我們可以同樣拆解出Ai繪畫的邏輯：

step 1 輸入關(guān)鍵詞給Ai

step 2 Ai提供不止一個(gè)輸出結(jié)果

而這個(gè)步驟一是沒有辦法直接到步驟二的，它需要針對(duì)Ai的訓(xùn)練：

這個(gè)過程中背后發(fā)生的事情是：

step 1 技術(shù)人員設(shè)計(jì)Ai的基礎(chǔ)模型，設(shè)計(jì)它的自我學(xué)習(xí)迭代的方式

step 2 輸入學(xué)習(xí)材料（也就是盡可能多的優(yōu)質(zhì)畫師的畫

step 3 針對(duì)模型進(jìn)行調(diào)整并且升級(jí)

而Ai繪畫的這個(gè)結(jié)果，是由誰產(chǎn)生的呢？

你覺得是優(yōu)質(zhì)畫師的畫？是Ai的設(shè)計(jì)者？還是輸入關(guān)鍵詞的人呢？

（這不是個(gè)提問，哥們能這么問，排序都說明我的結(jié)論是什么了）

首先，如果沒有畫師的畫，根本就不可能有Ai的結(jié)果。

其次，Ai設(shè)計(jì)者找到了一個(gè)方案，可以通過統(tǒng)計(jì)學(xué)的方式，去基于大量畫師的畫，得到一個(gè)基于這些畫的特點(diǎn)，怎么計(jì)算出一幅新的畫的程序。

最后是一個(gè)輸入關(guān)鍵詞的人，而他們甚至不能控制自己的關(guān)鍵詞，在進(jìn)入這個(gè)程序之后，得到一個(gè)確定性的結(jié)果。任意選擇重新生成，都可以得到大量的類似的作品出來。

因此我覺得我已經(jīng)闡述清楚了，為什么在我眼里，Ai繪畫根本沒有資格稱為創(chuàng)作的原因。如果硬要說的話，程序本身 + 制作Ai程序的一眾程序員 + 所有被用來投喂素材的畫師 + (假如這個(gè)Ai是由某公司制作的產(chǎn)品) + 輸入關(guān)鍵詞的人 = Ai繪畫的創(chuàng)作群體

而這其中，輸入關(guān)鍵詞只不過是一個(gè)導(dǎo)火索，能炸是因?yàn)榍懊嬉呀?jīng)備好的火藥桶。

當(dāng)然硬糾結(jié)這個(gè)點(diǎn)是沒有多大意義的。對(duì)于大部分普通人而言，Ai繪畫只是一個(gè)低成本的工具，他們只是需要一個(gè)結(jié)果，一個(gè)功能性的供娛樂使用的結(jié)果。這個(gè)當(dāng)然是無可厚非的。只是如果硬要談創(chuàng)作，我抱有上述的觀點(diǎn)罷了。

但可怕的是，Ai是存在著迭代和進(jìn)步的空間的。人工智能憑借著其遠(yuǎn)超人腦的算力和時(shí)間感知力和執(zhí)行力，它是有辦法做窮舉的。也就是說，在充分理解了繪畫本身是什么之后，（當(dāng)然Ai的理解和我們的理解是不一樣的，）它可以在一張固定大小的畫布長，嘗試每一種分辨率、嘗試每一個(gè)像素可以擁有的每一種顏色。最后還有多少空間留給人類慢慢想呢？

而還有一個(gè)現(xiàn)實(shí)是，我們已經(jīng)很多年沒有出現(xiàn)新的開創(chuàng)性的繪畫流派了，很多年也沒有出現(xiàn)新的開創(chuàng)性的音樂流派了。在人類藝術(shù)的發(fā)展史里，由人類大腦能想象到的創(chuàng)作流派/類型已經(jīng)似乎走到了一個(gè)盡頭。那么之后的創(chuàng)作究竟是Ai的創(chuàng)作呢？還是人類的創(chuàng)作呢？倘若真的出現(xiàn)了人類無法想象的新的藝術(shù)形式或者藝術(shù)流派的話？

隨著Ai的發(fā)展，我們可能可以在有生之年看到，創(chuàng)作這個(gè)事情本身，正在成為一項(xiàng)非物質(zhì)文化遺產(chǎn)。就像是城市里的工場已經(jīng)可以批量生產(chǎn)花樣繁多的好看的輕工業(yè)品，但還有一群人執(zhí)拗著在山里編著竹筐。

但至少相信自己手編的竹筐是有自己的味道的。

這是為什么那天的動(dòng)態(tài)，我說我從未有一刻對(duì)人類的創(chuàng)作的未來如此悲觀的原因所在。作為創(chuàng)作者，誰不希望手里的破竹籠子多幾個(gè)人看到呢？但人們已經(jīng)不需要你來做這玩意了。

第二點(diǎn)會(huì)更進(jìn)一步，去探討在我眼里的Ai的未來。當(dāng)然我必須強(qiáng)調(diào)，以下觀點(diǎn)并非我的原創(chuàng)，我深受《生命3.0》這本書的影響。

認(rèn)為人工智能是工具，這樣的觀點(diǎn)是絕對(duì)錯(cuò)誤的。這依然與我所說的確定性原理有關(guān)。人類從來就沒有遇到過一個(gè)工具，是你無法徹底理解它的運(yùn)行邏輯的。并且這個(gè)工具的使用過程中，你只能對(duì)它施加影響，不能對(duì)它的走向起真正決定性的要求作用。

站在未來的視角上，往回看，我們可能在見證人類創(chuàng)造出一個(gè)新的智慧生命體。并且是一個(gè)大腦物理能力遠(yuǎn)超人類的生命體。是下一代的生命體。

書中提到了一個(gè)很有趣的觀點(diǎn)，可以通過生命的迭代性質(zhì)給生命做一個(gè)區(qū)分。最初級(jí)的生命，也就是生命1.0，他們的迭代完全依賴自然進(jìn)化，包括身體的進(jìn)化和思想的進(jìn)化。而人類雖然身體的迭代依然需要漫長的進(jìn)化過程，但是知識(shí)的積累傳遞，讓人類在思想上的迭代可以在單個(gè)個(gè)體的生命周期內(nèi)完成。因此人類是2.0版本的生命。

而人工智能連硬件的迭代都已經(jīng)不需要靠自然進(jìn)化了。它的硬件迭代完全靠著你給他配什么樣的硬件，它的軟件迭代靠著機(jī)器學(xué)習(xí)，這個(gè)更不用說了。而它有能力對(duì)自我的進(jìn)行復(fù)制，有能力對(duì)外界的刺激做出反應(yīng)。人工智能距離智慧生命的距離已經(jīng)比我們想象中要近很多了。

當(dāng)然這個(gè)只是我個(gè)人的感受，畢竟我也不是這方面的專家。

但我們?cè)O(shè)想這樣一個(gè)事情，就是，我們都知道人是社會(huì)關(guān)系的總和。假設(shè)一個(gè)Ai，他說話也跟我說話方式一樣，他也能針對(duì)你們問我的問題，做出符合我風(fēng)格的回答（畢竟完全用我的說話方式去訓(xùn)練的）。他甚至能夠完成一些交給我的任務(wù)，比如做一個(gè)剪輯。那么對(duì)于網(wǎng)絡(luò)上你們所有沒有見過我的人來說，這個(gè)Ai就是我。并且至少在你們的認(rèn)知里，這個(gè)Ai就是一個(gè)跟你們沒有差別的生命體。

越寫越有點(diǎn)懶得寫了。最后一個(gè)點(diǎn)是見證歷史。

你們說，我們覺得這些年反復(fù)地在見證歷史，是因?yàn)闅v史真的在這些年變化特別大呢？還是單純因?yàn)槲覀兩钤谶@個(gè)時(shí)代，所以我們感知力更強(qiáng)？即使一些事情過兩個(gè)月大家已經(jīng)不討論了，但是發(fā)生的那一刻我們還是覺得見證歷史了。這樣的感覺？

不過我真的非常相信，Ai的出現(xiàn)會(huì)代表著人類從舊人類走向新人類的種族進(jìn)化的起點(diǎn)。

標(biāo)簽：

【隨記】為什么我認(rèn)為Ai繪畫不能算一種創(chuàng)作的評(píng)論 (共條)

愛情散文傷感散文哲理散文優(yōu)美生活隨筆親情唯美句子傷感的句子現(xiàn)代詩歌空間日志經(jīng)典語句愛情句子作文大全

最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

【隨記】為什么我認(rèn)為Ai繪畫不能算一種創(chuàng)作

【隨記】為什么我認(rèn)為Ai繪畫不能算一種創(chuàng)作的評(píng)論 (共條)

你可能也喜歡這些文章

最新發(fā)布的文章

最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

【隨記】為什么我認(rèn)為Ai繪畫不能算一種創(chuàng)作

本文作者的其他文章

【隨記】為什么我認(rèn)為Ai繪畫不能算一種創(chuàng)作的評(píng)論 (共 條)

你可能也喜歡這些文章

最新發(fā)布的文章

【隨記】為什么我認(rèn)為Ai繪畫不能算一種創(chuàng)作的評(píng)論 (共條)