內(nèi)容創(chuàng)作的新標(biāo)桿?AIGC詳解
去年十二月十六日,科學(xué)雜志公布了2022年度十項(xiàng)科技突破,這些都是一年內(nèi)的科學(xué)發(fā)現(xiàn)、科技進(jìn)步和發(fā)展動向,而 AIGC則是人工智能的一項(xiàng)重大突破。
AIGC是人工智能行業(yè)的一大潮流,這也就是人工智能進(jìn)入了以前被認(rèn)為是“人類獨(dú)占”的行業(yè),比如藝術(shù)表達(dá),科學(xué)發(fā)現(xiàn)等等。Science稱,起初 AI的滲入速度很慢,但是到了今年,已經(jīng)成為一種爭奪。
百度CEO李彥宏認(rèn)為, AIGC在接下來的十年里,將會對傳統(tǒng)的內(nèi)容制造方式造成巨大的沖擊??梢杂檬种坏膬r(jià)格,用百倍的效率,制作出一篇原創(chuàng)的 AI作品。
然而, AIGC現(xiàn)在所面對的版權(quán)、倫理、商業(yè)化等問題,也給 AIGC的發(fā)展帶來了潛在的威脅。
其實(shí), AIGC的首次曝光亮相,還是要追溯到一幅人工智能的畫作。
去年八月,一副名叫《太空歌劇院》的繪畫作品在美國科羅拉多州展示參賽,它在數(shù)碼藝術(shù)領(lǐng)域贏得了大獎(jiǎng)。
然而,這幅美麗的作品卻沒有打傳統(tǒng)藝術(shù)家,反倒是引發(fā)了一場激烈的爭論。因?yàn)檫@幅獲獎(jiǎng)的畫作不是杰森·艾倫自己用筆繪制的,它是采用了AI繪畫應(yīng)用?Midjourney。
一些人覺得艾倫利用人工智能繪畫是一種欺騙行為,“利用人工智能制作一張圖片并自稱是一名畫家,真是令人厭惡?!币灿腥苏f:“真是太可怕了,想象一下,要是讓一個(gè)機(jī)器人跑到奧林匹克上來,那該多恐怖啊!”還有一些對 Allen將AI產(chǎn)生的圖片和藝術(shù)品混淆的做法感到憤慨,稱“我們看到了藝術(shù)的滅亡?!?/p>
就在這個(gè)事情過去了兩個(gè)多月之后, ChatGPT又一次引起了大家的注意。
十一月三十一日,一家名為 OpenAI的公司推出了一款名為 ChatGPT的新型對話機(jī)器人,并且向用戶免費(fèi)提供服務(wù)。
?ChatGPT可以在任何一個(gè)話題領(lǐng)域和他人交流,解答任何問題,包括修改代碼、回答科學(xué)問題,包括向 Twitter的發(fā)展提出自己的見解、不確認(rèn)的猜測和請求等等。
ChatGPT非常聰明,在互聯(lián)網(wǎng)上迅速走紅,僅僅五天時(shí)間,它的注冊人數(shù)就超過了一千萬, 為此OpenAI被迫暫停一段時(shí)間對用戶的試用。
國內(nèi)廠商也推出了一款類ChatGPT的產(chǎn)品 - metamind,metamind不僅可以像chatGPT一樣進(jìn)行文字溝通,還支持多模態(tài)的AIGC裝作能力,包括AI繪畫,AI寫作,AI視頻創(chuàng)作等,用戶可以一鍵生產(chǎn)話題內(nèi)容并創(chuàng)作視頻,還能“復(fù)活”名人并與之進(jìn)行專業(yè)領(lǐng)域溝通。
用戶甚至還能生成自己的虛擬分身并發(fā)布基于此分身的AI創(chuàng)作內(nèi)容。
而針對性能強(qiáng)勁的 ChatGPT,業(yè)界人士認(rèn)為 ChatGPT將會給傳統(tǒng)的搜索引擎帶來巨大的影響。OpenAI公司的合伙人馬斯克在親身經(jīng)歷之后,也表示:“ChatGPT真的很棒?!?figure class="img-box" contenteditable="false">
國內(nèi) AIGC技術(shù)服務(wù)供應(yīng)商惠葉公司近日也獲得了 A+級的投資,高瓴創(chuàng)投和順為資本。
國內(nèi)和國際的網(wǎng)絡(luò)巨人都在搶灘 AIGC市場。
騰訊公司在中國已經(jīng)推出了“寫文機(jī)器人 Dreamwriter”,阿里巴巴旗下的 AI在線設(shè)計(jì)平臺“鹿班”完成了廣告的制作,而字節(jié)跳動的“剪映”和快手的“云”則可以進(jìn)行 AI視頻創(chuàng)作。八月,百度推出人工智能美術(shù)與創(chuàng)作的輔助服務(wù)——文心·一格,該系統(tǒng)能夠迅速地制作出人工智能作品。
在國外,像谷歌, Meta,微軟這樣的技術(shù)公司也在持續(xù)地推動 AIGC的革新,從文字,圖片到錄像。
資本涌入,互聯(lián)網(wǎng)巨頭紛紛進(jìn)入, AIGC擁有龐大的商業(yè)和龐大的市場空間。
AIGC在《Generative AI: A Creative New World》(Generative World)上發(fā)表了一篇文章,指出 AIGC具有潛在的經(jīng)濟(jì)效益,其潛在的經(jīng)濟(jì)效益為幾兆。而國泰君安則認(rèn)為,在接下來的5年里, AI將會產(chǎn)生10%到30%的圖像信息,其市場的規(guī)模將超過600億。
AIGC能在這一年里突然崛起,主要是因?yàn)樗纳疃饶P筒粩嗤晟疲约伴_源模式的推進(jìn)。
之前中國信息技術(shù)研究院的調(diào)查結(jié)果顯示, AIGC的加速發(fā)展與其自身的發(fā)展有很大關(guān)系。
尤其是自2014推出產(chǎn)生式對抗網(wǎng)(GAN)以來,業(yè)界普遍看好 AIGC的“春天”。GAN采用內(nèi)部生成和識別兩組模式,經(jīng)過反復(fù)的學(xué)習(xí),可以在輸入的基礎(chǔ)上生成新的影像。
但是 GAN也存在一個(gè)很大的缺陷,即 GAN必須使用一個(gè)識別工具來判定所生產(chǎn)的圖片與其它圖片是否同屬一個(gè)分類,因此所得到的圖片只是對已有的圖片的一種復(fù)制。所以,基于 GAN的模式很難產(chǎn)生新的影像,無法利用文本的線索來產(chǎn)生新的影像。這個(gè)缺陷被一種新模式—— Diffusion所解決。?
Diffusion擴(kuò)散模式的基本原則就是去除噪點(diǎn),在了解一幅畫面的噪聲處理中,了解一幅有價(jià)值的畫面是怎樣產(chǎn)生的,所以 Diffusion模式所產(chǎn)生的畫面要比 GAN模式更加精確,更加貼近人的視覺和美學(xué),并且在采樣次數(shù)和深度學(xué)習(xí)時(shí)間的積累下, Diffusion模式能夠更好地模擬出不同的表現(xiàn)形式。
Diffusion的擴(kuò)展模式讓 AIGC中的文字產(chǎn)生圖象的 AIGC技術(shù)得到了廣泛的認(rèn)可,同時(shí)也為2022出現(xiàn)的各種人工智能繪畫的應(yīng)用提供了一個(gè)很好的模型依據(jù)。
在今年早些時(shí)候, OpenAI推出了一個(gè)基于 CLIP的文本與圖片匹配的神經(jīng)網(wǎng)絡(luò),這是最近幾年多模式的一個(gè)突出的結(jié)果,該算法不但可以對文字進(jìn)行語音的解析,而且可以通過可視化的方式,對兩種模式的內(nèi)部參數(shù)進(jìn)行調(diào)節(jié),以實(shí)現(xiàn)文字與影像的完美契合。
可以說,將 CLIP與 Diffusion技術(shù)相融合,使得 AIGC的作品和圖像的自動化程度有了很大的提高。
在此背景下,開放源碼對 AIGC的推廣與推廣起到了推動作用。
根據(jù)源能公司的說法,開源就是開源,可以根據(jù)自己的源碼來進(jìn)行學(xué)習(xí)和改進(jìn)。例如,在2022年初, Disco Diffusion的開放源代碼激發(fā)了開發(fā)人員對其進(jìn)行研究和創(chuàng)造,到了2022下半年, Stable Diffusion之所以如此受歡迎,不僅僅是由于 Diffusion模式的革新,更是由于開放源代碼的環(huán)境,讓這個(gè)行業(yè)的技術(shù)發(fā)展速度大大加快。
Stable Diffusion模式在開放后的數(shù)個(gè)月內(nèi),就開始了大規(guī)模的二次開發(fā),從建模到擴(kuò)展,再到擴(kuò)展,再到插件的推廣,再到開發(fā)者和使用者的推廣,這也是 AIGC在2022的時(shí)候,受到了極大的歡迎。
另外, AIGC的大量的內(nèi)容要求也在推動 AIGC的應(yīng)用程序的實(shí)現(xiàn)。
國盛證券相信,隨著 Web3.0的到來,用戶對內(nèi)容的要求越來越高, UGC/PGC已經(jīng)很難滿足市場的擴(kuò)展, AIGC將成為一個(gè)新的元空間產(chǎn)生技術(shù)。
AIGC將會給我們的產(chǎn)品產(chǎn)品帶來巨大的變化,但是 AIGC還處在起步階段,相關(guān)的問題如著作權(quán)及商業(yè)化的實(shí)施等都需要盡快得到有效的處理。
AIGC的作品,其實(shí)就是 AI在投入了大量的人力資源之后,經(jīng)過不斷的積累,最終形成了一個(gè)巨大的資料庫,并按照使用者的要求來進(jìn)行創(chuàng)造。
因此,人工智能產(chǎn)生的產(chǎn)品與原始的創(chuàng)作有很多相同之處,無論是在形式還是細(xì)節(jié)方面。早些時(shí)候,中國的一篇報(bào)道曾提及畫家反對人工智能繪畫。這篇報(bào)道說,波蘭的格雷格·魯特科以其富于幻想色彩的油彩風(fēng)格而著稱,成為 Stable Diffusion中最流行的模仿者。他搜索了一下自己的姓名,發(fā)現(xiàn)全是 AI的圖片,自己的工作早就被人給刷爆了。
繼《太空歌劇院》獲得了一項(xiàng)驚人的獎(jiǎng)項(xiàng)之后,大量畫家已經(jīng)在自己的個(gè)人資料中添加了“不允許上傳任何內(nèi)容到 AI繪圖系統(tǒng)中”的內(nèi)容,來自世界著名的 ArtStation ArtStation也提出了反對,要求將自己的作品上傳到 AI繪圖平臺, ArtStation方面則表示,允許這種方式復(fù)制一幅畫是對著作權(quán)的侵害。
十一月二十九日,一個(gè)名為洛柒的插畫博主抱怨 AI畫畫的事情在微博上引起了軒然大波。洛柒說到,AI繪制出來的照片,大部分都是和其他藝術(shù)家的作品非常類似的,甚至還有人的名字和水印,“AI的作品中,有我認(rèn)識的老師們的畫?!甭迤庹f道。
但實(shí)際上, AI是否侵犯了其他畫家的版權(quán),還是很難判定的。為了避免著作權(quán)的危險(xiǎn),像 Getty圖像和 Shutterstock這樣的大的收費(fèi)圖書館已經(jīng)停止接受 DALL. E、 Stable Diffusion、 Midjourney等制作的人工智能繪畫。這在某種意義上也是 AIGC走向商業(yè)化的障礙。
至于 AI作品的著作權(quán),到底屬于 AI藝術(shù)家,或者屬于游戲公司沒人能給定論。在《著作權(quán)法》中,作者只能是自然人、法人、非法人單位,而作品是以作者為主體的。
所以,人們要求制定一種新的人工智能的法律保護(hù),而不是把過去的法律程序(其中就包括過去對人的發(fā)明者和作家的依賴性)用于解決新問題。
此外,由于智能計(jì)算本身的不足,使得其內(nèi)容的品質(zhì)等級不一致。
就拿 ChatGPT來說,最近因?yàn)榇鸢稿e(cuò)誤太多,已經(jīng)被 Stack Overflow給禁止了。
在 ChatGPT問世以后, Stack Overflow上迅速涌現(xiàn)了許多由這個(gè)模式產(chǎn)生的解答。那些回答往往要有一定經(jīng)驗(yàn)的人仔細(xì)地讀一遍,然后再去辨別它們是否正確。
盡管 AIGC的相關(guān)理念非常流行,但是業(yè)界認(rèn)為 AIGC的大規(guī)模商業(yè)化還需要一段時(shí)間。
而像國內(nèi)百度、metamind之類AIGC的排頭兵還是較少的,更多的還處于孵化階段,中國的AIGC之路才剛剛興起,但一定會在世界范圍內(nèi)取得席位。