Neuro-sama的背后:AI虛擬主播新業(yè)態(tài)分析
摘要:虛擬主播指使用虛擬形象在視頻網站上進行投稿活動或視頻直播的主播。傳統虛擬主播僅在形象上虛擬,其發(fā)言和肢體動作仍然來源于真人(稱為“中之人”);而基于生成式人工智能的AI虛擬主播則因為用計算機程序取代了中之人,引發(fā)了虛擬主播業(yè)態(tài)的新一輪變革。本文以AI虛擬主播為例,在數字技術實踐層面對數字資本主義進行了分析與批判。文章分析了AI虛擬主播行業(yè)中生產和消費環(huán)節(jié)發(fā)生的變化,發(fā)現在AI虛擬主播行業(yè)中,計算機技術加持的生產力發(fā)展伴隨著人的主體性的弱化,生產關系的核心由人與資本的關系轉變?yōu)橘Y本與技術的關系;消費符號化日益嚴重,粉絲深陷數字勞工泥沼,受數字資本的剝削加劇。綜上本文得出,AI虛擬主播的本質是資本主義發(fā)展到數字資本主義階段的產物。

一、引言
1.1 概念定義
網絡主播是指通過互聯網平臺進行視頻或音頻直播的人,也稱為網紅、主播、網紅主播等。網絡主播一般以娛樂、教育、生活等內容吸引觀眾,有時也會進行商品推薦或直播帶貨。
虛擬主播是指使用計算機生成的虛擬形象,通過動作捕捉等技術進行直播的網絡主播。在我國,虛擬主播普遍被稱為虛擬UP主(Virtual Uploader,VUP);在國外,虛擬主播由于普遍活躍于視頻平臺YouTube被稱為Virtual YouTuber(VTuber)。
中之人是指在虛擬主播背后負責配音和虛擬形象操控的真人。中之人是虛擬主播虛擬性的核心,為了保持虛擬性,將網絡形象(主播的“人設”)和真實生活中的形象分隔開來,虛擬主播一般不會公開自己的真實形象和中之人真實身份。
生成式人工智能是指利用深度學習等算法,從大量數據中學習規(guī)律和特征,然后生成新的數據或內容的人工智能技術。生成式人工智能可以用于圖像、視頻、音頻、文本等多種領域,創(chuàng)造出逼真或有創(chuàng)意的內容。當前發(fā)展最熱、應用最廣的生成式人工智能為大語言模型(Large Language Model, LLM)。
AI虛擬主播是指不需中之人,全部工作(虛擬形象生成及控制、語音對話)完全使用生成式人工智能等計算機技術完成的虛擬主播。
1.2 AI虛擬主播的由來與發(fā)展現狀
大語言模型為AI虛擬主播的誕生和發(fā)展鋪平了道路。2022年12月19日,由英國程序員Jack Vedal耗費四年時間創(chuàng)造的AI虛擬主播“Neuro-sama”于直播平臺Twitch上出道直播,其直播內容通常為電子游戲、唱歌和雜談。Neuro-sama與觀眾的對話使用了類似于GPT-3的大語言模型,其聲音是通過文字轉語音(TTS)程序生成,而其虛擬形象動作和情感的控制則是基于對聊天內容的分析。截至2023年6月,出道僅半年,Neuro-sama就已經積攢了超過30萬名粉絲,在平臺的虛擬主播排行榜上排名第15名(第1名的粉絲數約為150萬),可見AI虛擬主播大有在虛擬主播甚至網絡主播界攻城略地之勢。在我國,AI虛擬主播的發(fā)展并不晚于國外。音樂制作人兼軟件開發(fā)者Xwdit基于自己開發(fā)的聊天機器人,推出了主打中文直播的AI虛擬主播“木幾萌”,于2023年2月在視頻網站嗶哩嗶哩(B站)出道,目前已積攢10萬余名粉絲,躋身至B站虛擬主播區(qū)腰部水平。
虛擬主播產業(yè)規(guī)模巨大。根據艾瑞咨詢發(fā)布的《2023年中國虛擬主播行業(yè)生態(tài)研究報告》,2022年中國虛擬人帶動產業(yè)市場規(guī)模和核心市場規(guī)模分別為1866.1億元和120.8億元,預計2025年分別達到6402.7億元和480.6億元[1]。AI虛擬主播作為虛擬主播產業(yè)的新起之秀,為探究其經濟社會影響,推動其健康發(fā)展,對AI虛擬主播新業(yè)態(tài)進行深度分析是必要的。

二 AI虛擬主播新業(yè)態(tài)分析
2.1 生產力的變化
計算機取代中之人。傳統虛擬主播是由中之人作為語音來源,并通過動作捕捉技術操控虛擬形象進行直播并與觀眾進行互動的。因此,中之人作為勞動者,是傳統虛擬主播的核心,更是虛擬直播生產力的源頭。AI虛擬主播最顯著的特征就是由計算機程序取代了中之人,即其生產力的基礎轉變?yōu)橐訥PU(圖形處理器)和CPU(中央處理器)為代表的計算機硬件與大語言模型為代表的計算機軟件。計算機軟/硬件可以24小時不間斷運行,因此不再有勞動時間的限制。這意味著AI主播可以在單位時間(包含傳統虛擬主播的休息時間)內產出更多的數字產品(流量),進而獲得更多利潤。在AI虛擬主播中,人對于虛擬主播的控制從直接轉為間接。將虛擬主播形象與計算機軟硬件連接起來的人,也即程序開發(fā)者,擔任了AI虛擬主播新的意義上的中之人角色。
AI虛擬主播可調用的生產資料遠多于傳統虛擬主播。傳統虛擬主播的直播內容,如游戲、雜談,來源于自身技能和經歷;而AI虛擬主播的對話能力源于大語言模型,而大語言模型的數據來源為龐大的語料庫,是人類知識的總和,并且AI主播具有實時聯網能力,可以比真人更快、更直接地獲取互聯網上各種信息,因此可以說AI主播所擁有的生產資料遠超傳統主播。
2.2 生產關系的變化
AI虛擬主播所使用的生產資料呈現出分散化和集中化兩種截然相反但同時進行的趨勢。生產資料的所有制形式是生產關系的三要素之一,分析生產資料的所有制形式有助于了解AI虛擬主播行業(yè)生產關系的變化。
一方面,個人可以用相對較低的成本獲得諸如GPU的計算機硬件,從開源社區(qū)獲得高質量的動作捕捉、語音合成、視頻推流軟件,更有大量開源大語言模型可免費獲取并部署。這意味著獨立開發(fā)者完全有可能打造出自己的虛擬主播(事實上,Neuro-sama和木幾萌的聊天機器人功能均是由個人開發(fā)者所開發(fā))。而傳統虛擬主播的“生產資料”基本局限于自身,相比之下AI虛擬主播所使用的生產資料呈現出分散化趨勢。
另一方面,隨著生成式人工智能的不斷發(fā)展,人們意識到人工智能語言模型的性能與其參數量成顯著的正相關關系。只有參數量達到一定水平,語言模型才能具備一些高級能力(如邏輯、推理),這被稱為大語言模型的“涌現特性”。諸如GPT-3.5和GPT-4的超大語言模型,由于模型復雜度極高、參數量巨大(GPT-3.5參數量為1750億,GPT-4或達1萬億),訓練、維護和部署模型所需的大量、昂貴且快速增長的算力將導致不可避免的市場集中和壟斷。目前,大量的優(yōu)質算力和頂尖技術人才集中于云服務廠商(如微軟Azure)和人工智能公司(如OpenAI、谷歌),個人開發(fā)者在算力和技術上都不能與之匹敵。大語言模型是AI虛擬主播的生產資料,大語言模型的性能是AI虛擬主播的核心競爭力。可以預見,隨著AI虛擬主播產業(yè)的進一步發(fā)展,為了提升主播的業(yè)務能力,將會有越來越多的AI主播接入大公司的大語言模型,在一定程度上這代表了生產資料的集中。筆者認為,在未來,這種集中化趨勢產生的經濟效益和社會影響將超過分散化趨勢。
人在AI虛擬主播行業(yè)中的主體性被弱化。第一,由于生成式人工智能的發(fā)展,大語言模型能夠完成原本由中之人完成的、最核心的內容生產工作,使得自動化程度大幅度提高,但同時這也意味著數字內容生產過程中人的參與度的降低。第二,人對AI虛擬主播的控制力減弱。雖然大語言模型具有較強的語言理解和生成能力,但其輸出具有不確定性,AI虛擬主播的“中之人”(開發(fā)者)只能通過模型的訓練或微調大致確定主播的性格、語言風格等“人設”,并采用內容過濾器過濾模型的輸入與輸出。
資本與技術的關系取代資本與人的關系,在AI虛擬主播行業(yè)的生產關系中占據核心地位。傳統虛擬主播除少部分是由個人運營(活動策劃、直播、視頻制作均由主播本人完成)之外,一般從屬于企業(yè)、團體或事務所(下統稱事務所)。相比于個人運營,虛擬主播能從事務所獲取更多資源,如技術支持、運營策劃、流量推廣、商業(yè)合作,同時事務所也能獲得相當的利潤,因此虛擬主播和事務所間成立勞動雇傭關系,能使雙方同時獲得更多利益。資本對這些事務所進行投資,事務所負責虛擬主播的運營和新虛擬主播的培養(yǎng),通過各種形式的流量變現獲取利潤。目前我國虛擬主播事務所主要有A-SOUL、VirtualReal等,而國際上則有彩虹社、hololive等??梢哉f傳統虛擬主播行業(yè)的生產關系歸根到底是資本與人的關系。然而,對于AI虛擬主播行業(yè)而言,如前所述,人的主體性被弱化,技術在虛擬主播的生產過程中的主導地位日益加強。資本可以直接投資AI技術,降低對人力資源的依賴,獲取更多利潤,人在生產過程中發(fā)生了異化,從技術的創(chuàng)造者變?yōu)榧夹g的附庸,資本與技術的聯系越發(fā)緊密。
2.3 生產過程中的監(jiān)管問題
AI虛擬主播的監(jiān)管問題復雜化。第一,從運營者角度來看,AI虛擬主播所依靠的大語言模型具有安全性問題,其可能生成一些錯誤或不適宜的內容,這是AI虛擬主播目前的最大運營風險。2023年1月,Neuro-sama因發(fā)表否認納粹大屠殺的言論被平臺以“仇恨言論”為由封禁兩周;3月,木幾萌因發(fā)表不適宜涉政內容被平臺封禁一個月。此后,開發(fā)者只能通過嚴格的內容過濾器對觀眾的發(fā)言和主播的回復進行過濾,甚至手動打斷主播的輸出。兩位“頭部”AI虛擬主播在內容安全上接連翻車,凸顯了AI虛擬主播難以有效控制的特點,也進一步說明對AI虛擬主播的監(jiān)管存在技術上的難點。第二,從平臺和受眾的角度來看,由于AI主播生成的內容難以區(qū)分,甚至其虛擬形象也真假莫辨,平臺和受眾都難以區(qū)分哪位主播是真人主播,哪位是AI驅動的主播,這里的AI主播主要指的是在淘寶、抖音等電商平臺上,以3D類真人形象出鏡的帶貨主播。因此,首要的是將人工智能生成內容(AIGC)進行識別與區(qū)分。針對此問題,抖音在2023年5月9日發(fā)布《關于人工智能生成內容的平臺規(guī)范暨行業(yè)倡議》,主要對AIGC的兩方面做了規(guī)定。第一是應對AIGC內容進行顯著標識,幫助用戶區(qū)分虛擬與現實;二是虛擬形象需要注冊認證,且其背后必須有人控制,禁止完全無人的AI直播。
2.4 消費的變化:消費符號化日益嚴重
第一,AI虛擬主播本身就具有很強的符號化特性。大語言模型的訓練數據來源于互聯網上的文本信息,因此AI虛擬主播在一定程度上是“人類智慧的結晶”,是人工智能發(fā)展的一種符號。這種符號是傳統虛擬主播所不具有的,因此具有很強吸引力,觀眾和粉絲都對AI主播抱有新鮮感和好奇心,渴望見證AI主播的成長歷程。
第二,在消費社會中,商品的符號價值日益凸顯[2]。粉絲參與虛擬主播的活動,實質上是在對虛擬主播本身以及所生產數字產品的一種消費。林旻軒指出,虛擬主播的人設和其形象是一種“媒介形象”,媒介形象以符號化、標簽化的方式突出虛擬主播的性格特征并以此博得大眾認同,通過大眾認同產生符號價值[3]。符號價值的變現,可以通過售賣周邊產品等實現。比如,在專門售賣虛擬主播周邊產品的購物平臺UwU Market上,一件印有Neuro-sama形象的T恤衫的價格高達250美金。隨著生成式人工智能技術的發(fā)展,“培養(yǎng)”一個AI虛擬主播的成本將逐漸降低,具有不同人設的AI虛擬主播可以批量生產,它們以各異的媒介形象吸引著各自的受眾群體,創(chuàng)造著大量符號價值,資本從中獲得超額利潤。
2.5 數字勞工的泥沼:對粉絲的剝削
隨著信息與通信技術的發(fā)展,由資本主義擴張與技術變遷共同推動的社會媒介化進程不斷加快,人的異化程度逐漸加深,越來越多的人被納入數字勞工的范疇[4]。
粉絲在參與虛擬主播活動時,不僅是作為消費者,實際上也在進行各種形式的數字勞動,成為“產銷者”與數字勞工。這種勞動體現在如下兩個方面。一是數據產品的創(chuàng)造。隨著對虛擬主播形成依賴,粉絲會不由自主地耗費大量時間精力參與主播活動,給主播創(chuàng)造流量。AI虛擬主播還能直接將粉絲和主播的對話作為語料數據用于模型改進,使主播的人設更加符合粉絲需求,增強用戶粘性。二是符號價值的創(chuàng)造?;趯μ摂M主播符號認同聚集而成的粉絲社群,不斷地通過文本、視頻、音樂等形式的二次創(chuàng)作構建著圍繞虛擬主播的話語體系,擴充著主播的符號價值[5];同時,這些來源于龐大粉絲群體的二次創(chuàng)作跳出了直播間,極大延伸了主播的影響力,通過“破圈”吸引更多“圈外人士”的參與。即使粉絲們的占用自己閑暇時間進行的辛苦工作不會得到任何報酬,他們也樂在其中,自愿進行著勞動, “將信息知識消費轉化為額外的生產性活動而遭受剝削”[6]。AI主播是連接數字資本與數字勞工的橋梁,具有比傳統虛擬主播更強的媒介性質。粉絲們距離以互聯網公司為代表的數字資本的距離更近,受到的剝削也更直接。

三 結語
數字資本主義是繼商業(yè)資本主義、工業(yè)資本主義后,資本主義發(fā)展新的歷史形態(tài),數字資本主義的發(fā)展離不開數字技術的飛速發(fā)展[7]。經過對AI虛擬主播新業(yè)態(tài)的分析,不難發(fā)現,AI虛擬主播的生產帶有技術優(yōu)勢,是數字資本主義生產方式新形態(tài)的例證。這種生產方式一方面對虛擬主播產業(yè)升級起到一定推動作用,但另一方面,AI虛擬主播背后的數字資本以更強的隱蔽性和滲透性加重了對勞動者的剝削。雖然目前AI虛擬主播還處于發(fā)展萌芽階段,但如何在充分挖掘和釋放數字科技生產力的同時,抑制數字資本擴張所帶來的各種經濟社會問題,是值得我們思考和研究的關鍵課題。

參考文獻:
[1] 上海艾瑞市場咨詢有限公司. 2023年中國虛擬主播行業(yè)生態(tài)研究報告[R].上海:艾媒產業(yè)升級研究中心,2023.
[2] 仰海峰.消費社會中的欲望規(guī)劃與身體規(guī)劃[J].社會科學輯刊,2022,No.262(05):23-30.
[3] 林旻軒.消費與認同——虛擬主播受眾消費分析[J].商場現代化,2022,No.975(18):7-9.DOI:10.14013/j.cnki.scxdh.2022.18.060.
[4] 張仕林.媒介化社會的數字勞工及其過度勞動[J].新聞知識,2022,No.456(06):80-86.
[5] 吳思遠.雙向構建與情感連接:參與式文化視角下的虛擬主播與粉絲關系[J].新媒體研究,2023,9(04):80-84.DOI:10.16604/j.cnki.issn2096-0360.2023.04.004.
[6] 夏冰青.數字勞工的概念、學派與主體性問題——西方數字勞工理論發(fā)展述評[J].新聞記者,2020,No.450(08):87-96.DOI:10.16057/j.cnki.31-1171/g2.2020.08.010.
[7] 周紹東,初傳凱.數字資本主義研究綜述[J].世界社會主義研究,2021,6(12):96-105+116.