抖音上的“注意看,這個男人叫小帥”,為什么都是同一個人念的?
星彡P丨文

前段時間“用嘴畫畫”的AI很火時,BB姬聊過幾次,當時網(wǎng)絡上有一種“畫師下崗”的焦慮在傳播著。作為一個技能點在文字上的人,幾個月以來人們對AI的態(tài)度變化,對我來說都非常抽象。
實際上,AI取代人工早已經(jīng)是近十年來信息化行業(yè)的主旋律。之前有個在游戲公司打工的朋友就跟我聊起,像育碧之類的大廠普遍淘汰了傳統(tǒng)地編工作流,環(huán)境素材都改用AI生成。

AI繪畫不過是把這個時代變革的切面擺到了臺面上,讓普通人如我也能觀察到罷了。我的這個朋友倒也樂觀,畢竟AI的應用面只會越來越大,沒有什么人類能做到的事情可以幸免。
舉個例子,在AI繪畫之前很多人沒有意識到,AI早已經(jīng)在短視頻領域掀起一股工業(yè)革命,大規(guī)模的流水線短視頻正在取代個人產(chǎn)出。這不是危言聳聽……

如果有人自認為是超然世外的風雅之士,將科學文明的恩澤不當回事,跑到無人山野銜草結廬體驗原始野趣,那自當別論。但若居住在城市,無論如何喜歡清靜,總也免不了抖音快手的煩擾,對手機外放這件事傷透腦筋。
可以想象一下,跑食堂吃飯或者公交上瞌睡,每每遇到對面的大爺/阿姨外在看短視頻,頓時會感覺不妙,果然不一會兒就聽到了——
“注意看,這個男人叫小帥?!?/strong>

緊接著小美、大壯如約而至,各種奇妙的稱呼輪番上陣。
反派永遠叫喪彪,千條叔心里有故事,主角總是路上遇到佛布勒,跟金發(fā)妹搞搞曖昧,一腳踢爆找麻煩的卡樂咪。
看了上面這段話,可能有的人DNA已經(jīng)開始動了,有段時間在哪里都能聽到、看到這樣的電影解說視頻,仿佛全世界的電影就這幾個角色名。

(FBI=FBL=佛布勒,很神奇吧)
只要把關鍵劇情的畫面片段,配上娓娓道來的解說旁白,再加上背景音樂的升華,一部適合打工人在帶薪拉屎時的消遣作品就誕生了。
做視頻的人往往是把一部兩小時左右的電影濃縮進5分鐘左右的內(nèi)容里,幾十集的電視劇沒由來變成了10分鐘的梗百科。

“注意看”、“下一秒”、“沒想到”的旁白套路甚至可以衍生到游戲解說,不管是吃雞還是CSGO,只要是打槍的游戲都能給你整出個特種兵傳奇故事來。
最生草的是,我一度以為這些視頻是真人配音,等刷的多了,才發(fā)現(xiàn)全網(wǎng)的電影解說都是一個聲音,簡直就像墜入了抖音的多元宇宙。


不止是抖音,就連“騰愛嗶”這樣的長視頻網(wǎng)站也無法幸免。B站上搜索“電影解說”或者“追劇”,點開“10分鐘以下”的篩選選項,簡直像打開新世界的大門。
這些解說視頻到底是怎么做出來的?為什么說話都一個吊樣?——對此好奇的我,后來才知道是AI配音的聲音,直接兩眼一黑。

稍微了解一下就知道了,目前最出名的當屬微軟的Microsoft Azure(云端服務平臺)的文本轉語音服務,特別是“云?!钡囊羯?。
微軟官網(wǎng)下面有試玩的選項。這個音色幾乎媲美人類的聲音,不管是語氣和停頓,都十分自然,一點也沒有機器的生硬感。
https://azure.microsoft.com/zh-cn/products/cognitive-services/text-to-speech/#features

(官網(wǎng)的試玩,可以瀏覽器緩存找到文件)
官網(wǎng)只能試用,不能下載。不過之前BB姬聊到“原神玩家/三相之力指示器”的時候,提過一嘴瀏覽器的油猴插件使用方法。
Greasy Fork上能搜索到一種叫“Azure Speech Download”的腳本,算是彌補了Demo頁面不能下載保存語音的遺憾。
只要在瀏覽器有油猴插件的情況下,安裝以上的腳本,就可以讀取緩存。如果你想在本地脫網(wǎng)使用,也可以在網(wǎng)上搜索“微軟 Azure AI配音”,能下載到學習版。
除了微軟Azure,網(wǎng)上其實還有類似不錯的AI語音軟件,比如另一款阿里云的智能語音交互服務,里面的“艾飛”音色也是短視頻常客。當然,這種軟件正常商用都是按時間語句收費的,基本上抖音上使用的都是盜版軟件。

回到正題。視頻解說跟微信公眾號一樣,可以算是“傳統(tǒng)”自媒體了。作為快講類的電影解說鼻祖,谷阿莫和他的《 幾分鐘看完 XXX 電影 》系列也已經(jīng)快有10年了。
幾年前,電影解說圈子還算是百花齊放,偶爾我也會睡前躺在床上刷一會電影號,畢竟不動腦子看劇真的很爽。從小眾的文藝片,到主流的好萊塢電影基本都有人做解讀,不怕沒有樂子。
當時大家吐槽的點集中在千篇一律的背景音樂,像什么《Bad Style - Time Back》《Else - Paris》《Fight - BeatBrothers》《Hoang Thuy Linh - See Tình》……

(音樂軟件上的歌單)
很多音樂單獨播放旋律都很抓耳,最開始我也很好奇,用聽歌識曲搜索加過APP歌單,但架不住每次刷到電影解說就是那幾首歌,實在聽吐了,每次聽到就想切掉。
這時候視頻制作已經(jīng)有流水線化的跡象了,沒想到最近兩年,原本就已經(jīng)很內(nèi)卷的電影解說行業(yè)迎來了一場真正的“工業(yè)革命”——由于AI語音的出現(xiàn),現(xiàn)在做電影解說的博主可能連說話的力氣都省下來了。
卷,都可以卷,內(nèi)卷到最后,迎來統(tǒng)一標準化,流水線的AI配音短視頻正在取代個人產(chǎn)出。就像工廠咔咔生產(chǎn)出來的預制菜“毀滅”低端餐飲,自動駕駛未來會取代部分駕駛環(huán)境。一些事情正在發(fā)生,一些不久會發(fā)生。

樂觀點看,在AI不能完全取代人類之前,我們至少還有一段蜜月期,這段時間的特點是:行業(yè)門檻往往會變得模糊,一些人會被替代,利益受到波及,但總體來說我相信是利好的。
最先被淘汰的往往是處于行業(yè)底層的守門人(風格化的產(chǎn)出較少,機械化的操作較多),但由于技術升級,行業(yè)門檻變得模糊,不需要教育和訓練也能很快上手,反而成了一件人人都能做的事情。最終可能還擴大了就業(yè)范圍,產(chǎn)生了更多的坑位。
比如:①以前剪輯視頻是項技術活,你需要懂電腦技術,搗鼓PR軟件?,F(xiàn)在隨便誰手機下個剪影、快影,輸入幾張照片就可以一鍵制作;②以前做視頻還要麥克風,要考慮收音環(huán)境?,F(xiàn)在只要動動手指,靠AI就能幫你讀稿,連說話的功夫都剩了。

接著就是產(chǎn)能大爆炸,初階產(chǎn)品(就像AI配音的電影解說、AI繪畫的二次元美少女)會在很短時間內(nèi)達到冗余,但不是說AI會降低審美門檻——問題又回到老生常談的環(huán)境問題,以及電影愛好者與短視頻用戶的爭議。
有人覺得侮辱電影的藝術,有人覺得電影解說完全可以當作消遣,版權方電影制作方的態(tài)度也很曖昧,需要的時候可以讓AI配音的電影解說引流,不需要的時候一張訴狀敲起版權大棒。
當然,我一直覺得藝術沒有門檻,內(nèi)容創(chuàng)作是個人就行。雖然可能接受度有所不同,但標準不是唯一的。任何自立山頭區(qū)分妄圖定義別人審美的行為,最后只會讓人變成惡龍,遭到反噬。
繪畫、配音、寫小說等等領域要不要用AI得看消費者,其實就是老話“市場說了算”。但現(xiàn)階段短視頻隨處可見的AI配音,經(jīng)常跟“學習版”“破解版”綁定在一起——從道德上來講,盜版是不值得提倡的;從技術上來講,又是大勢所趨。
本來《XX分鐘看電影》就是一種灰色二創(chuàng)了,結果AI配音普及后出現(xiàn)了更低端更濫用的形式,所以經(jīng)常B站上評論充滿嘲諷與不解。包括之前的AI繪畫也存在一定版權的爭議,都是技術走的太遠,法律倫理還沒有跟上的緣故。
當然,正規(guī)商業(yè)使用就不存在糾結的問題。比如之前國內(nèi)配音界有個非常有名的CV叫“姜廣濤”,因為某些事被警察帶走了,留下了一堆二次元手游的爛攤子。

米哈游的《未定事件簿》與網(wǎng)易的《時空中的繪旅人》跟著遭了秧,于是先后采用AI配音對姜廣濤的聲音數(shù)據(jù)進行提取分析訓練再制作,進行緊急救火。
CV塌房且沒法補救的情況,放到二次元手游不少,日本聲優(yōu)也會有拜廁之類……一般來說,廠商要么直接換人,要么角色從此變成啞巴。
前者是個吃力不討好的活,很難讓先入為主的人滿意;后者像更早之前《光與夜之戀》因為CV李元韜睡粉騙炮的事情塌房,角色陸沉經(jīng)歷了好幾個月的“失聲期”,還搞出過摩斯電碼通話的笑話。


需要的時候,AI只是其中一種方案。一個玩家/觀眾/讀者(或是其他身份)能接受的方案面前,唯一需要做的,就是比較經(jīng)濟效益上哪個更劃算。
題外話。很早之前我有看網(wǎng)文小說的習慣,那時候網(wǎng)上有很多“筆趣閣”式的小說軟件,一些高級點的會自帶有AI配音的功能,方便開車或者臨睡前“聽”小說。

(微信讀書現(xiàn)在的聽書)
就我個人體驗來講,早期AI配音機械味比較濃,還遠不能跟人比。當時也有不少主打聽書的軟件,甚至會開出“朗讀賺外快”的兼職來吸引人填充數(shù)據(jù)庫,說明市場需求確實很大。
可誰也沒想到,短短幾年時間AI語音發(fā)展如此迅速?,F(xiàn)在的小說軟件聽書功能,你很明顯能感覺到慢慢的開始有語音語調的變化,雖然跟人類的朗讀情緒完全不能比,但完全已經(jīng)可以湊活了。

(有聲書的廣告)
讓AI說話像人,可能只是第一步,AI配音的應用場景未來也不僅僅是給短視頻、網(wǎng)文小說配個音,比如說給虛擬人賦予“人格”?
暢想一下,AI建模的小姐姐+AI配音的軟妹音+AI賦予的性格感情……二次元夢寐以求的老婆誕生了。當然,這只是未來的設想。

(前段時間,引起過爭議的微軟小冰罵人現(xiàn)象)
更不用說AI產(chǎn)出的質量短時間沒法替代真正有經(jīng)驗的從業(yè)者,很長一段時間里它會成為工具,需要人來調教才能達到最優(yōu)解。
最近幾年破圈的例子,不論是最近的AI繪畫,還是之前的AI翻譯、AI編曲、AI配音……都是差不多的模式。
-END-