c語言大佬銳評鹿鳴
1.導(dǎo)論ai現(xiàn)在確實是一大流量密碼,在開始之前先來點掃盲環(huán)節(jié)。什么是人工智能(artificial intelligence,AI),通常意義上我們可以將AI分為三個環(huán)節(jié),感知,機(jī)器學(xué)習(xí),機(jī)器人。我們舉一個簡單的例子,自動駕駛中避障這一“行為”。首先由車載雷達(dá)感知障礙物大小與位置,然后由電腦確定如何進(jìn)行躲避或剎車,最終由動力與制動系統(tǒng)控制汽車運(yùn)動狀態(tài)。
機(jī)器學(xué)習(xí)(machine learning)是目前AI發(fā)展的核心領(lǐng)域。機(jī)器學(xué)習(xí)指的是通過已有的知識與數(shù)據(jù)通過計算機(jī)處理得到新的知識。大家在生活中經(jīng)常常用到的Excel擬合就是機(jī)器學(xué)習(xí)的一個例子。在機(jī)器學(xué)習(xí)中最為熱門的領(lǐng)域是所謂深度學(xué)習(xí)(deep learning),與其他機(jī)器學(xué)習(xí)的方法相比機(jī)器學(xué)習(xí)在數(shù)據(jù)量龐大時的表現(xiàn)十分優(yōu)秀。按照數(shù)據(jù)內(nèi)容與學(xué)習(xí)目的(有無被預(yù)測的變量)可分為監(jiān)督學(xué)習(xí)與無監(jiān)督學(xué)習(xí),監(jiān)督學(xué)習(xí)包括回歸與分類,無監(jiān)督學(xué)習(xí)包括聚類與降維。
??2.AI直播的需求:直播與視頻有兩點主要區(qū)別一是是否有實時互動,即觀眾輸出的內(nèi)容對內(nèi)容提供方輸出的內(nèi)容是否有實時影響。二是內(nèi)容是否主要為實時生成,即核心內(nèi)容的生成與輸出是否同步。轉(zhuǎn)換成比較通俗的語言就是不能無視觀眾,不能播片。由此我們可以得到一個比較清晰的需求:在預(yù)定的內(nèi)容主題框架下,實時獲取觀眾的反饋,并據(jù)此生成相應(yīng)的內(nèi)容并輸出。
? 3.目前AI直播的痛點:
(1)自然語言識別。自然語言識別是獲取觀眾反饋的最重要的途徑。目前AI對自然語言的識別已經(jīng)有了比較成功的案例,比如語音轉(zhuǎn)文字,機(jī)器翻譯等。但是這不代表AI直播中仍然可以順利識別(看看審核??)。自然語言識別是建立在語料庫之上的,對于大量的不斷更新的各種互聯(lián)網(wǎng)黑話其識別成功率并不高,更何況各種隱喻聯(lián)想暗示(我有一個朋友在路邊演講時不小心摔倒了)。此外另一個核心問題是直播回饋的數(shù)據(jù)質(zhì)量極差??催^v的應(yīng)該都知道彈幕釣魚,獨輪車,抽獎彈幕還有滿屏好好好壞壞壞,由于各種原因彈幕存在大量無意義內(nèi)容,且內(nèi)容的重要程度與數(shù)目并不成比例,數(shù)據(jù)在經(jīng)過清洗后仍然很難有好的識別效果。(2)內(nèi)容生成:直播內(nèi)容可以大致分為兩大類:有固定模式內(nèi)容與無固定模式內(nèi)容。前者的代表是歌、舞、小品等,后者的代表是雜談、即興創(chuàng)作。其區(qū)別為是否存已有的內(nèi)容固定范式。對于前者現(xiàn)在已經(jīng)有了很多成功案例,比如ACE歌姬,MMD,Monkingbird等,只需導(dǎo)入工程文件,直播時即時渲染即可。而后者到目前為止并沒有一個成熟的解決方案。實際上使用AI進(jìn)行所謂的“創(chuàng)作”是很困難的,大家應(yīng)該看過一些根據(jù)關(guān)鍵詞生成的“畫作”。這些畫作大多數(shù)都屬于所謂的“印象派”,在整體風(fēng)格上與給出的關(guān)鍵詞是吻合的,但是其細(xì)節(jié)部分完全是將一堆不同作品的碎片生硬的拼湊到一起,“有一種支離破碎的美”。(3)AI的嵌套:對于人來說,一個訓(xùn)練好的高復(fù)雜度的AI是一個黑箱,最有效的研究方法往往不是逐層查看參數(shù),而是給與不同的輸入,觀察其對應(yīng)的輸出。而人的觀察能力十分有限,一個傅里葉變換就可以掩蓋很多輸入輸出的差別。因此多重AI嵌套往往會出現(xiàn)意想不到的問題。一個經(jīng)典的例子:對位圖每個像素rgb值的后幾位進(jìn)行編碼,可以在一副圖片中插入隱藏的另一副圖片,這是肉眼無法觀察到的。一個常見的攻擊AI的方式就是基于該原理,通過這種難以被人察覺的方式篡改訓(xùn)練集,從而使得訓(xùn)練難以進(jìn)行,或使得訓(xùn)練好的AI在遇到特定的內(nèi)容時產(chǎn)出預(yù)料之外的結(jié)果。這種AI的固有弱點結(jié)合(1)(2)中提到的各種問題,其直接結(jié)果是AI對觀眾內(nèi)容的反饋是完全超出人類思維所能預(yù)料的,其輸出的內(nèi)容從完全正常的人類的反應(yīng)到古神的平方,一切皆有可能。
4.總結(jié):目前看來,全AI直播從基礎(chǔ)原理上就是完全無法實現(xiàn)的,除非AI的基本原理與研究方法有了跨時代的飛躍。將來我們可能看到一些比A-SOUL、星瞳、鹿鳴更“虛擬”,更有技術(shù)含量的VUP,但是距離全AI直播我們還有很長的路要走。
省流版:ai直播在現(xiàn)在以及可預(yù)見的將來根本沒可能實現(xiàn),鹿鳴純cjb。
