c語言大佬銳評鹿鳴

2022-07-16 13:55 作者:路德維希--維特根斯坦 0人讀過 | 我要投稿

1.導(dǎo)論ai現(xiàn)在確實是一大流量密碼，在開始之前先來點掃盲環(huán)節(jié)。什么是人工智能（artificial intelligence，AI），通常意義上我們可以將AI分為三個環(huán)節(jié)，感知，機(jī)器學(xué)習(xí)，機(jī)器人。我們舉一個簡單的例子，自動駕駛中避障這一“行為”。首先由車載雷達(dá)感知障礙物大小與位置，然后由電腦確定如何進(jìn)行躲避或剎車，最終由動力與制動系統(tǒng)控制汽車運(yùn)動狀態(tài)。

機(jī)器學(xué)習(xí)（machine learning）是目前AI發(fā)展的核心領(lǐng)域。機(jī)器學(xué)習(xí)指的是通過已有的知識與數(shù)據(jù)通過計算機(jī)處理得到新的知識。大家在生活中經(jīng)常常用到的Excel擬合就是機(jī)器學(xué)習(xí)的一個例子。在機(jī)器學(xué)習(xí)中最為熱門的領(lǐng)域是所謂深度學(xué)習(xí)（deep learning），與其他機(jī)器學(xué)習(xí)的方法相比機(jī)器學(xué)習(xí)在數(shù)據(jù)量龐大時的表現(xiàn)十分優(yōu)秀。按照數(shù)據(jù)內(nèi)容與學(xué)習(xí)目的（有無被預(yù)測的變量）可分為監(jiān)督學(xué)習(xí)與無監(jiān)督學(xué)習(xí)，監(jiān)督學(xué)習(xí)包括回歸與分類，無監(jiān)督學(xué)習(xí)包括聚類與降維。

??2.AI直播的需求：直播與視頻有兩點主要區(qū)別一是是否有實時互動，即觀眾輸出的內(nèi)容對內(nèi)容提供方輸出的內(nèi)容是否有實時影響。二是內(nèi)容是否主要為實時生成，即核心內(nèi)容的生成與輸出是否同步。轉(zhuǎn)換成比較通俗的語言就是不能無視觀眾，不能播片。由此我們可以得到一個比較清晰的需求：在預(yù)定的內(nèi)容主題框架下，實時獲取觀眾的反饋，并據(jù)此生成相應(yīng)的內(nèi)容并輸出。

? 3.目前AI直播的痛點：

（1）自然語言識別。自然語言識別是獲取觀眾反饋的最重要的途徑。目前AI對自然語言的識別已經(jīng)有了比較成功的案例，比如語音轉(zhuǎn)文字，機(jī)器翻譯等。但是這不代表AI直播中仍然可以順利識別（看看審核??）。自然語言識別是建立在語料庫之上的，對于大量的不斷更新的各種互聯(lián)網(wǎng)黑話其識別成功率并不高，更何況各種隱喻聯(lián)想暗示（我有一個朋友在路邊演講時不小心摔倒了）。此外另一個核心問題是直播回饋的數(shù)據(jù)質(zhì)量極差?？催^v的應(yīng)該都知道彈幕釣魚，獨輪車，抽獎彈幕還有滿屏好好好壞壞壞，由于各種原因彈幕存在大量無意義內(nèi)容，且內(nèi)容的重要程度與數(shù)目并不成比例，數(shù)據(jù)在經(jīng)過清洗后仍然很難有好的識別效果。（2）內(nèi)容生成：直播內(nèi)容可以大致分為兩大類：有固定模式內(nèi)容與無固定模式內(nèi)容。前者的代表是歌、舞、小品等，后者的代表是雜談、即興創(chuàng)作。其區(qū)別為是否存已有的內(nèi)容固定范式。對于前者現(xiàn)在已經(jīng)有了很多成功案例，比如ACE歌姬，MMD，Monkingbird等，只需導(dǎo)入工程文件，直播時即時渲染即可。而后者到目前為止并沒有一個成熟的解決方案。實際上使用AI進(jìn)行所謂的“創(chuàng)作”是很困難的，大家應(yīng)該看過一些根據(jù)關(guān)鍵詞生成的“畫作”。這些畫作大多數(shù)都屬于所謂的“印象派”，在整體風(fēng)格上與給出的關(guān)鍵詞是吻合的，但是其細(xì)節(jié)部分完全是將一堆不同作品的碎片生硬的拼湊到一起，“有一種支離破碎的美”。（3）AI的嵌套：對于人來說，一個訓(xùn)練好的高復(fù)雜度的AI是一個黑箱，最有效的研究方法往往不是逐層查看參數(shù)，而是給與不同的輸入，觀察其對應(yīng)的輸出。而人的觀察能力十分有限，一個傅里葉變換就可以掩蓋很多輸入輸出的差別。因此多重AI嵌套往往會出現(xiàn)意想不到的問題。一個經(jīng)典的例子：對位圖每個像素rgb值的后幾位進(jìn)行編碼，可以在一副圖片中插入隱藏的另一副圖片，這是肉眼無法觀察到的。一個常見的攻擊AI的方式就是基于該原理，通過這種難以被人察覺的方式篡改訓(xùn)練集，從而使得訓(xùn)練難以進(jìn)行，或使得訓(xùn)練好的AI在遇到特定的內(nèi)容時產(chǎn)出預(yù)料之外的結(jié)果。這種AI的固有弱點結(jié)合（1）（2）中提到的各種問題，其直接結(jié)果是AI對觀眾內(nèi)容的反饋是完全超出人類思維所能預(yù)料的，其輸出的內(nèi)容從完全正常的人類的反應(yīng)到古神的平方，一切皆有可能。

4.總結(jié)：目前看來，全AI直播從基礎(chǔ)原理上就是完全無法實現(xiàn)的，除非AI的基本原理與研究方法有了跨時代的飛躍。將來我們可能看到一些比A-SOUL、星瞳、鹿鳴更“虛擬”，更有技術(shù)含量的VUP，但是距離全AI直播我們還有很長的路要走。

省流版：ai直播在現(xiàn)在以及可預(yù)見的將來根本沒可能實現(xiàn)，鹿鳴純cjb。