最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

AI模型經(jīng)濟(jì)學(xué)探討——不可忽視的不可靠性與訓(xùn)練數(shù)據(jù)的潛在成本

2023-02-15 15:44 作者:藍(lán)鯨澤維爾  | 我要投稿

從阿爾法狗到ChatGPT,七年一個(gè)輪回,AI又一次打破了所有人的認(rèn)知?,F(xiàn)在鋪天蓋地都在討論這東西了,大家好像用得也越來(lái)越多了,呵呵(還小眾嗎?)。之前用了好幾天把AI生成模型背后的原理搞明白了(見(jiàn)我的置頂專欄),現(xiàn)在想聊聊怎么從經(jīng)濟(jì)學(xué)上看待它。

首先你得知道,現(xiàn)階段的AI是什么。它不是人類(lèi)用自己的知識(shí)體系一步一步推理計(jì)算構(gòu)建出來(lái)的精密機(jī)器人,而是利用神經(jīng)網(wǎng)絡(luò)這種仿生學(xué)結(jié)構(gòu),對(duì)大量人類(lèi)數(shù)據(jù)進(jìn)行擬合之后得到的一種運(yùn)算模型。

AI模型跟計(jì)算機(jī)軟件、手機(jī)APP最大的區(qū)別就在于它的不可靠性——我們只是在讓機(jī)器模仿人類(lèi)某種思維而已,而不是真的從數(shù)學(xué)上找到了復(fù)制人類(lèi)思維的辦法,這一點(diǎn)非常重要(人工智能的符號(hào)主義與聯(lián)結(jié)主義)。

而評(píng)價(jià)一個(gè)AI模型優(yōu)劣的指標(biāo),是進(jìn)行大量采樣之后與真實(shí)人類(lèi)數(shù)據(jù)的統(tǒng)計(jì)學(xué)誤差比較。所以關(guān)鍵就在于,你是否能容忍那部分誤差

當(dāng)我們?cè)谑褂密浖駻PP產(chǎn)品時(shí),都是希望盡量沒(méi)有Bug或者能及時(shí)修復(fù)——但如果一個(gè)產(chǎn)品是基于AI模型的話,那它可能永遠(yuǎn)都會(huì)有那部分誤差,永遠(yuǎn)都在產(chǎn)生Bug,而且無(wú)法解釋和及時(shí)修復(fù)。

這樣的產(chǎn)品,客戶能接受嗎?需要怎樣的客戶指導(dǎo)和教育,需要怎樣設(shè)計(jì)其他輔助和配套組件,才能做到接近計(jì)算機(jī)軟件和手機(jī)APP那樣的效果呢?

現(xiàn)在換到另一個(gè)話題。為什么明明充滿了錯(cuò)誤,現(xiàn)在所有人卻都對(duì)AI趨之若鶩呢?

第一,效率高。它確實(shí)干的比人快,即使只有60-80%的準(zhǔn)確性,只要我能容忍它,或者我能找到修復(fù)那些錯(cuò)誤的辦法,不管是自動(dòng)化的還是人工的,只要將AI模型整合到現(xiàn)有工作流之后能提高生產(chǎn)率,那它就是有用的。

第二,仿生程度突破性地提高了。接近于真人的交流反饋、繪畫(huà)作曲確實(shí)是非常吸引眼球的。即使只是想淺嘗一下,這樣的需求都可以支撐很久。它的水平達(dá)不到很多專業(yè)人士眼里的業(yè)界標(biāo)準(zhǔn)又怎樣?人類(lèi)自己制造的劣質(zhì)產(chǎn)品不也有大量市場(chǎng)么

舉個(gè)例子,如果你用過(guò)ChatGPT,還在某一方面有比一般人強(qiáng)的信息流的話,你肯定會(huì)明白,所有拿公開(kāi)信息作整合加工的二手自媒體跟它比都是樂(lè)色。能看懂英文的人,可以去試試那些基于GPT API?的聯(lián)網(wǎng)應(yīng)用,比如 Perplexity.AI,看看這種實(shí)時(shí)更新的、所有內(nèi)容都有信息來(lái)源可考的問(wèn)答AI,是不是足以淘汰所有公眾號(hào)?。

等ChatGPT能提供圖像和影音流了,自媒體時(shí)代也就該結(jié)束了。OpenAI的下一個(gè)大產(chǎn)品可不是GPT4.0哦。?嘿嘿,當(dāng)我沒(méi)說(shuō)。

第三,成本低。這一點(diǎn)大家都看到了,要么免費(fèi),要么只是幾十美元一個(gè)月的會(huì)員費(fèi),就幾乎可以無(wú)限地使用,還沒(méi)有廣告。但這都是表面現(xiàn)象。為什么一個(gè)花了數(shù)千萬(wàn)美元訓(xùn)練出來(lái)的突破性技術(shù),要給你接近免費(fèi)地使用?這是值得好好思考的問(wèn)題。

一個(gè)AI模型的生產(chǎn),需要數(shù)據(jù)集、訓(xùn)練算力和開(kāi)發(fā)者勞力三種“要素”的投入。而生產(chǎn)基于這個(gè)模型的文本、語(yǔ)音、音樂(lè)、繪畫(huà)作品,需要一個(gè)本地或云端的,比訓(xùn)練算力要小得多的算力、使用者勞力使用者可能會(huì)提供的數(shù)據(jù)(Prompts、底圖或自定義數(shù)據(jù)集)。

理論上講,生成一張圖片的成本,應(yīng)該把模型的生產(chǎn)成本(數(shù)據(jù)使用費(fèi)、訓(xùn)練算力、開(kāi)發(fā)者薪酬)按某種辦法平攤,再加上使用者需要的算力、數(shù)據(jù)和勞動(dòng)力成本都加在一起才能計(jì)算出來(lái)。

而當(dāng)前為使用者提供的AI技術(shù)服務(wù)定價(jià),幾乎僅僅是使用者需要的算力而已(甚至連這部分都不要了)。

那這時(shí)候,如果AI模型所生產(chǎn)出來(lái)的文本、語(yǔ)音、音樂(lè)、繪畫(huà)作品直接或間接地流入市場(chǎng),它們所造成的沖擊就可想而知了。當(dāng)它的質(zhì)量接近甚至超過(guò)人類(lèi)作品時(shí),這就是一個(gè)必須要拿出來(lái)探討的經(jīng)濟(jì)話題了。

一個(gè)很明顯的事情,就是開(kāi)發(fā)者付出的訓(xùn)練算力成本,要怎么收回呢?以顯卡工時(shí)計(jì)算的話,這是一筆無(wú)法被無(wú)視的巨額開(kāi)支。我能想到的解釋,就是視作一種研發(fā)成本,或者營(yíng)銷(xiāo)費(fèi)用。ChatGPT和Stable DIffusion的成功,給背后開(kāi)發(fā)公司帶來(lái)的技術(shù)優(yōu)勢(shì)和品牌效應(yīng),大概是可以讓投資者和管理層認(rèn)可的一種價(jià)值。

開(kāi)發(fā)者和使用者的勞動(dòng)力成本,對(duì)AI模型的訓(xùn)練成本和生產(chǎn)成本來(lái)講,倒是可以接近忽略的部分了。這些薪酬相比算力費(fèi)用實(shí)在是太少了,而且技術(shù)本身又全是開(kāi)源的,不存在知識(shí)產(chǎn)權(quán)問(wèn)題。

剩下的就是最核心的問(wèn)題所在了,因?yàn)楫?dāng)前AI生成技術(shù)最具有爭(zhēng)議性的一部分,就是數(shù)據(jù)的使用費(fèi)用。藝術(shù)家團(tuán)體抵制AI,最主要的一個(gè)原因就是這部分成本被強(qiáng)行歸零了。也就是數(shù)據(jù)集本身的版權(quán)成本,憑空消失了。

但是,我覺(jué)得數(shù)據(jù)的使用費(fèi),其實(shí)是一個(gè)比藝術(shù)家的版權(quán)更深刻的問(wèn)題。

現(xiàn)在的AI模型,最重要的一個(gè)優(yōu)勢(shì)就在于可以直接利用非結(jié)構(gòu)化數(shù)據(jù)。不是只有文學(xué)、音樂(lè)、繪畫(huà)、攝影這些受到知識(shí)產(chǎn)權(quán)法律保護(hù)的數(shù)據(jù),醫(yī)療處方、科研數(shù)據(jù)、人類(lèi)行為記錄——幾乎地球上任何人類(lèi)留下的痕跡都可以在不參考相關(guān)專業(yè)領(lǐng)域知識(shí)的前提下進(jìn)行訓(xùn)練。這是一件細(xì)思恐極的事。不要只把ChatGPT當(dāng)作一個(gè)信息整合性質(zhì)的擬人問(wèn)答式搜索引擎。它很可能有能力代替任何一個(gè)專業(yè)人士為你服務(wù),而實(shí)際上并沒(méi)有真的學(xué)習(xí)過(guò)相關(guān)的專業(yè)知識(shí)體系。

可想而知,當(dāng)這樣的AI模型以極低的成本、極高的效率去沖擊市場(chǎng)時(shí),被影響到的就不只是藝術(shù)家了,而是所有的專業(yè)人士,和他們背后的一整套經(jīng)濟(jì)生態(tài)。

截止到今天,對(duì)數(shù)據(jù)的定價(jià),仍然只限于一般意義上的知識(shí)產(chǎn)權(quán),文學(xué)、音樂(lè)、繪畫(huà)。。。而實(shí)際上如果你去審視當(dāng)今所有互聯(lián)網(wǎng)公司,他們無(wú)一不在收集和利用用戶的行為數(shù)據(jù)進(jìn)行分析、訓(xùn)練以形成自己的商業(yè)模型。沒(méi)人去提數(shù)據(jù)使用費(fèi)的問(wèn)題。用戶協(xié)議說(shuō)的好,為了更好地為您服務(wù)嘛。但是我并沒(méi)有同意你拿它去訓(xùn)練推送廣告的模型來(lái)賺錢(qián)吧?你賺的錢(qián)也沒(méi)有分紅給我???

而這個(gè)在上一個(gè)互聯(lián)網(wǎng)周期被所有人忽視的問(wèn)題,接下來(lái)一定會(huì)變得越來(lái)越尖銳的。沒(méi)有這部分?jǐn)?shù)據(jù)使用費(fèi),所有工作崗位和人工智能比起來(lái)可能都會(huì)逐漸變得不經(jīng)濟(jì)。

這也是為什么關(guān)于全民基本收入 UBI (Universal Basic Income)的探討會(huì)變得越來(lái)越現(xiàn)實(shí)的原因。不要再覺(jué)得給所有人發(fā)錢(qián)是一件可笑的事情了,因?yàn)檫@是你應(yīng)該索要的利益,這就是AI模型的生產(chǎn)成本中本來(lái)應(yīng)該有的一部分(一種間接的支付方式)。這個(gè)話題有點(diǎn)大,可以以后慢慢地展開(kāi)(如果真的有一篇AI經(jīng)濟(jì)學(xué)的文章,它一定是關(guān)于數(shù)據(jù)成本轉(zhuǎn)移定價(jià)問(wèn)題的)。

以現(xiàn)在的發(fā)展速度,未來(lái)對(duì)AI的討論只會(huì)越來(lái)越熱烈,我呢只是先發(fā)一些我覺(jué)得有點(diǎn)預(yù)見(jiàn)性的思考,看到的人可以過(guò)段時(shí)間再回來(lái)驗(yàn)證。開(kāi)放性的使用、探索態(tài)度和任何基于機(jī)器學(xué)習(xí)原理的思考,都是我覺(jué)得值得提倡的。千萬(wàn)要遠(yuǎn)離那些兩端的“噪音”,因?yàn)槟阄磥?lái)肯定會(huì)遇到兩種人,要么在不提可靠性和安全問(wèn)題的情況下盲目推廣,要么是沒(méi)有務(wù)實(shí)精神的憑空“抵制”和嘲笑。雖然這些現(xiàn)在就存在,但AI發(fā)展得太快了,這些“噪音”還是相對(duì)較少的。以后商業(yè)化程度高了,會(huì)愈演愈烈的。

(完)

AI模型經(jīng)濟(jì)學(xué)探討——不可忽視的不可靠性與訓(xùn)練數(shù)據(jù)的潛在成本的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
思茅市| 上思县| 桃园县| 临邑县| 安吉县| 阜宁县| 嘉荫县| 平和县| 静海县| 张家口市| 大名县| 青龙| 临海市| 紫金县| 神农架林区| 合作市| 浮梁县| 达尔| 河源市| 若尔盖县| 资源县| 东光县| 青铜峡市| 屏南县| 平顶山市| 阿城市| 临夏市| 东安县| 广昌县| 集安市| 雷州市| 凉城县| 开鲁县| 临沧市| 平湖市| 开封市| 上思县| 双柏县| 清镇市| 原阳县| 濮阳市|