散文網(wǎng) » 科技 »學(xué)習(xí) » AI模型經(jīng)濟(jì)學(xué)探討——不可忽視的不可靠性與訓(xùn)練數(shù)據(jù)的潛在成本

AI模型經(jīng)濟(jì)學(xué)探討——不可忽視的不可靠性與訓(xùn)練數(shù)據(jù)的潛在成本

2023-02-15 15:44 作者:藍(lán)鯨澤維爾 0人讀過(guò) | 我要投稿

從阿爾法狗到ChatGPT，七年一個(gè)輪回，AI又一次打破了所有人的認(rèn)知?，F(xiàn)在鋪天蓋地都在討論這東西了，大家好像用得也越來(lái)越多了，呵呵（還小眾嗎？）。之前用了好幾天把AI生成模型背后的原理搞明白了（見(jiàn)我的置頂專欄），現(xiàn)在想聊聊怎么從經(jīng)濟(jì)學(xué)上看待它。

首先你得知道，現(xiàn)階段的AI是什么。它不是人類(lèi)用自己的知識(shí)體系一步一步推理計(jì)算構(gòu)建出來(lái)的精密機(jī)器人，而是利用神經(jīng)網(wǎng)絡(luò)這種仿生學(xué)結(jié)構(gòu)，對(duì)大量人類(lèi)數(shù)據(jù)進(jìn)行擬合之后得到的一種運(yùn)算模型。

AI模型跟計(jì)算機(jī)軟件、手機(jī)APP最大的區(qū)別就在于它的不可靠性——我們只是在讓機(jī)器模仿人類(lèi)某種思維而已，而不是真的從數(shù)學(xué)上找到了復(fù)制人類(lèi)思維的辦法，這一點(diǎn)非常重要（人工智能的符號(hào)主義與聯(lián)結(jié)主義）。

而評(píng)價(jià)一個(gè)AI模型優(yōu)劣的指標(biāo)，是進(jìn)行大量采樣之后與真實(shí)人類(lèi)數(shù)據(jù)的統(tǒng)計(jì)學(xué)誤差比較。所以關(guān)鍵就在于，你是否能容忍那部分誤差。

當(dāng)我們?cè)谑褂密浖駻PP產(chǎn)品時(shí)，都是希望盡量沒(méi)有Bug或者能及時(shí)修復(fù)——但如果一個(gè)產(chǎn)品是基于AI模型的話，那它可能永遠(yuǎn)都會(huì)有那部分誤差，永遠(yuǎn)都在產(chǎn)生Bug，而且無(wú)法解釋和及時(shí)修復(fù)。

這樣的產(chǎn)品，客戶能接受嗎？需要怎樣的客戶指導(dǎo)和教育，需要怎樣設(shè)計(jì)其他輔助和配套組件，才能做到接近計(jì)算機(jī)軟件和手機(jī)APP那樣的效果呢？

現(xiàn)在換到另一個(gè)話題。為什么明明充滿了錯(cuò)誤，現(xiàn)在所有人卻都對(duì)AI趨之若鶩呢？

第一，效率高。它確實(shí)干的比人快，即使只有60-80%的準(zhǔn)確性，只要我能容忍它，或者我能找到修復(fù)那些錯(cuò)誤的辦法，不管是自動(dòng)化的還是人工的，只要將AI模型整合到現(xiàn)有工作流之后能提高生產(chǎn)率，那它就是有用的。

第二，仿生程度突破性地提高了。接近于真人的交流反饋、繪畫(huà)作曲確實(shí)是非常吸引眼球的。即使只是想淺嘗一下，這樣的需求都可以支撐很久。它的水平達(dá)不到很多專業(yè)人士眼里的業(yè)界標(biāo)準(zhǔn)又怎樣？人類(lèi)自己制造的劣質(zhì)產(chǎn)品不也有大量市場(chǎng)么。

舉個(gè)例子，如果你用過(guò)ChatGPT，還在某一方面有比一般人強(qiáng)的信息流的話，你肯定會(huì)明白，所有拿公開(kāi)信息作整合加工的二手自媒體跟它比都是樂(lè)色。能看懂英文的人，可以去試試那些基于GPT API?的聯(lián)網(wǎng)應(yīng)用，比如 Perplexity.AI，看看這種實(shí)時(shí)更新的、所有內(nèi)容都有信息來(lái)源可考的問(wèn)答AI，是不是足以淘汰所有公眾號(hào)?。

等ChatGPT能提供圖像和影音流了，自媒體時(shí)代也就該結(jié)束了。OpenAI的下一個(gè)大產(chǎn)品可不是GPT4.0哦。?嘿嘿，當(dāng)我沒(méi)說(shuō)。

第三，成本低。這一點(diǎn)大家都看到了，要么免費(fèi)，要么只是幾十美元一個(gè)月的會(huì)員費(fèi)，就幾乎可以無(wú)限地使用，還沒(méi)有廣告。但這都是表面現(xiàn)象。為什么一個(gè)花了數(shù)千萬(wàn)美元訓(xùn)練出來(lái)的突破性技術(shù)，要給你接近免費(fèi)地使用？這是值得好好思考的問(wèn)題。

一個(gè)AI模型的生產(chǎn)，需要數(shù)據(jù)集、訓(xùn)練算力和開(kāi)發(fā)者勞力三種“要素”的投入。而生產(chǎn)基于這個(gè)模型的文本、語(yǔ)音、音樂(lè)、繪畫(huà)作品，需要一個(gè)本地或云端的，比訓(xùn)練算力要小得多的算力、使用者勞力和使用者可能會(huì)提供的數(shù)據(jù)（Prompts、底圖或自定義數(shù)據(jù)集）。

理論上講，生成一張圖片的成本，應(yīng)該把模型的生產(chǎn)成本（數(shù)據(jù)使用費(fèi)、訓(xùn)練算力、開(kāi)發(fā)者薪酬）按某種辦法平攤，再加上使用者需要的算力、數(shù)據(jù)和勞動(dòng)力成本都加在一起才能計(jì)算出來(lái)。

而當(dāng)前為使用者提供的AI技術(shù)服務(wù)定價(jià)，幾乎僅僅是使用者需要的算力而已（甚至連這部分都不要了）。

那這時(shí)候，如果AI模型所生產(chǎn)出來(lái)的文本、語(yǔ)音、音樂(lè)、繪畫(huà)作品直接或間接地流入市場(chǎng)，它們所造成的沖擊就可想而知了。當(dāng)它的質(zhì)量接近甚至超過(guò)人類(lèi)作品時(shí)，這就是一個(gè)必須要拿出來(lái)探討的經(jīng)濟(jì)話題了。

一個(gè)很明顯的事情，就是開(kāi)發(fā)者付出的訓(xùn)練算力成本，要怎么收回呢？以顯卡工時(shí)計(jì)算的話，這是一筆無(wú)法被無(wú)視的巨額開(kāi)支。我能想到的解釋，就是視作一種研發(fā)成本，或者營(yíng)銷(xiāo)費(fèi)用。ChatGPT和Stable DIffusion的成功，給背后開(kāi)發(fā)公司帶來(lái)的技術(shù)優(yōu)勢(shì)和品牌效應(yīng)，大概是可以讓投資者和管理層認(rèn)可的一種價(jià)值。

而開(kāi)發(fā)者和使用者的勞動(dòng)力成本，對(duì)AI模型的訓(xùn)練成本和生產(chǎn)成本來(lái)講，倒是可以接近忽略的部分了。這些薪酬相比算力費(fèi)用實(shí)在是太少了，而且技術(shù)本身又全是開(kāi)源的，不存在知識(shí)產(chǎn)權(quán)問(wèn)題。

剩下的就是最核心的問(wèn)題所在了，因?yàn)楫?dāng)前AI生成技術(shù)最具有爭(zhēng)議性的一部分，就是數(shù)據(jù)的使用費(fèi)用。藝術(shù)家團(tuán)體抵制AI，最主要的一個(gè)原因就是這部分成本被強(qiáng)行歸零了。也就是數(shù)據(jù)集本身的版權(quán)成本，憑空消失了。

但是，我覺(jué)得數(shù)據(jù)的使用費(fèi)，其實(shí)是一個(gè)比藝術(shù)家的版權(quán)更深刻的問(wèn)題。

現(xiàn)在的AI模型，最重要的一個(gè)優(yōu)勢(shì)就在于可以直接利用非結(jié)構(gòu)化數(shù)據(jù)。不是只有文學(xué)、音樂(lè)、繪畫(huà)、攝影這些受到知識(shí)產(chǎn)權(quán)法律保護(hù)的數(shù)據(jù)，醫(yī)療處方、科研數(shù)據(jù)、人類(lèi)行為記錄——幾乎地球上任何人類(lèi)留下的痕跡都可以在不參考相關(guān)專業(yè)領(lǐng)域知識(shí)的前提下進(jìn)行訓(xùn)練。這是一件細(xì)思恐極的事。不要只把ChatGPT當(dāng)作一個(gè)信息整合性質(zhì)的擬人問(wèn)答式搜索引擎。它很可能有能力代替任何一個(gè)專業(yè)人士為你服務(wù)，而實(shí)際上并沒(méi)有真的學(xué)習(xí)過(guò)相關(guān)的專業(yè)知識(shí)體系。

可想而知，當(dāng)這樣的AI模型以極低的成本、極高的效率去沖擊市場(chǎng)時(shí)，被影響到的就不只是藝術(shù)家了，而是所有的專業(yè)人士，和他們背后的一整套經(jīng)濟(jì)生態(tài)。

截止到今天，對(duì)數(shù)據(jù)的定價(jià)，仍然只限于一般意義上的知識(shí)產(chǎn)權(quán)，文學(xué)、音樂(lè)、繪畫(huà)。。。而實(shí)際上如果你去審視當(dāng)今所有互聯(lián)網(wǎng)公司，他們無(wú)一不在收集和利用用戶的行為數(shù)據(jù)進(jìn)行分析、訓(xùn)練以形成自己的商業(yè)模型。沒(méi)人去提數(shù)據(jù)使用費(fèi)的問(wèn)題。用戶協(xié)議說(shuō)的好，為了更好地為您服務(wù)嘛。但是我并沒(méi)有同意你拿它去訓(xùn)練推送廣告的模型來(lái)賺錢(qián)吧？你賺的錢(qián)也沒(méi)有分紅給我??？

而這個(gè)在上一個(gè)互聯(lián)網(wǎng)周期被所有人忽視的問(wèn)題，接下來(lái)一定會(huì)變得越來(lái)越尖銳的。沒(méi)有這部分?jǐn)?shù)據(jù)使用費(fèi)，所有工作崗位和人工智能比起來(lái)可能都會(huì)逐漸變得不經(jīng)濟(jì)。

這也是為什么關(guān)于全民基本收入 UBI (Universal Basic Income）的探討會(huì)變得越來(lái)越現(xiàn)實(shí)的原因。不要再覺(jué)得給所有人發(fā)錢(qián)是一件可笑的事情了，因?yàn)檫@是你應(yīng)該索要的利益，這就是AI模型的生產(chǎn)成本中本來(lái)應(yīng)該有的一部分（一種間接的支付方式）。這個(gè)話題有點(diǎn)大，可以以后慢慢地展開(kāi)（如果真的有一篇AI經(jīng)濟(jì)學(xué)的文章，它一定是關(guān)于數(shù)據(jù)成本轉(zhuǎn)移定價(jià)問(wèn)題的）。

以現(xiàn)在的發(fā)展速度，未來(lái)對(duì)AI的討論只會(huì)越來(lái)越熱烈，我呢只是先發(fā)一些我覺(jué)得有點(diǎn)預(yù)見(jiàn)性的思考，看到的人可以過(guò)段時(shí)間再回來(lái)驗(yàn)證。開(kāi)放性的使用、探索態(tài)度和任何基于機(jī)器學(xué)習(xí)原理的思考，都是我覺(jué)得值得提倡的。千萬(wàn)要遠(yuǎn)離那些兩端的“噪音”，因?yàn)槟阄磥?lái)肯定會(huì)遇到兩種人，要么在不提可靠性和安全問(wèn)題的情況下盲目推廣，要么是沒(méi)有務(wù)實(shí)精神的憑空“抵制”和嘲笑。雖然這些現(xiàn)在就存在，但AI發(fā)展得太快了，這些“噪音”還是相對(duì)較少的。以后商業(yè)化程度高了，會(huì)愈演愈烈的。

（完）

標(biāo)簽：繪畫(huà)人工智能社會(huì)AI 經(jīng)濟(jì)學(xué)財(cái)經(jīng)chatgpt

AI模型經(jīng)濟(jì)學(xué)探討——不可忽視的不可靠性與訓(xùn)練數(shù)據(jù)的潛在成本的評(píng)論 (共條)

愛(ài)情散文傷感散文哲理散文優(yōu)美生活隨筆親情唯美句子傷感的句子現(xiàn)代詩(shī)歌空間日志經(jīng)典語(yǔ)句愛(ài)情句子作文大全

最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

AI模型經(jīng)濟(jì)學(xué)探討——不可忽視的不可靠性與訓(xùn)練數(shù)據(jù)的潛在成本

AI模型經(jīng)濟(jì)學(xué)探討——不可忽視的不可靠性與訓(xùn)練數(shù)據(jù)的潛在成本的評(píng)論 (共條)

你可能也喜歡這些文章

最新發(fā)布的文章

最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

AI模型經(jīng)濟(jì)學(xué)探討——不可忽視的不可靠性與訓(xùn)練數(shù)據(jù)的潛在成本

本文作者的其他文章

AI模型經(jīng)濟(jì)學(xué)探討——不可忽視的不可靠性與訓(xùn)練數(shù)據(jù)的潛在成本的評(píng)論 (共 條)

你可能也喜歡這些文章

最新發(fā)布的文章

AI模型經(jīng)濟(jì)學(xué)探討——不可忽視的不可靠性與訓(xùn)練數(shù)據(jù)的潛在成本的評(píng)論 (共條)