一篇文章講清楚ChatGPT(GPT4)的局限和坑?
最近ChatGPT這個(gè)概念在國(guó)內(nèi)爆火了一把,人們了解到了后有很多不同的反應(yīng),有焦慮的,有擔(dān)心的,有恐懼的,有興奮的。。。
然而這實(shí)際上只是個(gè)噱頭而已,不知道其中的技術(shù)原理,自然很懵,但是如果搞明白其中的細(xì)節(jié)玩法,就知道這個(gè)技術(shù)的局限在哪里了。
就知道哪些功能對(duì)于ChatGPT來說實(shí)現(xiàn)很簡(jiǎn)單,哪些功能對(duì)其來說看似簡(jiǎn)單直接實(shí)現(xiàn)很難?
接下來我們進(jìn)入主題:講解5個(gè)關(guān)于GPT的問題。
先做個(gè)提示,重點(diǎn)強(qiáng)調(diào)一下:
所有教你用ChatGPT賺錢的,全都是割韭菜的!
ChatGPT(GPT4)只是一個(gè)工具,最多教教工具的使用。
這個(gè)都不用具體細(xì)看,只要想一下經(jīng)濟(jì)學(xué) 稀缺和價(jià)值的關(guān)系邏輯 就能明白了,太多復(fù)雜的說法都是花招。
接下來我們著重的講一下如下5個(gè)問題:
1.簡(jiǎn)單講一下ChatGPT,GPT4都是什么?
2.ChatGPT的出現(xiàn),對(duì)大眾影響大嗎?
3. 為什么 大模型創(chuàng)業(yè)(GPT創(chuàng)業(yè)) 是個(gè)坑?
4.數(shù)字孿生人真的很神奇嗎?
5.人工智能或者GPT會(huì)產(chǎn)生情感嗎?會(huì)造成破壞嗎?會(huì)危害人類嗎?
1.簡(jiǎn)單講一下ChatGPT,GPT4都是什么?
ChatGPT就是最近美國(guó)火起來的一個(gè)文字軟件交互程序而已,能根據(jù)文本輸入做出很多智能的反應(yīng),比如:
1.按指定文字提示 寫文章。
2.按指定文字提示 回答問題。
3.按指定文字提示 寫程序等。。。
都是一些智能交互,重點(diǎn)是相比之前的文字交互軟件智能了太多。
GPT4 (大模型4代) 也僅僅是一個(gè)基礎(chǔ)程序而已,只不過是用很多數(shù)據(jù)和計(jì)算力訓(xùn)練出來的基礎(chǔ)程序,ChatGPT基于GPT4之上開發(fā)而成。
2.ChatGPT的出現(xiàn),對(duì)大眾影響大嗎?
ChatGPT(GPT4) 對(duì) 一般人來說 沒有任何影響,大眾不需要做任何事,
需要做的只是等著GPT技術(shù)成熟 徹底工具化后學(xué)一學(xué)使用工具即可,
一般不用想著什么創(chuàng)業(yè)機(jī)會(huì)啥的,這方面創(chuàng)業(yè)都是坑,下面會(huì)詳細(xì)講。
3. 為什么 大模型創(chuàng)業(yè)(GPT創(chuàng)業(yè)) 是個(gè)坑?
自從最近OpenAI公司發(fā)布的ChatGPT概念在中國(guó)火了后,準(zhǔn)備開始做國(guó)內(nèi)大模型(GPT創(chuàng)業(yè))的公司就如雨后春筍般的出現(xiàn)。
然而,你要明白了其中的技術(shù)原理 和 限制條件后,就會(huì)知道這是一個(gè)大坑!
那你可能會(huì)想了,怎么可能,那么多人搞這個(gè)創(chuàng)業(yè),甚至百度,阿里都在搞,
他們傻嗎?
首先說明一下,大公司搞這個(gè)起初就不是沖著盈利和賺錢的目的去的。
最近搞這類創(chuàng)業(yè)的有兩類:
第1種:這是蹭熱度,或者創(chuàng)業(yè)多久后盈利不是他們考慮的,
只要能一直融到資,哪怕連續(xù)虧損10年都沒問題,
創(chuàng)始人,創(chuàng)始團(tuán)隊(duì)在某種程度上 是不依靠于大模型創(chuàng)業(yè)是否能盈利的(某種程度上可以這么理解)。
至于 投資人 則也是知道這中短期很難實(shí)現(xiàn)盈虧平衡,只是報(bào)個(gè)希望賭一把而已。
第2種:公司規(guī)模太大,不能不做, 錢太多,看著你的人也太多了,所以就把其GPT模型作為其一個(gè)基礎(chǔ)支撐組件來用的,根本沒想著賺錢去的,就是為了自己更好的使用一下,完善一下自己的生態(tài)。
好了,既然講到這里,我們就得詳細(xì)講一下 大模型創(chuàng)業(yè)為什么很難盈利,為什么是個(gè)坑?
思考判斷不能沒有邏輯,一切的判斷都要基于現(xiàn)實(shí)的技術(shù)和相關(guān)條件要素,等我們講完大模型具體內(nèi)部重要的要素有哪些,就能搞明白了。
我們先來講一下 大模型 創(chuàng)業(yè)到底是干啥?
GPT4 就是 美國(guó)OpenAI 搞的大模型4代,GPT4本質(zhì)上是一個(gè)軟件程序,是個(gè)程序,只不過這個(gè)程序我們叫其為 模型,把GPT4封裝起來做個(gè)軟件應(yīng)用產(chǎn)品,就是ChatGPT, 這個(gè)程序的功能就是 能夠通過 輸入文字 給出對(duì)應(yīng)的響應(yīng)結(jié)果。
那么國(guó)內(nèi)創(chuàng)業(yè)搞的是什么呢?
主要搞的產(chǎn)品 就是 國(guó)內(nèi)某公司自己開發(fā)的大模型(本質(zhì)是個(gè)軟件程序),開發(fā)完后也能通字符輸入給出對(duì)應(yīng)的結(jié)果響應(yīng)。
那不同公司 開發(fā)的 大模型 有什么區(qū)別嗎?和美國(guó)的GPT4又有什么區(qū)別嗎?
為什么那么多種大模型?百度搞個(gè),阿里也搞個(gè)?
這就得看 想要開發(fā)好 大模型,讓大模型給出的反應(yīng)結(jié)果最準(zhǔn)確 需要什么要素?
公式如下:
數(shù)據(jù) + 深度學(xué)習(xí)算法 + 算力 = 大模型
1.數(shù)據(jù)(訓(xùn)練原材料)
2.深度學(xué)習(xí)算法(計(jì)算算法規(guī)則)
3.算力(硬件計(jì)算力)
4.大模型(預(yù)測(cè)模型,給出輸入(比如文字),響應(yīng)結(jié)果)
要想做好大模型, 就得滿足好這三個(gè)要素條件,這三個(gè)要素條件越好,大模型訓(xùn)練出來效果越好。
那我們來逐個(gè)分析一下:
1.先講數(shù)據(jù):
數(shù)據(jù)的質(zhì)量高低 直接 影響 大模型預(yù)測(cè)的效果好壞!
為什么?那數(shù)據(jù)質(zhì)量高又是指的什么?
因?yàn)榇竽P徒o出反應(yīng)結(jié)果的原理,就是通過字符匹配和預(yù)測(cè),所以如果你給的數(shù)據(jù)內(nèi)容本身就是錯(cuò)的,那么他是識(shí)別不出來其是錯(cuò)誤的。
舉例(只是為了講清楚其 數(shù)據(jù)是如何影響準(zhǔn)確率的):
你提供的一系列數(shù)據(jù)中有: 1+1 =3
如果所有和 1+1 = 3 的內(nèi)容相似的都是這樣,那么計(jì)算機(jī)模型是識(shí)別不來的,他會(huì)把3 當(dāng)成咱們理解的2,然后 你給其輸入提問一個(gè): 3 +5 =?
他回答很可能就是 3+5 = 7 。(不接入計(jì)算器API的情況下,這例子只是為了說明信息錯(cuò)配的原理)
所以數(shù)據(jù)是否最準(zhǔn)確,其中的知識(shí)是否最有用,有價(jià)值 直接影響了 模型預(yù)測(cè)的 效果好壞。
所以如何獲得高質(zhì)量,高專業(yè)度的數(shù)據(jù) 就是一大難題。
不同公司的訓(xùn)練數(shù)據(jù)不一樣,自然模型預(yù)測(cè)的效果也不一樣。
而很多數(shù)據(jù)在咱們國(guó)家 的獲取規(guī)則更難,一般企業(yè)想要獲取足夠好的數(shù)據(jù)內(nèi)容難度相當(dāng)大。
這其中也涉及很多數(shù)據(jù)隱私的問題。
所以,做大模型,數(shù)據(jù)方面,也只有有官方支持的國(guó)企才能做的最好。
2.深度學(xué)習(xí)算法
關(guān)于深度學(xué)習(xí)算法,是一系列特定算法的一個(gè)分類總稱,其下具體包含很多種不同的深度學(xué)習(xí)算法。
每一種算法 都是基于 數(shù)學(xué)原理 和 程序的一些邏輯修改 弄出來的。
這個(gè)算法基本是通用的,只不過有實(shí)力的公司可能會(huì)專門設(shè)立小組 定制化 修改其公司使用的深度學(xué)習(xí)算法。
每家做大模型創(chuàng)業(yè)的公司基于深度學(xué)習(xí)算法的算法定制方案也不同,這看各自公司的技術(shù)實(shí)力了。
3.計(jì)算力
最坑的就是這個(gè)計(jì)算力,因?yàn)槠溆?xùn)練過程有點(diǎn)類似暴力破解的方式,所以需要很多算力,這個(gè)算力造成的硬件成本至少要數(shù)億美金 ,算力少了或者訓(xùn)練的時(shí)間不夠的話模型效果會(huì)很爛,基本等于白玩。
那這里就有個(gè)盈利悖論了,我們?nèi)绾钨嶅X呢,基本有幾種模式:
1.類SaaS(軟件即服務(wù)),靠提供功能來收費(fèi),別人的公司調(diào)用我這模型1次,就需要交固定的錢。
而這個(gè)在國(guó)內(nèi)想真正玩起來很難很難,你看一下國(guó)內(nèi)搞數(shù)據(jù)服務(wù)或者其它服務(wù)的公司 情況就知道了。
2.封裝GPT(大模型),打造一個(gè)產(chǎn)品來賺錢, 這個(gè)就又有悖論了:
如果你的產(chǎn)品好用能賺錢,那么靠的是什么核心競(jìng)爭(zhēng)力,GPT的能力? 你能把這個(gè)GPT搞到這個(gè)功能強(qiáng)度,別人也能??;靠產(chǎn)品模式嗎? 你的產(chǎn)品模式好,GPT比別人的能力差,別人照樣轉(zhuǎn)眼把你模式一抄就全面超越你,所以這個(gè)盈利是存在悖論,至少中短期很難實(shí)現(xiàn)正負(fù)盈虧平衡。
還有一個(gè)就是GPT自身屬性的原因:GPT自身的屬性導(dǎo)致,什么屬性?
工具屬性。
用 工具屬性 的產(chǎn)品 必然是賺錢困難的。
這幾乎沒有例外。
反著來看投入產(chǎn)出比,用了這么多算力資源:
從能量資源的角度來看 這個(gè)中短期就很難盈利。
你花了10億美金 研發(fā)了一個(gè) 自動(dòng)削蘋果機(jī),用這個(gè)蘋果機(jī)削一次要收費(fèi)1000元,
1000元夠我買一車蘋果了,那我為什么不自己削蘋果呢?
而且GPT領(lǐng)域的競(jìng)爭(zhēng)最終必然是充分競(jìng)爭(zhēng)市場(chǎng),你死我活的,最后只能留下一兩家,
4.數(shù)字孿生人真的很神奇嗎?
數(shù)字孿生人,這個(gè)說的太高大上了,我來給你講清楚點(diǎn)把,實(shí)際上是個(gè)很low的東西,
和永生,腦機(jī)接口等那些高大上的概念完全不沾邊。
數(shù)字卵生人本質(zhì)上就是一個(gè) : 能夠聊天的軟件程序 ,只不過這個(gè)聊天程序說話的風(fēng)格,講出內(nèi)容以及涉及的內(nèi)容范圍上限 都 和現(xiàn)在的你一樣, 就是拿你的一些特性 數(shù)據(jù)化然后 模仿出的一個(gè)軟件程序。
這存在很多問題:
1. 這個(gè)軟件程序不能真正 實(shí)現(xiàn)和你一模一樣的性格,因?yàn)閿?shù)據(jù)的提供是有限的,
而有些你內(nèi)在的思維想法 完全不在提供的數(shù)據(jù)中,很多根本無法用數(shù)據(jù)描述,或
者說很多內(nèi)在知識(shí)和反應(yīng)你自己都不知道。
2.這個(gè)程序只是模仿現(xiàn)在的你, 準(zhǔn)確說是模仿上限范圍 就是由你提供的數(shù)據(jù)上限所
決定的,如果現(xiàn)在搞一個(gè)你的孿生聊天程序軟件, 等過半年再來看,就很有可能和
你的性格和想法大相徑庭了。
3.我徹底用一個(gè)案例來 講一下 這個(gè) 和真人學(xué)習(xí)的區(qū)別在哪里把?為什么這個(gè)比人耗資源要多很多很多。
其根本區(qū)別在于:
人是通過五感的信息輸入 和行為反饋來學(xué)習(xí)的,
而計(jì)算機(jī)或者說GPT本質(zhì)上 是 通過 字符的信息輸入來學(xué)習(xí)的。
五感信息 和 字符 信息輸入 有什么差別呢?
差別就是字符信息輸入 缺少很多隱藏的內(nèi)在關(guān)聯(lián)邏輯,這些內(nèi)在關(guān)聯(lián)關(guān)系讓程序識(shí)別出來非常難(或者說不是難,而是和人比耗的資源差距太大了)。
舉例:
我們用一個(gè)教小孩 識(shí)物 的例子來講:
1.比如小A的媽媽 指著魚缸里的魚 對(duì)小A講:魚缸里這是一條金魚。
用字符文字來簡(jiǎn)單描述 : 魚缸中有一條金魚等等。。。。
五感信息 和字符信息之間差了什么 隱藏的內(nèi)在邏輯呢?
小A腦中的學(xué)習(xí)思考?xì)v程:
1).眼睛 看見 魚缸中的金魚:
內(nèi)在隱藏邏輯關(guān)聯(lián):魚是在水中生存的(自然看見導(dǎo)致的歸納學(xué)習(xí)法)
水知識(shí)點(diǎn) ------連接---------魚
2).這魚是金色的:
內(nèi)在隱藏邏輯關(guān)聯(lián):金魚應(yīng)該有金色的。
金魚---連接---- 金色
3).因?yàn)轸~在魚缸中,所以魚缸比魚要大
內(nèi)在隱藏邏輯關(guān)聯(lián):大小識(shí)別 魚缸比這條魚大。。。
等等。。。
上面講的很多內(nèi)在隱藏邏輯 對(duì)人來說是很容易學(xué)會(huì)的,
因?yàn)槿耸峭ㄟ^ 五感 和行為反饋來學(xué)習(xí)的,
做個(gè)假設(shè):
(只是為了理解而做的假設(shè),現(xiàn)實(shí)情況是人完全不理解腦神經(jīng)運(yùn)轉(zhuǎn)的真正原理,誰研究
懂就能拿諾貝爾獎(jiǎng)了)。
假設(shè): 學(xué)習(xí)的過程就是 存儲(chǔ)著 某知識(shí)的神經(jīng)元(神經(jīng)細(xì)胞) 與相關(guān)的神經(jīng)元 同時(shí) 被生物電激活,進(jìn)而產(chǎn)生化學(xué)連接的過程。
那么五感連接的神經(jīng)元同時(shí)激活的時(shí)候,他們之間的連接鏈路是明確的,有限的。
而 五感和行為反饋都和神經(jīng)元 有直接連接通道:
那么只需要幾條很少的神經(jīng)連接都能把這些東西連接起來,因?yàn)槲甯惺峭瑫r(shí)激發(fā)產(chǎn)生生物電的。
而計(jì)算機(jī)是怎么做的呢?
計(jì)算機(jī)當(dāng)然也能識(shí)別這其中的邏輯,但是使用的學(xué)習(xí)方法耗能和人學(xué)習(xí)比簡(jiǎn)直是天翻地覆,
計(jì)算機(jī)最底層只能通過 分析 字符(輸入圖片音樂最終都會(huì)轉(zhuǎn)成二進(jìn)制數(shù)字) 來學(xué)習(xí)理解:
看這句話:魚缸中有一條金魚。。。。
如果想只 通過這一句話 分析出上面人所能理解的,是絕對(duì)不可能的。
計(jì)算機(jī)是怎么學(xué)習(xí)的呢? 最簡(jiǎn)單的就是字符匹配:
舉例:你要輸入1萬句 包含魚的句子, 一萬句水缸中的水、水缸大小,魚的總類相關(guān)的句子。。。。
字符信息: 然后計(jì)算機(jī) 根據(jù)這些句子數(shù)據(jù) 按照深度學(xué)習(xí)算法 訓(xùn)練出一個(gè) 匹配規(guī)則模型,
直到匹配的結(jié)果能實(shí)現(xiàn)和上面人一樣的連接效果才行,
但是在原理層面來看, 計(jì)算機(jī) 是不懂 其真正內(nèi)涵的, 只能做 文字預(yù)測(cè)匹配,只不過
這個(gè)預(yù)測(cè)匹配能實(shí)現(xiàn)和真人效果一模一樣,這就是GPT4誕生的原因。
輸入A---------->經(jīng)過模型計(jì)算 ---------->輸出B
你好嗎?---------->GPT 通過模型的字符匹配算出---------->我很好(正確的回答)
你好嗎-?--------->五感+人的意識(shí)+ 思考---------->我很好
這就相當(dāng)于可以實(shí)現(xiàn)相同的功能效果 ,但是實(shí)現(xiàn)的方法完全是不同的:
舉個(gè)例子:
要?dú)⑺酪恢谎?,有兩種方法:
第一種: 毒藥毒死
第二種: 用水淹死
實(shí)現(xiàn)的結(jié)果都能弄死這只羊, 但是毒藥的成本很低,而淹死需要一池子水,
水成本也高,那么兩者都能弄死這只羊,但是使用的方法不一樣,成本也不一樣。
人們文字語言交流 本質(zhì)上 就是一個(gè) 字符對(duì)應(yīng)匹配的過程,我說什么字符,你按照
語法和語義回應(yīng)對(duì)應(yīng)的字符。
計(jì)算機(jī)也能實(shí)現(xiàn)對(duì)應(yīng)的功能, 但是他用的是通過暴力破解 來打造一個(gè) 匹配規(guī)則
函數(shù), 對(duì)話的結(jié)果相同,只不過你是根據(jù)語義語法的規(guī)則來回答的,計(jì)算機(jī)是根據(jù)字符匹配的概率規(guī)則來回答。
實(shí)現(xiàn)回答的結(jié)果一樣,但這過程的意義完全不同,消耗的資源也完全不同。
5.人工智能或者GPT會(huì)產(chǎn)生情感嗎?會(huì)造成破壞嗎?會(huì)危害人類嗎?
人工智能有可能產(chǎn)生情感嗎,有可能主動(dòng)對(duì)人類進(jìn)行破壞嗎?
人工智能本質(zhì)上是個(gè)軟件程序,不能產(chǎn)生情感,但是可以表現(xiàn)出和有情感的人一模一樣的效果和反應(yīng),讓人分辨不出來真假。
所以說理論上:形式上可以和真人毫無差別。
但是就像剛才舉的例子,一個(gè)真人和 一個(gè)人工智能實(shí)現(xiàn)的應(yīng)對(duì)反應(yīng)能一模一樣,但是實(shí)現(xiàn)的過程方法不一樣。
人是通過理性情感做出的反應(yīng), 計(jì)算機(jī)本質(zhì)上是通過字符匹配進(jìn)行的反應(yīng),
兩者在結(jié)果形式上一模一樣, 但是計(jì)算機(jī)還是沒有情感,本質(zhì)是不同的。
按上面的例子來說同樣類別的話就是: 我能用毒藥毒死這只羊,也能用水淹死這只羊,
因?yàn)槎寄芘肋@只羊,所以水(純水)也能毒死這只羊,毒也能淹死這只羊。。。
說計(jì)算機(jī)有情感 不就相當(dāng)于 強(qiáng)行把 造成相同結(jié)果的兩個(gè)過程 劃上等號(hào)嗎?
計(jì)算機(jī)有可能對(duì)人類造成破壞,不過原因是計(jì)算機(jī)程序的變化導(dǎo)致的,是一種事實(shí)上客觀物理變化導(dǎo)致的,概率性的。
因?yàn)槟撤N原因產(chǎn)生了 錯(cuò)誤的程序,這錯(cuò)誤程序?qū)θ擞衅茐?,所以有可能?duì)人造成傷害,絕對(duì)不是因?yàn)橛?jì)算機(jī)有了情感然后自己想破壞人類。
這就相當(dāng)于你把一個(gè)雞蛋摔到地上, 雞蛋碎了, 碎的原因 是 物質(zhì)力物理規(guī)則的原因,而你要強(qiáng)說,因?yàn)檫@雞蛋有情感, 不想困在我手里,想要自由,即使死掉也在所不惜,所以自己摔倒地上碎了。。。這不是強(qiáng)行給其加戲嗎?
計(jì)算機(jī)程序只是個(gè)程序,執(zhí)行固定規(guī)則的程序,永遠(yuǎn)不可能有生命。
甚至說絕點(diǎn): 只要宇宙的物理定律,物理規(guī)則不變, 計(jì)算機(jī)就永遠(yuǎn)不會(huì)有生命。
這不是技術(shù)能改變的,這是物理規(guī)則決定的!
如果宇宙物理規(guī)則經(jīng)常變化,那么世界就根本不穩(wěn)定了,世界也就不會(huì)存在了。
本文先講到此。。。