一個老碼農關于ChatGPT的思考
本文概述了大型語言模型(LLMs),重點介紹了chatgpt的出現(xiàn)及其各種應用,如編程、信息時效性等,以及GPT-3的大規(guī)模應用。接著,著重介紹了大企業(yè)和小企業(yè)如何利用LLMs和AI技術,以及普通腦力勞動者如何面對AI技術的變革。這種變革已經發(fā)生,GPT-3是其中的轉折點,大型企業(yè)可以擁有自己的LLM,而中小企業(yè)如果不能很好的利用AI,將會面臨技術劣勢。因此,如果要走在變革中,企業(yè)必須擁有良好的AI能力,并且能夠不斷更新。
以上是使用AI生成的本文簡介。
起點
chatgpt的出現(xiàn),讓LLMs走進了普通人的視野。同時,也讓傳統(tǒng)的AI助手變成了原始人。
chatgpt向我們展示了LLM目前的天花板。而且這個天花板還相當高?;谶@個天花板,我們也可以分析哪些問題是可能使用AI來解決的。
chatgpt是預訓練模型。它所包含的知識有限且會有偏重。
chatgpt可以通過fine-tuning來獲取垂直領域的能力。編程就是一個很好的例子。目前chatgpt在其它領域胡謅八扯,但是寫的程序基本上不會有太大問題。大概是因為在實現(xiàn)codex和copilot的過程中,喂了大量的編程語料。
chatgpt對中文的理解基本沒有太大問題,但是回答會有很多一本正經的胡說八道的情況。估計是因為中文語料投喂不足。
chatgpt目前存在著信息時效性差的問題。但是隨著基于gpt-4的微軟new bing的到來,AI可以實時檢索網(wǎng)絡信息,從而獲取最新的消息。從而, 可以回答需要結合時效信息的問題。
?? ChatGPT大概的誕生流程

深入一些的思考
隨著gpt應用的深入,各種領域的語料都會被用來對模型進行fine-tuning。一個個AI老專家的誕生只是時間問題。同時,AGI在LLM大突破之后,也會有相應的進化。產生一個能同時理解各種信息的AI一樣也只是時間問題。
人類最獨特的地方就是思維。語言是思維的載體。我們不只是與別人交流或者讀寫時在使用語言。我們的思考也是基于語言的。LLM(大型語言模型)已經把語言玩明白了。
gpt是一種生成模型。其輸出最后確實會經過一個softmax層輸出,也就是其結果是基于概率的。但是,這個概率又是如何產生的呢?我們人類得出下一個詞的方式又是什么呢?我們都不清楚。
至于這是不是思維就更不好確定了。我們人類對自己的思維過程完全了解么?并不。我們對于gpt的運算過程完全了解么?并不。兩邊都不夠了解,那就沒辦法給出確切的結論。尤其對于我們這些非科研工作者,就更沒必要非得下個什么結論了。
目前的LLM還不具備大量代替人類的能力。而且,與其說AI代替人類,不如說使用AI的人代替了另外一些人。但是,我們如果現(xiàn)在不考慮如何參與這個技術變革進程的話,等到AI真的開始替代人類的時候,一切都晚了。
在浪潮中怎么辦
從gpt2開始,LLMs的體量越來越大。GPT-3更是依靠著大力出奇跡的方式,以1750億參數(shù)的龐大模型實現(xiàn)了驚人的效果。
AI 技術的轉折點其實在GPT-3就已經發(fā)生了。但是chatgpt讓包括非信息產業(yè)從業(yè)者也了解到了技術變革已經發(fā)生了。
對于巨無霸企業(yè)
他們可以擁有自己的LLM。訓練一個LLM從GPT-3開始就已經是一個帶家非常高昂的過程了。據(jù)說開銷在千億美元級別。擁有了LLM,就相當于構建了一個平臺。通過這個平臺,可以收編各個領域的佼佼者。
對于大型企業(yè)
他們也許有能力對LLM進行fine-tuning的同時,對LLM做一定的修改,從而構建一個在某個垂直領域非常強大的AI。這樣的一個AI將會大幅降低領域內工作所需要的人力,從而節(jié)約大量成本。雖然要向基礎LLM所有者繳納AI稅,但肯定是相當值得的。
對于中小企業(yè)
如果不能很好的利用AI,其成本將遠超同類型,但是會好好利用AI的企業(yè)。從know-how的積累到員工的培訓,從企業(yè)目標制定、市場調研到實際的生產過程,甚至是企業(yè)的內部管理,在沒有AI的支持的情況下, 效率都將落后10倍甚至更多。
從業(yè)務角度來說,如果有自己獨到的數(shù)據(jù),應該考慮在云端通過fine-tuning構建垂直領域AI。就目前的狀況來看:
應該馬上著手整理自己的各種業(yè)務、技術相關的知識和經驗。
梳理成較為適合用作模型訓練的數(shù)據(jù)。
為了防止核心數(shù)據(jù)被云端利用,可以考慮使用一部分數(shù)據(jù)來fine-tuning一個模型。
評估自身業(yè)務與AI的契合程度。
對于普通的腦力勞動者
AI可以幫助我們以更高效的方式思考和工作。要學習如何與AI溝通,如何利用AI的能力提高自己的效率。比如,過去要調用一個API,需要一遍遍的查閱各種文檔、例子以及教程?,F(xiàn)在,只要一句話,我們就能得到一段幾乎可以直接使用的代碼。但是,同時也要加強自身知識的積累。未來能留存下來的人,除了能利用AI,也要能發(fā)現(xiàn)AI的問題?;パa才是生存之道。
總結
作為一個22年碼齡的老碼農,在被ChatGPT震撼之后,胡言亂語。但是,我實話實說,寫了這么多年代碼,讓我感到害怕的程序,我還是第一次遇到。。。