隨便寫寫

ChatGPT剛剛公測的時候,群里就有同學發(fā)了一個鏈接進來,大家體驗了一下,評價不一。因為之前做過一點簡單的深度學習項目,很入門的那種(驗證碼識別,簡單的nlp,判斷兩句話意思是否一致),所以我對于現在網絡上塵囂甚上的說法(尤其是我們學校還有一個教授借著這個機會瘋狂炒作自己定義的概念)有著很強烈的反感。 用程序員的視角看AI,本質上可以說是用線性代數去做各種場景的擬合。也就是說,對于某一個特定場景的y(目標值,可以定義為“這張圖片里面的是貓而不是狗的概率”),通過大量的輸入x,以及這些x對應的y來摸索怎么樣讓一個函數f可以實現f(x) = y。具體到ChatGPT上,和大部分生成模型類似,這里的x是“當前的字”,y是“下一個字”。 這樣說似乎很抽象,用一句話來表述就是,“ChatGPT這個模型能夠預測:對于給定輸入,輸出一個字x后,輸出下一個字x'的概率是多少”。這里會有類似隱馬爾可夫的生成鏈相關的內容,在大部分語言相關的技術上都有使用。 可以歪個樓,最開始大家做中文輸入法的時候,因為相同拼音的輸入會非常多,怎么給出一個相對更符合上下文的選項排序就非常困難。引入了隱馬爾可夫模型以后,通過計算當前輸入上下文的條件概率,就可以給出一個更符合人們說話習慣的排序結果。 結合了AI以后,隱馬爾可夫模型有了更強的泛用能力,從詞的級別可以進化到更遠的上下文(LSTM模型)(實際上引入更長的文本前綴也不是不可以,但是僅僅用傳統的模型來擬合,成本會非常高)。僅僅到這一步,ChatGPT只是具備了生成海量文本的能力,文本的質量還是不能保證的。那么怎么用比較低的成本來調教ChatGPT,讓它能夠生成可以讓人滿意的內容呢?答案呼之欲出:再搞一個模型做這個事情。OpenAI雇傭了幾十個人,這些人經過了統一的培訓,要求他們對于一段文本的打分能夠處在一個很一致的水平。包括對各種議題的看法,統一在一個水平線上。 因此在這個新的打分模型里,y就是分數,x是一句話。這些人提供了大約數千條的數據,是真人的打分,那么模型經過訓練以后可以收斂到一個相對高的準確率。 此時潘多拉魔盒就被打開了:ChatGPT居然真的左腳踩右腳上天了!來自模型的監(jiān)督會極大的放大ChatGPT對于某一種回答方式的偏好,從而調整自己的參數,最后ChatGPT的回答是一套至少在監(jiān)督模型看來很符合要求的答案。 那么,代價是什么呢,我的朋友? 前面已經提到了,ChatGPT是一個生成模型。也就是說,本質上可以認為ChatGPT就是一個按照概率蹦字的模型。這個模型可以依據在整個互聯網上搜集到的信息進行模仿式的語言輸出,但是對于計算機本來應該最擅長的邏輯推理、運算等功能,表現很差(加法都算不明白那種)。當然,這個問題可以讓ChatGPT自己編程解決——這似乎向我們揭示了一個有可能存在的,ChatGPT的能力上限:一個程序員。 所以這里是不是還挺有趣的,有這樣一群人,造出來了一個和自己的能力相當的產品。 但是我必須再次強調一點:ChatGPT本身所有的能力,或者說所謂的“思考”,都是基于公開的,能夠獲取到的內容,經過了概率的演算,拼湊出的答案。和一個搞AI的朋友聊天,他說,用隨機噪聲出發(fā)去訓練一套給ChatGPT的指令,也就相當于ChatGPT有了自己的想法。從我的角度看,我仍然認為這和我認知中的智能有巨大差別:基于少量的信息和一套相對完備的邏輯框架,得出結論VS基于海量的信息,一個詞一個詞拼出來一套回復。哪怕這個回復是高分的,是符合邏輯的,我仍然會認為這和人工智能的愿景有很遠的距離。 力大磚飛的路徑帶來的結果,用我舍友描述AI去做CV的話說,“第一次把圖像分類這個任務做到了可用的水平”——ChatGPT也第一次在人機對話這個層面突破了絕大多數同類產品。路徑的選擇是需要結合時代的科學背景的,當前的計算機結構,對人本身的智能理解,并不能支持所謂的強人工智能,“創(chuàng)造生命”的實現,但是能夠在效果上接近(想象讓自己養(yǎng)的寵物說話,還能說的像ChatGPT一樣流利:對于已經有一定智能的生物都看上去不可實現,更何況創(chuàng)造出具備智能的電子生命再完成這個任務呢),在我看來,是遠超區(qū)塊鏈、元宇宙這樣的風口的。 所以在批判和感慨之余,我覺得微軟New Bing這個產品的推出印證了我這段實習讓我學到的一個重要知識: 一個偉大的產品需要的不僅是技術的革新——這往往會讓一個產品非常好用,更重要的是商業(yè)模式的革新——這決定了會不會產生新的玩法,會不會淘汰桌上已有的玩家。 以我對我認識到的變現方式來講,想要獲得收入,要么選擇接廣告,要么選擇直接向用戶收費(應該還是有第三種的,大概類似于利用共識,炒作價值,但是我挺討厭的,就不想單列出來)。 廣告模式可以是曾經的電視廣告,像有的電視臺就會沒有底線的接各種垃圾產品的廣告,還會伴隨著一個結尾大概率是8888的訂購電話(現在應該是二維碼了吧);也可以是搜索引擎的廣告,例如根據搜索結果的位置來定價,這個應該是谷歌帶頭干的(計網老師這么說的,比如搜麥當勞的時候哪家在前面,優(yōu)先展現=加錢);在當下,我理解不管是SJ還是tiktok,提升用戶使用時間的根本目的還是為了更高的廣告展現&因此帶來的收入。 直接收費比較成功的例子,我覺得主要是游戲。游戲的內購/買斷模式算是比較成熟的了。大部分軟件的會員模式感覺做的都沒有很出彩,比如騰訊花了很多錢去買NBA版權,但是愿意充錢去騰訊體育看NBA的用戶很少,感覺主要受限于騰訊的定價策略。 最后還是提一嘴吧,像meta和區(qū)塊鏈引出的虛擬貨幣給我的是一種類似于炒股的感覺,股票這種收入很有那種,“傻逼的共識也是共識”,還有就是“只要大家都覺得這個值錢,這個就真的值錢”,個人覺得是一種不夠理性的價值取向吧。也有可能是因為我把握不住,所以我很不喜歡這個(笑)。 列舉完了這三種,其實我覺得我想指出的一點是,ChatGPT在微軟的New Bing里,仍然是作為一種“輔助”的角色出現的:微軟想通過ChatGPT來增加bing的用戶,進而提升市場占有率,最后繼續(xù)依賴谷歌的商業(yè)模式發(fā)展下去。ChatGPT可以是bing挑戰(zhàn)谷歌的一張牌,但是我個人不覺得這張牌在谷歌也具備很強的AI技術的前提下,能起到一錘定音的作用。當下所有的大公司都在建設類似ChatGPT的產品,并且期盼于這種產品可以改變當下的格局,我個人是抱著相對更悲觀的態(tài)度的:一個能力范圍在程序員這個級別的技術,又有什么產品可以被賦能到成為被這個風口托起來的豬呢?