【花師小哲】鑒定網(wǎng)絡熱門(?)AI(5)——百度文心一言發(fā)布會小總結(jié)
本來今天是沒打算看文心一言的發(fā)布會的,但還是看了,發(fā)一篇很快的總結(jié)吧。


0.前言
本次文心一言的發(fā)布壓力本來就很大的,畢竟GPT-4已經(jīng)放出來了,這又是大廠第一次發(fā)布自回歸大語言模型(OpenAI并不是大廠),壓力多大就不多說了,可以看如下的梗圖:


1.能力發(fā)布
發(fā)布會第一階段,主要是展示能力。
看得出來文心一言是知道該重點攻克哪里的,而且應該是有點高估GPT-4,所以竟然有多模態(tài)生成。
文心一言重點攻克的是中文,其實中文的難度是比英文要大的,畢竟中文語料質(zhì)量和數(shù)量其實和英文都有差距。而且其實ChatGPT和GPT-4的中文理解能力也是沒有英語強的(所以英語好的朋友其實更建議用英文對話),不過百度畢竟是有語言大模型的經(jīng)驗(之前也是和主流一樣主要在做判別模型),所以應該也是有充足的經(jīng)驗了。
GPT-4目前只有輸入是多模態(tài)的,并且目前只開放了語言模態(tài),GPT-4的輸出依然只有文字。展示中我沒有看到文心一言輸入可以是多模態(tài),但輸出確實可以做多模態(tài)了。文心一言可以輸出圖像、語音和視頻(視頻目前不開放給一般用戶)

2.技術(shù)發(fā)布
發(fā)布會第二階段,主要是講解技術(shù)。
總能力發(fā)布其實就可以看出來,文心一言不是單純的端到端模型,應該是超級縫合怪,用了很多增強技術(shù)來做,就這個層面來說是比ChatGPT強一些的(LeCun直呼內(nèi)行好吧)
一共六個主要技術(shù),下面三個是ChatGPT用的幾個核心技術(shù),上面的是百度的。

簡要說幾個:
(1)提示(prompt)。不出意外的,有思維鏈CoT

(2)知識增強。用了超大知識圖譜,這也展示了大廠的一個優(yōu)勢——比OpenAI砸錢能力強多了

(3)檢索增強。應該是直接接了百度搜索引擎,和new bing的做法類似

(4)對話增強。這個應該是額外對對話能力方面做了優(yōu)化。

(5)我覺得還有其他黑科技,類似于Visual ChatGPT或Toolformer那樣的

3.后記
整體來說,我覺得這次發(fā)布會還是可以的。畢竟也是第一次發(fā)布自回歸大語言模型嘛,而且有多模態(tài)生成已經(jīng)很厲害了,而且并不是完全和ChatGPT和GPT-4對抗(很多東西能做互補),說明百度還是比較清醒的。
當然,發(fā)布的還是有些急的,很多東西應該還有待完善,但這幾個月就做到這種程度,我個人感覺已經(jīng)很不錯了。
當然,模型的很多細節(jié)都沒有披露。也沒辦法,OpenAI開了這個頭,其他的廠想要開源千億規(guī)模的大模型其實都不太容易了(也有其他原因)。
寫的比較快,里面一些東西就不貼鏈接了,感興趣的朋友就麻煩自己翻找一下了。