2023年計算機行業(yè):緊抓算力、大模型把握AI帶來信息產(chǎn)業(yè)革命(附下載)
今天分享的是人工智能AI系列深度研究報告:《2023年計算機行業(yè):緊抓算力、大模型把握AI帶來信息產(chǎn)業(yè)革命》。(報告出品方:國信)
研究報告內(nèi)容摘要如下
OpenAI 推動 T GPT 模型快速迭代 ,T ChatGPT 成為標志。隨著 ChatGPT 引爆全球科技行業(yè),關(guān)于 AI 大模型的突破成為關(guān)鍵焦點。第一階段 GPT-1 到 GPT-3 主要以參數(shù)擴張為主:基于 Transformer 模型,通過學習大量未標記的文本數(shù)據(jù),逐步結(jié)合無監(jiān)督預(yù)訓練的技術(shù),開始具備少樣本及零樣本學習的能力;模型參數(shù)也從 1.2億,提升至 15.8 億,最終達到 GPT-3 的 1750 億。第二階段為模型增強階段:instructGPT 引入了人類反饋強化學習方案(RLHF),鼓勵模型輸出與人類偏好一致的結(jié)果,隨后 ChatGPT 面向公眾,產(chǎn)生更多的有效標注數(shù)據(jù);GPT-4 則實現(xiàn)了多模態(tài)模型,可以接受文本和圖像形式的輸入,其真實性和有效性方面取得了有史以來最佳成果。
GPT-4 再進化 能力進一步提升。OpenAI 經(jīng)過 6 個月的對抗測試,以及結(jié)合 ChatGPT的經(jīng)驗對 GPT-4 持續(xù)調(diào)整,在真實性和可控性取得了歷來最好結(jié)果。GPT-4 處理文本量達到 25000 字左右,約等于 ChatGPT 的八倍,也能接受圖像輸入。根據(jù)實驗結(jié)果,GPT-4 在各種專業(yè)測試和學術(shù)基準上表現(xiàn)與人類水平相當。與 GPT-3.5相比,當任務(wù)復(fù)雜性達到一定閾值后,GPT-4 比 3.5 具有更好的表現(xiàn),其能夠處理更細微的指令。GPT-4 目前的整體表現(xiàn)優(yōu)于現(xiàn)有的大型語言模型。
媒體爆料 4 GPT-4 模型細節(jié) , 參數(shù)體量再擴大。OpenAI 并沒有披露 GPT-4 模型的細節(jié),近期媒體 semianalysis 發(fā)布文章《GPT-4 Architecture, Infrastructure,Training Dataset, Costs, Vision, MoE》介紹了 GPT-4 的模型細節(jié)。文章表示,GPT-4 在 120 層中總共包含了 1.8 萬億參數(shù),是 GPT-3 的 10 倍以上;GPT-4 采用混合專家(MoE)模型,共有 16 個專家,每個專家的 MLP 參數(shù)約為 1110 億;GPT-4的訓練使用了大約 25,000 個 A100 芯片,一次的訓練的成本為 6300 萬美元。從GPT-4 模型比 GPT3.5 更好的效果表現(xiàn)來看,無論是參數(shù)體量、模型優(yōu)化都有進一步的提升。性能的持續(xù)提升,為 AI 應(yīng)用的一步打下基礎(chǔ),同時也大規(guī)模拉動了算力的需求。








(本文僅供參考,不代表我們的任何投資建議。如需使用相關(guān)信息,請參閱報告原文。)
本報告共計:32頁。受篇幅限制,僅展示部分內(nèi)容。
精選報告來源公眾號:【人工智能學派】,回復(fù)關(guān)鍵字“6688”,獲取完整PDF電子版