散文網(wǎng) » 科技 »學習 » 2023年計算機行業(yè)：緊抓算力、大模型把握AI帶來信息產(chǎn)業(yè)革命（附下載）

2023年計算機行業(yè)：緊抓算力、大模型把握AI帶來信息產(chǎn)業(yè)革命（附下載）

2023-07-18 17:58 作者:星情獨葉 0人讀過 | 我要投稿

今天分享的是人工智能AI系列深度研究報告：《2023年計算機行業(yè)：緊抓算力、大模型把握AI帶來信息產(chǎn)業(yè)革命》。（報告出品方：國信）

研究報告內(nèi)容摘要如下

OpenAI 推動 T GPT 模型快速迭代，T ChatGPT 成為標志。隨著 ChatGPT 引爆全球科技行業(yè)，關(guān)于 AI 大模型的突破成為關(guān)鍵焦點。第一階段 GPT-1 到 GPT-3 主要以參數(shù)擴張為主：基于 Transformer 模型，通過學習大量未標記的文本數(shù)據(jù)，逐步結(jié)合無監(jiān)督預(yù)訓練的技術(shù)，開始具備少樣本及零樣本學習的能力；模型參數(shù)也從 1.2億，提升至 15.8 億，最終達到 GPT-3 的 1750 億。第二階段為模型增強階段：instructGPT 引入了人類反饋強化學習方案（RLHF），鼓勵模型輸出與人類偏好一致的結(jié)果，隨后 ChatGPT 面向公眾，產(chǎn)生更多的有效標注數(shù)據(jù)；GPT-4 則實現(xiàn)了多模態(tài)模型，可以接受文本和圖像形式的輸入，其真實性和有效性方面取得了有史以來最佳成果。

GPT-4 再進化能力進一步提升。OpenAI 經(jīng)過 6 個月的對抗測試，以及結(jié)合 ChatGPT的經(jīng)驗對 GPT-4 持續(xù)調(diào)整，在真實性和可控性取得了歷來最好結(jié)果。GPT-4 處理文本量達到 25000 字左右，約等于 ChatGPT 的八倍，也能接受圖像輸入。根據(jù)實驗結(jié)果，GPT-4 在各種專業(yè)測試和學術(shù)基準上表現(xiàn)與人類水平相當。與 GPT-3.5相比，當任務(wù)復(fù)雜性達到一定閾值后，GPT-4 比 3.5 具有更好的表現(xiàn)，其能夠處理更細微的指令。GPT-4 目前的整體表現(xiàn)優(yōu)于現(xiàn)有的大型語言模型。

媒體爆料 4 GPT-4 模型細節(jié) ，參數(shù)體量再擴大。OpenAI 并沒有披露 GPT-4 模型的細節(jié)，近期媒體 semianalysis 發(fā)布文章《GPT-4 Architecture, Infrastructure,Training Dataset, Costs, Vision, MoE》介紹了 GPT-4 的模型細節(jié)。文章表示，GPT-4 在 120 層中總共包含了 1.8 萬億參數(shù)，是 GPT-3 的 10 倍以上；GPT-4 采用混合專家（MoE）模型，共有 16 個專家，每個專家的 MLP 參數(shù)約為 1110 億；GPT-4的訓練使用了大約 25,000 個 A100 芯片，一次的訓練的成本為 6300 萬美元。從GPT-4 模型比 GPT3.5 更好的效果表現(xiàn)來看，無論是參數(shù)體量、模型優(yōu)化都有進一步的提升。性能的持續(xù)提升，為 AI 應(yīng)用的一步打下基礎(chǔ)，同時也大規(guī)模拉動了算力的需求。