盤點AI大模型浪潮里出圈的科技公司
OpenAI發(fā)布ChatGPT后,ChatGPT短時間內(nèi)已經(jīng)成為最火的大語言模型。隨著國外廠商大模型浪潮盛行,國內(nèi)科技公司追隨大模型浪潮,也發(fā)布了許多AI大模型,這場AI大模型的革命正在國內(nèi)悄然進行。
國內(nèi)有以下公司及大模型:




詳細舉例說明:
1、華為的盤古模型
華為模型是華為開發(fā)的一系列大模型自回歸中文預訓練語言模型,包括NLP大模型、CV大模型、多模態(tài)大模型、科學計算大模型等。盤古模型可以支持多種自然語言理解和生成任務,如文本生成、文本分類、問答系統(tǒng)等,也可以應用于多個領(lǐng)域,如醫(yī)療、工業(yè)、交通、氣象等。盤古模型有2000億個參數(shù),比GPT-3的1750億稍高一點,且是基于鵬城云腦Ⅱ和全場景人工智能計算框架Mindspore訓練的。
2、百度文心一言
百度的文心大模型和Open?AI的GPT模型類似,在2019年就已經(jīng)推出,并且已經(jīng)迭代了多代。從單一的自然語言理解延伸到多模態(tài),包括視覺、文檔、文圖、語音等多模態(tài)多功能,所基于的ERNIE系列模型也已經(jīng)具備較強的泛化能力和性能。在算力方面,?百度自研AI芯片“昆侖”已在多場景實際部署幾萬片,在搜索業(yè)務中也已形成較強的工程化實踐,因此,“文心一言”底層算力有所保證。
3、阿里通義
4月份阿里云智能首席技術(shù)官周靖人在阿里云峰會上正式宣布推出大語言模型通義千問,基于Transformer架構(gòu)的自然語言處理模型。且阿里巴巴所有產(chǎn)品未來將接入“通義千問”大模型,包括天貓、淘寶、釘釘、天貓精靈、閑魚、盒馬等。功能包括多輪對話、文案創(chuàng)作、邏輯推理、多模態(tài)理解、多語言支持。能夠跟人類進行多輪的交互,也融入了多模態(tài)的知識理解,且有文案創(chuàng)作能力,能夠續(xù)寫小說,編寫郵件等。
官網(wǎng)通義大模型?(aliyun.com)
4、清華大語言模型ChatGLM
GLM-130B千億基座模型,ChatGLM參考了ChatGPT的設(shè)計思路,在千億基座模型GLM-130B1中注入了代碼預訓練,通過有監(jiān)督微調(diào)(Supervised?Fine-Tuning)等技術(shù)實現(xiàn)人類意圖對齊。該模型有一些獨特的優(yōu)勢:
高精度(英文):?在公開的英文自然語言榜單?LAMBADA、MMLU?和?Big-bench-lite?上優(yōu)于?GPT-3?175B(API:?davinci,基座模型)、OPT-175B?和?BLOOM-176B。
快速推理:?首個實現(xiàn)?INT4?量化的千億模型,支持用一臺?4?卡?3090?或?8?卡?2080Ti?服務器進行快速且基本無損推理。
可復現(xiàn)性:?所有結(jié)果(超過?30?個任務)均可通過我們的開源代碼和模型參數(shù)復現(xiàn)。
5、科大訊飛星火認知大模型
發(fā)布以來核心能力持續(xù)迭代,6月9日又發(fā)布星火認知大模型V1.5,不僅各項能力持續(xù)提升,且突破開放式知識問答,多輪對話、邏輯和數(shù)學能力再升級。有著文本生成、語言理解、知識問答、邏輯推理、數(shù)學知識等七大核心能力。在教育、醫(yī)療、辦公、數(shù)字員工、汽車、金融、工業(yè)等多場景應用。
6、實在智能TARS大模型
實在的國產(chǎn)大模型,TARS(塔斯)歷經(jīng)半年研發(fā),近期正式上線開始內(nèi)測。這是國內(nèi)人工智能企業(yè)、RPA賽道頭部實在智能自研垂直領(lǐng)域的大語言模型,在TARS大模型中疊加了多項自然語言處理前沿技術(shù),基于開源基座模型,在千億級高質(zhì)量Tokens上進行了充分訓練,完整復現(xiàn)了Pretrain、SFT和RLHF三個階段,語言理解能力及指令跟隨能力等在橫向?qū)Ρ葴y試中均取得良好效果。
7、商湯科技日日新SenseNova/商量、秒畫、如影
作為商湯“日日新SenseNova”大模型體系的重要一員,“商量SenseChat?2.0”是商湯科技研發(fā)的AI大語言模型,擁有很強的長文本理解、邏輯推理、多輪對話、情感分析、內(nèi)容創(chuàng)作、代碼生成等綜合能力,并且能夠在與用戶的互動過程中精進判斷力與創(chuàng)作智能,實現(xiàn)知識實時更新。
8、知乎×面壁科技?知海圖AI大模型
“看山”小助手會出現(xiàn)在熱榜的問題下方,會抓取那些優(yōu)質(zhì)問答的重要觀點,經(jīng)過AI算法整理、聚合、潤色后,將回答梗概展現(xiàn)給用戶。其背后的大語言模型是CPM-Bee,來自當下飽受市場關(guān)注的清華系大模型創(chuàng)業(yè)公司面壁智能。
......
結(jié)語:
這些大模型就像一群巨人,正在各個領(lǐng)域中揮舞著他們的力量,引領(lǐng)著一場前所未有的技術(shù)變革。他們的出現(xiàn),讓我們感覺仿佛是在觀看一場“百模大戰(zhàn)”。