大模型+大算力 商湯科技發(fā)布“日日新SenseNova”大模型體系
商湯科技SenseTime舉辦技術交流日活動,分享了以“大模型+大算力”推進AGI(通用人工智能)發(fā)展的戰(zhàn)略布局,并公布了商湯在該戰(zhàn)略下的“日日新SenseNova”大模型體系,推出自然語言處理、內容生成、自動化數(shù)據(jù)標注、自定義模型訓練等多種大模型及能力?;顒由希虦粌H展示了“日日新SenseNova”大模型體系下的語言大模型,還展示了AI文生圖創(chuàng)作、2D/3D數(shù)字人生成、大場景/小物體生成等一系列生成式AI模型及應用,并公布了商湯依托AI大裝置SenseCore實現(xiàn)“大模型+大算力”融合創(chuàng)新的研發(fā)體系。
?
當前業(yè)界訓練大模型對大算力的需求非常旺盛,并且真正好用的基礎設施十分稀缺。商湯歷時五年,建設了業(yè)界領先的AI大裝置,大裝置上總共有27000塊的GPU芯片卡,可以輸出5.0 exaFLOPS的總算力,是亞洲目前最大的智能計算平臺之一?;诖笱b置的能力,商湯目前已構建了計算機視覺、自然語言處理、AI內容生成、多模態(tài)、決策智能等多個領域的大模型,持續(xù)演進能力并廣泛支持各種應用。
?
?
商湯科技董事長兼CEO徐立表示:“在AI大模型時代,數(shù)據(jù)、算法和算力這三要素也在經(jīng)歷新的演變,大模型參數(shù)量將以指數(shù)級的速率提升,而數(shù)據(jù)量隨著多模態(tài)的引入也將大規(guī)模增長,因此就必然會導致對算力需求的劇增。我們以AI大裝置SenseCore打造AGI時代的基礎設施,并基于此將大模型體系命名為‘日日新SenseNova’,寓意‘茍日新、日日新、又日新’,希望在模型的迭代速度及處理問題的能力上可以日日更新,不斷解鎖AGI的更多可能?!?/p>
?
商湯科技董事長兼CEO徐立
?
“AGI催生了新的研究范式,即基于一個強大的多模態(tài)基模型,通過強化學習和人類反饋不斷解鎖基模型新的能力,從而更高效地解決海量的開放式任務。AGI將實現(xiàn)從‘數(shù)據(jù)飛輪’到‘智慧飛輪’的演進,最終邁向人機共智?!鄙虦萍悸?lián)合創(chuàng)始人、首席科學家王曉剛表示:“商湯已建立了全棧的大模型研發(fā)體系,并已在多個行業(yè)場景中落地,場景的多樣性,任務的復雜度,數(shù)據(jù)的豐富度均充分展示了我們大模型的能力和未來潛力。我們將持續(xù)推動基礎設施建設,期待和合作伙伴一起投入到AGI的時代大潮中?!?/p>
?
商湯科技聯(lián)合創(chuàng)始人、首席科學家王曉剛
?
“日日新SenseNova”為政企客戶提供了多種靈活的API接口和服務,包括圖片生成,自然語言生成,視覺感知通用任務與標注服務。客戶可根據(jù)實際應用需求,調用“日日新SenseNova”大模型的各項AI技術能力,低門檻、低成本、高效率地實現(xiàn)各類AI應用。
?
“日日新SenseNova”也已為商湯的自身業(yè)務帶來了諸多突破。例如在智能駕駛領域,基于視覺大模型,商湯實現(xiàn)了可識別3000類物體的BEV環(huán)視通用感知算法的實車量產(chǎn),也構建了感知決策一體化的自動駕駛多模態(tài)模型,帶來更強的環(huán)境、行為、動機解碼能力。
?
自然語言是人機溝通的關鍵手段,“日日新SenseNova”也推出了商湯最新研發(fā)的語言大模型“商量SenseChat”。作為千億級參數(shù)的自然語言處理模型,“商量SenseChat”使用大量數(shù)據(jù)訓練,并充分考慮了中文語境,能夠更好地理解和處理中文文本?;顒蝇F(xiàn)場,“商量SenseChat”展示了出色的多輪對話和超長文本的理解能力。商湯也展示了語言大模型支持的幾項創(chuàng)新應用,包括:編程助手,可幫助開發(fā)者更高效地編寫和調試代碼;健康咨詢助手,為用戶提供個性化的醫(yī)療建議;PDF文件閱讀助手,能輕松從復雜文檔中提取和概括信息。
?
?
擴散模型引爆了AIGC應用的流行,商湯展示了“日日新SenseNova”的各種AI文生圖創(chuàng)作、2D/3D數(shù)字人生成、大場景/小物體生成等一系列生成式AI模型及應用:
?
n? “秒畫SenseMirage”文生圖創(chuàng)作平臺,展現(xiàn)了光影真實、細節(jié)豐富、風格多變的強大的文生圖能力,可支持6K高清圖的生成;客戶還可根據(jù)自身需求訓練生成模型。
n? “如影SenseAvatar”AI數(shù)字人視頻生成平臺,僅需一段5分鐘的真人視頻素材,就可以生成出來聲音及動作自然、口型準確、多語種精通的數(shù)字人分身。
n? “瓊宇SenseSpace”和“格物SenseThings”3D內容生成平臺,可以高效低成本生成大規(guī)模三維場景和精細化的物件,為元宇宙、虛實融合應用打開新的想象空間。
?
?
“日日新SenseNova”帶來的這些強大而易用的內容生成能力,將會改變內容生產(chǎn)行業(yè)的生產(chǎn)范式,突破內容創(chuàng)意的天花板,將會重塑內容生產(chǎn)行業(yè)生態(tài)并打開新的增長空間。
?
無論是語言大模型,還是文生圖或數(shù)字人生成,都離不開大規(guī)模AI基礎設施的算力支持。商湯AI大裝置SenseCore,擁有行業(yè)領先的算力輸出能力、超大模型訓練及大規(guī)模推理能力,將會成為AGI和大模型時代的基礎設施服務領導者。
?
基于AI大裝置SenseCore和“日日新SenseNova”大模型體系,商湯面向行業(yè)伙伴提供涵蓋自動化數(shù)據(jù)標注、自定義大模型訓練、模型增量訓練、模型推理部署、開發(fā)效率提升等多種大模型即服務(Model-as-a-Service):
?
n? 基于預訓練大模型的自動化數(shù)據(jù)標注可實現(xiàn)相較于人工數(shù)據(jù)標注近百倍的效率提升。
n? 大模型并行訓練和模型增量訓練服務能夠幫助客戶快速利用自有數(shù)據(jù)訓練模型,包括在預訓練大模型之上進行垂域行業(yè)模型的開發(fā),生產(chǎn)千行千面的自定義模型。
n? 模型推理部署服務可將大模型推理效率提高100%以上,降低用模型提供服務的成本。
n? 商湯也向行業(yè)開發(fā)人員開放大量預訓練模型及AI開發(fā)工具鏈,全面賦能客戶提升開發(fā)效率。
?
商湯將持續(xù)推進“日日新SenseNova”大模型體系的建設?!捌埲招隆⑷杖招?、又日新”,商湯大模型研發(fā)期待在數(shù)據(jù)量上、參數(shù)結構上、以及能處理的問題上,可以日復一日的提高,攜手行業(yè)生態(tài)共同迎來更強大的AGI技術的突破,讓AI技術惠及每個人。