AI大模型“百花齊放”,底層算力需求與日俱增
今年以來,AI大模型在全球掀起一輪開發(fā)熱潮,眼下正處于快速應(yīng)用落地的關(guān)鍵期。月初在上海舉辦的世界人工智能大會(huì)集中展示了國內(nèi)外總計(jì)30余款大模型,突顯大模型賦能各行各業(yè)的多元生態(tài)。

展會(huì)上的火熱程度僅僅是國內(nèi)大模型快速發(fā)展的一隅。據(jù)不完全統(tǒng)計(jì),從三月的文心一言拉開大幕算起,截止目前國內(nèi)已經(jīng)有上百個(gè)大模型產(chǎn)品問世。毫不夸張地說“百模大戰(zhàn)”已然開啟。
從短期來看,AI大模型無疑將成為人工智能核心產(chǎn)業(yè)發(fā)展“新引擎”。IDC預(yù)測(cè),2026年中國人工智能軟件及應(yīng)用市場(chǎng)規(guī)模將達(dá)到211億美元,人工智能將進(jìn)入大規(guī)模落地應(yīng)用關(guān)鍵期。未來在算力中心或者其他的細(xì)分領(lǐng)域,AI大模型必然是一個(gè)趨勢(shì)。
AI大模型對(duì)于底層算力需求與日俱增
算力是人工智能產(chǎn)業(yè)創(chuàng)新的基礎(chǔ),大模型的持續(xù)創(chuàng)新,驅(qū)動(dòng)算力需求爆炸式增長??梢哉f,大模型訓(xùn)練的效率或者是創(chuàng)新的速度,根本上取決于算力的大小。
在訓(xùn)練階段,單次GPT-3 Small(1.25億)計(jì)算量 2.6PFlops*天;單次GPT-3XL計(jì)算量為 27.5 Pflops*天;單次GPT-3(175B)計(jì)算量 3640 PFLops*天;PalM 模型(5400億)? 29600 Pflops*天。在推理階段(日常運(yùn)營),2023年1月ChatGPT官網(wǎng)總訪問量6.16億次,單月運(yùn)營算力約為4874.4 Pflop/s。
有消息稱,GPT-4達(dá)到了100萬億的參數(shù)規(guī)模,其對(duì)應(yīng)的算力需求同比大幅增加。數(shù)據(jù)顯示,大模型參數(shù)數(shù)量的增長與算力的平方成正比。

超大模型訓(xùn)練、推理需要消耗密集和昂貴的算力等資源,對(duì)算法本身提出了極高的要求。在海量數(shù)據(jù)上訓(xùn)練百億、千億、萬億的參數(shù),對(duì)模型訓(xùn)練速度、模型精度以及訓(xùn)練資源成本都是極大的挑戰(zhàn)。超大規(guī)模的模型參數(shù),也讓模型預(yù)測(cè)單次的成本與耗時(shí)都大幅提升,成為規(guī)?;漠a(chǎn)業(yè)應(yīng)用瓶頸。
隨著投身AI大模型的公司如雨后春筍般涌現(xiàn),再加上圍繞大模型的人工智能生態(tài)和由此產(chǎn)生的用于推理的算力需求,未來的算力缺口將更加驚人。算力是否充足將決定各公司大模型產(chǎn)品的成敗。
多家券商在近期研報(bào)中表示,大模型催生算力需求,AI產(chǎn)業(yè)需求持續(xù)爆發(fā)。國內(nèi)大模型自研AI大模型進(jìn)入“百花齊放”階段,大模型的涌現(xiàn)開啟了算力“軍備賽”。
為全面助力大模型的發(fā)展,思騰合力與國內(nèi)外知名芯片廠商合作,圍繞算力底層技術(shù)支撐做了大量功課,持續(xù)在基礎(chǔ)硬件方面提升實(shí)力,使得思騰AI算力服務(wù)器,可訪問多個(gè)機(jī)器學(xué)習(xí)框架,大大加快訓(xùn)練速度,提升資源利用率,保障任務(wù)穩(wěn)定性。
考慮到單AI芯片進(jìn)步速度還未跟上大模型對(duì)大算力的需求,思騰合力在各個(gè)單點(diǎn)創(chuàng)新的基礎(chǔ)上,充分發(fā)揮云計(jì)算與存儲(chǔ)網(wǎng)絡(luò)的綜合優(yōu)勢(shì),進(jìn)行架構(gòu)創(chuàng)新,將算力集群化,推出思騰合力服務(wù)器集群解決方案。
該方案可提供高性能計(jì)算能力,加速訓(xùn)練復(fù)雜的深度學(xué)習(xí)模型,優(yōu)化大模型算法,以及處理大規(guī)模數(shù)據(jù)集,從而加快訓(xùn)練進(jìn)度。集群允許并行處理多個(gè)任務(wù),提高大模型推理效率。研究人員可以更快地調(diào)整參數(shù),及時(shí)獲取結(jié)果,從而加速訓(xùn)練進(jìn)展。
未來,AI大模型需求會(huì)持續(xù)走高,思騰合力將會(huì)持續(xù)迭代產(chǎn)品、不斷升級(jí)算力解決方案,適配支持更高效、更復(fù)雜算法的大模型,迎接大模型進(jìn)一步引爆海量算力需求。