大模型廠商急尋PlanB:英偉達改良版芯片已調(diào)試 華為等國產(chǎn)算力供應不足

作者/ IT時報記者 毛宇
編輯/ 郝俊慧 孫妍
自10月24日美國針對人工智能(AI)芯片的出口管制禁令正式生效,已經(jīng)月余。
《IT時報》記者多方采訪獲悉,英偉達面向中國市場的改良版——HGX H20已與國內(nèi)頭部服務器廠商在進行適配測試,由于具體的性能差異和優(yōu)化程度掛鉤,目前還很難對其與高配版H800做性能對比,但是,預估HGX H20的8卡服務器仍高達百萬級。英特爾則對Gaudi 2改良版本表示暫無相關回應。仍可以在國內(nèi)銷售的AMD MI 210則被認為在大模型微調(diào)階段具有相當競爭力。
“最近算力漲價太多,我們確實感到很吃力?!币患掖竽P蛣?chuàng)業(yè)公司人士告訴《IT時報》記者,他們迫切希望有Plan B方案。
最好的Plan B當然是國產(chǎn)算力。目前能夠與英偉達一戰(zhàn)的華為昇騰910B已經(jīng)在科大訊飛、多地智算中心落地商用,且從測試結果來看,某些性能已經(jīng)與英偉達芯片相當。但突如其來的禁令,使得國內(nèi)大模型廠商對華為芯片的需求直線上升。
春天來得太快,華為的供應鏈還需時間做好準備。
01 改良版:訓練能力下降 綜合能耗上升
針對禁令,英偉達、英特爾、AMD等公司迅速做出反應,均放出消息正加緊研制改良版AI芯片。
英偉達計劃推出最新改良版系列芯片——HGX H20、L20 PCle和L2 PCle,其中HGX H20被認為是此次被禁售的H800替代品。一位英偉達經(jīng)銷商告訴《IT時報》記者,“HGX H20正在適配測試中,說是改良版,但其實是‘縮水版’。據(jù)我了解,H20符合美國出口芯片的相關規(guī)定,性能上比H800會有不小差異,但拿貨最快也得下個月?!?/p>
據(jù)鈦媒體App此前報道,H20在帶寬、計算速度等方面均有所限制。理論上,整體算力要比英偉達H100(第一代被禁芯片)降低80%左右,即H20等于H100的20%綜合算力性能,但增加了HBM顯存和NVLink互聯(lián)模塊。
一份網(wǎng)傳的調(diào)研報告認為,H20設計工藝較為一般,甚至不如華為昇騰910B的算力設計工藝,但增加的顯存和網(wǎng)絡帶寬可能更適合訓練參數(shù)不多的模型,適合多卡堆疊與多個AI服務器的使用,“如果有足夠的買卡資源,并不考慮能耗,H20算力可以達到H100算力集群算力?!?/p>
但一位云計算業(yè)內(nèi)人士認為,這種情況實現(xiàn)的可能性并不高,“H20是風冷,熱設計功耗為400W,和A100大體相當,雖然低于H100的700W,但靠堆疊達到H100的算力,可能實際功耗是H100的2倍甚至更高。到最后比拼的都是能源,根本沒有足夠的電力供應機房?!?/p>
02 國產(chǎn)算力性能對標但供應不足
受限于禁令,這一個月來,算力市場風起云涌。
11月初,包括中貝通信、優(yōu)刻得等提供AI算力技術服務的國內(nèi)上市公司均公開表示,受服務器供應緊張影響,租賃價格將會結合市場行情等因素進行相應調(diào)整。
英偉達A100芯片算力服務收費價格甚至最高上調(diào)100%。
《IT時報》記者從某云商了解到,H800的算力資源非常緊俏,基本有價無貨,A100(A800)的算力租賃價格上漲幅度暫時只有20%左右,但庫存水位已經(jīng)很低。
眾多目光聚焦于國產(chǎn)本土AI芯片,而熱度最高的自然是華為昇騰。此前《IT時報》曾獨家報道,昇騰910B已在國內(nèi)不少智算中心落地,進入規(guī)?;逃们捌?,且從多個信源反饋,在某些指標上,910B已經(jīng)可以對標英偉達去年被禁的A100。

“我們之前已經(jīng)和華為團隊有深度合作,雙方研發(fā)人員聯(lián)手攻克了不少困難?!弊罱鼊倓偘l(fā)布千億參數(shù)大模型星辰的中電信人工智能科技公司副總經(jīng)理劉翼告訴《IT時報》記者,測試中華為昇騰帶來不少驚喜。
通信高級工程師、戰(zhàn)略規(guī)劃專家袁博此前在接受《華夏時報》采訪時表示,華為昇騰芯片和英偉達GPU的適用場景不一樣,在AI機器學習訓練領域,其能力已經(jīng)接近甚至部分超越英偉達的水平,但圖像圖形處理是弱勢,因此只能彌補英偉達的部分場景。
“基于華為昇騰910B的算力價格大概和英偉達A100差不多,”一名接近華為的業(yè)內(nèi)人士告訴《IT時報》記者,盡管H20仍有生態(tài)優(yōu)勢,但長遠來看,國內(nèi)各大廠商仍將華為昇騰看作Plan B的最優(yōu)解,“只是910B產(chǎn)能正在慢慢爬坡,目前暫時無法滿足這么多需求?!?/p>
長期來看,美國禁令的進一步收緊,給了國產(chǎn)算力更充足的發(fā)展時間。
IDC最新報告指出,隨著政府支持,中國本土云端AI加速芯片制造商也正在快速增長。2023年上半年,中國AI服務器使用了50萬塊本地采購/開發(fā)的AI加速器芯片。這一數(shù)量占據(jù)了中國整個服務器市場的10%。顯然,這個數(shù)字在2024年將飛速躍升。
03 算力服務器價格翻倍
至少在目前,國內(nèi)各大廠商仍離不開英偉達。百度CEO李彥宏此前回應,百度得益于之前開發(fā)文心一言,已保存不少AI芯片,能夠保證未來1~2年內(nèi)不斷更新AI大模型。騰訊高層也回應,H800等芯片庫存水平較高,未來可支持幾代混元大模型的更新。
《IT時報》記者分別致電騰訊、阿里、百度公司,詢問AI芯片訂單問題,但均未得到正面回應。
在大模型帶來巨大算力消耗的紅利之下,英偉達迎來了收入、利潤暴增的三季度。11月22日,英偉達發(fā)布2024財年三季度財報,財報顯示:英偉達三季度營收181.2億美元,同比增長205.5%。營業(yè)利潤104.2億美元,同比增長1633.7%。營業(yè)利潤率高達57.5%。
如此看來,算力芯片沖擊仍有一段緩沖期,能夠給到國內(nèi)各大AI廠商一絲喘氣和補救的時間。但另一方面,各類AI芯片正處于漲價通道,“僧多粥少”的局面仍在持續(xù),尤其對于資金力度不夠的中小AI企業(yè)來說,如今算力服務器和算力的價格并不友好。
“現(xiàn)在H800和A800服務器(不等同于算力租賃價格)的價格很高,一臺已經(jīng)飆升至350萬和200萬左右,比之前翻了一倍。”一名經(jīng)銷商表示。記者發(fā)現(xiàn),不少經(jīng)銷商在各大社交平臺發(fā)帖稱手中有少量現(xiàn)貨可以出售,并長期以市場行情價回收二手AI芯片。
“A800和H800價格比較亂,且不便宜。”一名江蘇的芯片經(jīng)銷商告訴《IT時報》記者,隨著美國禁令突然加強,國內(nèi)二手算力芯片市場又開始活絡,不少經(jīng)銷商開始面向全國收售英偉達二手A800和H800芯片。
另一位上海經(jīng)銷商告訴記者,他手上有少量現(xiàn)貨的H800,報價超310萬元,國產(chǎn)華為昇騰910B服務器的報價則為H800的一半,并稱保證最快可于12月初交付現(xiàn)貨,“越早訂貨可以越早交付?!?/strong>
混戰(zhàn)仍將持續(xù)一段時間。
排版/ 季嘉穎
圖片/ 英偉達 IT時報
來源/《IT時報》公眾號vittimes