散文網(wǎng) » 科技 »學習 » 《科技觀察》146：搶先入局AIGC，新華三底層能力何在？

《科技觀察》146：搶先入局AIGC，新華三底層能力何在？

2023-02-27 17:48 作者:申斯基 0人讀過 | 我要投稿

2022年11月，智能對話機器人模型ChatGPT上線，其連續(xù)對話能力、強大的理解力、回答的準確度和創(chuàng)造性使其迅速走紅。數(shù)據(jù)顯示，ChatGPT發(fā)布短短兩個月時間，全球用戶數(shù)便突破1億。

可以說，這項火遍全球的突破性人工智能對話技術(shù)，為整個科技行業(yè)帶來了全新的想象力。而在國內(nèi)，由百度打造的首個“類ChatGPT”——百度文心一言（ERNIE Bot）也即將在今年3月呈現(xiàn)，這是先進的人工智能對話技術(shù)在國內(nèi)數(shù)字化領(lǐng)域中的首次大規(guī)模落地嘗試，其價值無疑深遠而重大。

值得一提的是，紫光股份旗下新華三集團日前也宣布正式成為百度文心一言的首批生態(tài)合作伙伴。接下來，雙方將會把領(lǐng)先的智能對話技術(shù)成果應用在數(shù)字化領(lǐng)域，深度賦能百行百業(yè)的數(shù)字化轉(zhuǎn)型和智能化升級。

回頭來看，新華三之所以能夠成為百度文心一言的首批生態(tài)合作伙伴，無疑是其長期在ICT基礎(chǔ)設(shè)施領(lǐng)域深厚技術(shù)沉淀和釋放的一種體現(xiàn)，而這背后也讓整個產(chǎn)業(yè)看到了新的可能——那就是站在企業(yè)數(shù)字化轉(zhuǎn)型和智能化升級的重要關(guān)口，新華三以其智算基礎(chǔ)架構(gòu)構(gòu)筑的超大模型底座，無疑可以為百行百業(yè)創(chuàng)造出更多具有想象空間的新業(yè)態(tài)、新服務和新模式，讓智能化的大潮 “普惠”每一家企業(yè)和每一個個人，釋放智能化生產(chǎn)力的“乘數(shù)效應”。

新華三牽手百度文心一言背后

目前，以ChatGPT為代表的AIGC內(nèi)容生成方式通過學習人類的思考方式，查閱、挖掘大量素材，以低邊際成本、少人力限制等高效率的方式生成大量滿足人們差異化需求的內(nèi)容。

文心一言，正是百度基于文心大模型技術(shù)推出的生成式AI產(chǎn)品。作為國內(nèi)少有的擁有大模型技術(shù)的企業(yè)，百度在人工智能領(lǐng)域深耕十余年，擁有產(chǎn)業(yè)級知識增強文心大模型ERNIE，具備跨模態(tài)、跨語言的深度語義理解與生成能力，而這種能力，也在搜索問答、云計算、內(nèi)容創(chuàng)作生成、智能辦公等眾多領(lǐng)域具有較大的“用武之地”。

而本次新華三之所以率先成為百度文心一言的首批生態(tài)合作伙伴，其實也在“情理之中”。據(jù)了解，新華三與百度的合作有著長久的歷史積淀，雙方在ICT基礎(chǔ)設(shè)施優(yōu)化升級、百度智能云建設(shè)、信息檢索、自動駕駛、生態(tài)建設(shè)等眾多領(lǐng)域均有研發(fā)級別的合作，目前相關(guān)成果已廣泛落地，對雙方的產(chǎn)品技術(shù)發(fā)展產(chǎn)生了積極而深遠的影響。

而展望未來，新華三也將繼續(xù)攜手百度，為智能交通、自動駕駛、智慧城市、智慧醫(yī)療、智慧教育、智慧金融、多域互聯(lián)等領(lǐng)域推出更多場景化解決方案，開拓內(nèi)容生態(tài)和智能服務領(lǐng)域的全新可能性，全面引領(lǐng)數(shù)字化時代的產(chǎn)業(yè)變革與升級。

以智算架構(gòu)構(gòu)筑超大模型底座

接下來要追問的是，為什么是新華三能夠率先成為百度文心一言的首批生態(tài)合作伙伴呢？其實，要回答這一問題，就不得不提到類似ChatGPT和百度文心一言這樣的AI基礎(chǔ)模型（基于大規(guī)模數(shù)據(jù)集和大規(guī)模算力訓練的大型預訓練模型），要訓練出這樣的超大基礎(chǔ)模型，往往是需要多方面的關(guān)鍵技術(shù)作為支撐的——除了大模型算法、分布式訓練系統(tǒng)、高質(zhì)量數(shù)據(jù)集的相關(guān)工具等，對計算、網(wǎng)絡(luò)、存儲等基礎(chǔ)設(shè)施做出了巨大挑戰(zhàn)。

例如，訓練大模型首先就需要大規(guī)模算力資源做支撐；同時大型訓練對顯存以及數(shù)據(jù)集緩存要求同樣很高，訓練過程中還會面臨顯存墻問題（模型是否能跑起來）以及計算/通信墻問題（能否在合理時間內(nèi)完成訓練）；此外，大模型的訓練同樣對網(wǎng)絡(luò)也提出了更高的要求，即需高性能網(wǎng)絡(luò)滿足節(jié)點間參數(shù)同步，且GPU服務器節(jié)點間需要高速網(wǎng)絡(luò)來實現(xiàn)模型訓練參數(shù)交換和存取等等。

正是由于大模型的訓練對存儲、計算、網(wǎng)絡(luò)等各個層面都提出了比較嚴苛的要求，長期深耕ICT領(lǐng)域的新華三，也基于自身在存儲、計算、網(wǎng)絡(luò)等領(lǐng)域深厚的技術(shù)積淀，打造出了一套全新的智算基礎(chǔ)架構(gòu)，該架構(gòu)分為兩大區(qū)域，即智算訓練區(qū)和智算推理區(qū)，由此能夠為大模型的訓練提供強大的技術(shù)底座能力，具體來看：

一是，在訓練集群方面，目前大模型的訓練使用的服務器通常都是搭載NVIDIA NVLink GPU模塊作為標準機，而新華三能夠提供H3C UniServer R5500 G5這樣機型，其搭載了NVIDIA HGX A800 8-GPU 80G模塊，能夠支持英特爾Whitley平臺和AMD Milan平臺，最大支持2顆Icelake（40C、270W）或2顆Milan（64C、280W）的CPU，存儲方面能夠最大支持12個U.2 NVMe SSD，其中8個支持GDS（GDS, GPU Direct Storage），可以最大化地滿足訓練集群的算力需求。

不僅如此，在2023年初，新華三還發(fā)布了搭載NVIDIA H800 NVLink模塊的新一代機型R5500 G6，支持英特爾EGS和AMD Genoa平臺，PCIe 5.0及400GE網(wǎng)絡(luò)的加持，也能夠給大模型的訓練帶來更高的算力提升。

另外，一些大型互聯(lián)網(wǎng)公司還會使用自研GPU Box搭配計算節(jié)點的方式組建訓練集群，GPU Box里面會搭載NVIDIA NVLink GPU模塊或其他廠商的OAM模組，而OAM是開源的GPU模塊，由OCP社區(qū)服務器項目組下的OAI小組開發(fā)并制定標準。在這方面，新華三也是OAI2.0規(guī)范制定的重要參與者，后續(xù)在R5500 G6上，新華三也可支持不同廠家GPU的OAM模組。

二是，在推理集群方面，GPU推理集群的規(guī)模主要取決于業(yè)務預期的QPS并發(fā)需求，一般會多機多卡多實例部署。同樣，新華三也提供了相關(guān)的產(chǎn)品以滿足實際的業(yè)務需求，以H3C UniServer R5300 G5為例，其最大支持2顆英特爾Icelake（40C、270W）CPU，并可搭配多廠家多種類型的GPU產(chǎn)品，包括GPU、XPU、NPU等。

而在大規(guī)模推理場景下，新華三 UniServer R5300 G5也支持多種類型的GPU方案，包括4 PCIe GPU方案、8 PCIe GPU方案和16 PCIe GPU方案，以應對不同客戶不同算力的推理集群搭建需求。此外，在去年11月份，新華三還發(fā)布了基于AMD Genoa平臺的GPU服務器R5350 G6，可實現(xiàn)90%的CPU性能提升和50%的內(nèi)核數(shù)量提升，應該說多種類型人工智能加速卡的支持，可以幫助客戶應對人工智能不同場景下對異構(gòu)算力的需求。

三是，高性能存儲和網(wǎng)絡(luò)也是大模型訓練的重要組成部分。其中，高性能存儲一般采用分布式并行文件存儲，而新華三CX系列存儲，就采用了全對稱分布式架構(gòu)，可結(jié)合IBM Spectrum Scale，為客戶提供高帶寬、低延時的存儲服務。

以新華三CX5036為例，配置2顆5218 CPU、4塊1T NVMe和32塊6T SATA HDD，4節(jié)點集群部署，測試大文件小IO（4KB）平均單節(jié)點IOPS可達2.55W（隨機讀）、2.36W（隨機寫），多客戶端并發(fā)（16MB）平均單節(jié)點帶寬可達3.57GB/s（順序讀）、2.08GB/s（順序?qū)懀?，單客戶端單?6MB IO聚合帶寬可達5.45GB/s、1MB IO聚合帶寬3.7GB/s。

高性能網(wǎng)絡(luò)方面，通常有兩種網(wǎng)絡(luò)搭建方式：第一種是RoCE網(wǎng)絡(luò)，作為互聯(lián)網(wǎng)400G領(lǐng)域的市場領(lǐng)頭羊，基于新華三提供的S9825/S9855交換機配合AI ECN方案，也可以迅速搭建大模型訓練所需的高性能網(wǎng)絡(luò)。與此同時，隨著大模型訓練所需網(wǎng)絡(luò)帶寬的不斷提升，網(wǎng)絡(luò)主芯片性能也會迅速增加，當800G/1.6T時代來臨時，CPO/NPO交換機將會登上互聯(lián)網(wǎng)舞臺，在這方面新華三也提前做了布局，其S9825-32D32DO交換機，同時支持32個400G光模塊接口和32個400G光引擎接口，后續(xù)可以平滑升級至51.2T平臺；第二種方式是DDC方案，DDC網(wǎng)絡(luò)架構(gòu)（分布式分解結(jié)構(gòu)）可以很輕易解決負載均衡和阻塞問題，同時也能實現(xiàn)更優(yōu)的網(wǎng)絡(luò)性能和更快的網(wǎng)絡(luò)收斂。在這方面，新華三的DDC方案也在進行相關(guān)驗證中。

由此可見，從新華三智算基礎(chǔ)架構(gòu)的技術(shù)細節(jié)中，可以看到新華三以智算基礎(chǔ)架構(gòu)為超大模型訓練構(gòu)筑了堅實的底座，不僅能夠為包括AIGC為代表的超大模型提供關(guān)鍵技術(shù)支撐，同時也是新華三率先成為百度文心一言的首批生態(tài)合作伙伴的關(guān)鍵所在。

釋放智能化生產(chǎn)力“乘數(shù)效應”

客觀地說，智能化已經(jīng)成為了當下中國產(chǎn)業(yè)升級和企業(yè)數(shù)字化轉(zhuǎn)型中的新動能和驅(qū)動力。特別是由于線上線下生態(tài)及場景遠比其他國家豐富、多元，中國經(jīng)濟中結(jié)構(gòu)性的差異，以及細分行業(yè)中不同的應用場景需求，都給了基于AIGC為代表的新技術(shù)的創(chuàng)新以巨大的想象力，而新華三以智算架構(gòu)構(gòu)筑的超大模型底座，不僅可以幫助企業(yè)借助AIGC提升效率，創(chuàng)造新價值，持續(xù)推動產(chǎn)業(yè)智能化的升級，同時也讓AI真正“扎根”百行百業(yè)奠定了關(guān)鍵基礎(chǔ)，背后更體現(xiàn)出了全新的價值，可以從兩個方面來做觀察：

一方面，是為AI超大模型的訓練提供了堅實的技術(shù)支撐。隨著關(guān)鍵技術(shù)與基礎(chǔ)理論不斷突破，大算力、大數(shù)據(jù)、大模型將成為未來AI發(fā)展的重點發(fā)展方向，由此帶動自然語言處理、翻譯模型、生成算法和數(shù)據(jù)集等細分要素持續(xù)提升，推動產(chǎn)出的內(nèi)容細節(jié)、類型更豐富、質(zhì)量更高。

這背后顯然離不開強大的算力和網(wǎng)絡(luò)的支撐。而新華三打造的智算基礎(chǔ)架構(gòu)，基于新華三長期在ICT基礎(chǔ)設(shè)施領(lǐng)域的沉淀，充分融合了其在計算、存儲和網(wǎng)絡(luò)等領(lǐng)域的優(yōu)勢，就切實地為超大模型訓練提供了技術(shù)支撐。

在此基礎(chǔ)上，新華三還積極堅持前沿技術(shù)創(chuàng)新，其中全面支持在網(wǎng)計算的H3C P4可編程交換機，就能夠支持Pytorch框架和DPDK UDP、RoCE通信方式，將數(shù)據(jù)需求聚合統(tǒng)一操作，優(yōu)化通信網(wǎng)絡(luò)擁堵，減少主機的數(shù)據(jù)處理量。據(jù)新華三內(nèi)部實驗室測算，使用H3C P4可編程交換機加速數(shù)據(jù)并行訓練，模型訓練精度不受影響，計算節(jié)點間通信數(shù)據(jù)量平均減少30%，最多可以減少48%的訓練時間，可大幅提升分布式集群的整體訓練效率，創(chuàng)造更加出色的應用價值?？梢哉f在產(chǎn)品、技術(shù)和方案上的領(lǐng)先性，是新華三差異化的優(yōu)勢所在，更是其能夠助力各類企業(yè)AIGC展開研發(fā)和推進的價值所在。

另一方面，新華三還正與產(chǎn)業(yè)各方積極合作，探索新范式和新路徑，推動普惠算力更為廣泛地落地，使能百行百業(yè)的智能化升級，共同推進中國人工智能產(chǎn)業(yè)的發(fā)展。

這方面，新華三率先成為百度文心一言首批生態(tài)合作伙伴就是具體的印證。眾所周知，今天AI正在極大改變?nèi)藗兊纳罘绞?，目前也正在開始加速滲透到企業(yè)的研發(fā)設(shè)計、生產(chǎn)制造、供應鏈管理、客戶服務等各個環(huán)節(jié)，深刻改變著人們的生產(chǎn)方式。

因此，以提升效率和優(yōu)化配置為核心主題的AI應用和創(chuàng)新，是數(shù)字經(jīng)濟深化發(fā)展的全新階段，更是傳統(tǒng)產(chǎn)業(yè)轉(zhuǎn)型升級的必然要求。在這種大背景下，新華三和包括百度在內(nèi)的產(chǎn)業(yè)合作伙伴通力合作，并通過旗下豐富的產(chǎn)品和解決方案為百行百業(yè)的用戶注入云原生及人工智能技術(shù)，也能加速整個行業(yè)的智能化升級，釋放智能化生產(chǎn)力“乘數(shù)效應”。

總的來說，中國產(chǎn)業(yè)智能化的轉(zhuǎn)型升級，中國數(shù)字經(jīng)濟的落地和發(fā)展，任重而道遠。在此過程中，新華三以全新的智算架構(gòu)支撐超大模型訓練，并與產(chǎn)業(yè)合作伙伴深度合作，讓AIGC這樣的新技術(shù)能夠加速行業(yè)落地的步伐，而這種創(chuàng)新力、前瞻力和爆發(fā)力，相信也將能夠推動中國的人工智能產(chǎn)業(yè)呈現(xiàn)出“百花齊放”的狀態(tài)，更能夠提速整個行業(yè)智能化時代的到來，這不僅是未來的趨勢所在，也是新華三不斷創(chuàng)新與突破的重要體現(xiàn)。

標簽：人工智能新華三 AICG ChatGPT

《科技觀察》146：搶先入局AIGC，新華三底層能力何在？的評論 (共條)

愛情散文傷感散文哲理散文優(yōu)美生活隨筆親情唯美句子傷感的句子現(xiàn)代詩歌空間日志經(jīng)典語句愛情句子作文大全

最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

《科技觀察》146：搶先入局AIGC，新華三底層能力何在？

《科技觀察》146：搶先入局AIGC，新華三底層能力何在？的評論 (共條)

你可能也喜歡這些文章

最新發(fā)布的文章

最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

《科技觀察》146：搶先入局AIGC，新華三底層能力何在？

本文作者的其他文章

《科技觀察》146：搶先入局AIGC，新華三底層能力何在？的評論 (共 條)

你可能也喜歡這些文章

最新發(fā)布的文章

《科技觀察》146：搶先入局AIGC，新華三底層能力何在？

《科技觀察》146：搶先入局AIGC，新華三底層能力何在？的評論 (共條)