沒有英偉達,華為盤古的底座依然穩(wěn)固。透過邏輯架構(gòu),徹底講清楚,為什么說華為...

iO500最新榜單,鵬程(上屆冠軍)是第二,第一是濟南超算,算力是第二名的15倍,真是做到了遙遙領(lǐng)先,再結(jié)合鵬程云腦三下半年的建設(shè)規(guī)劃,說是算力要達到鵬程二的16倍,還要用上華為新的AI芯片(劃重點,后文有出處),而這個16倍和15倍感覺差不了多少,所以感覺鵬程三并不是在吹牛,而是已經(jīng)有了16倍的底氣。
補充資料:
近日,存儲圈又有炸裂新消息。
高性能計算(HPC)領(lǐng)域最具影響力的IO500最新一期榜單公布,以華為OceanStor Pacific分布式存儲為核心底座的Cheeloo-1系統(tǒng)表現(xiàn)一騎絕塵,在最重要的10節(jié)點榜單中以創(chuàng)紀錄的13萬總得分位列第一,性能是上屆冠軍的15倍之多。
無疑,這份超高的存儲性能成績具有里程碑意義:不僅體現(xiàn)出華為OceanStor Pacific分布式存儲強大的產(chǎn)品力,更標志著分布式存儲在高性能計算領(lǐng)域的重要性愈發(fā)突出,甚至加速拉開了高性能計算向HPDA(High Performance Data Analytics,高性能數(shù)據(jù)分析)演進的序幕。
在本次IO500榜單中,以華為OceanStor Pacific分布式存儲為核心底座的Cheeloo-1系統(tǒng),搭載了全新研制的OceanFS2新一代并行文件系統(tǒng),真正打破了HPC在存儲層的關(guān)鍵性能瓶頸,在總體得分、帶寬性能、元數(shù)據(jù)性能等五個維度上的得分均遙遙領(lǐng)先,堪稱全能型的五邊形戰(zhàn)士。
在滿足HPC各項存儲需求的基礎(chǔ)上,華為OceanStor Pacific分布式存儲如何做到在綜合性能上比其他廠商快得多?這得益于華為在分布式存儲領(lǐng)域始終如一的研發(fā)創(chuàng)新,逐步在應(yīng)用、算法、網(wǎng)存和架構(gòu)四個層面,形成綜合優(yōu)勢。
出處:IO500官網(wǎng)
首先,在應(yīng)用層面,華為OceanStor Pacific分布式存儲打造了應(yīng)用感知的DataTurbo數(shù)據(jù)加速引擎,利用融合數(shù)據(jù)格式、近數(shù)據(jù)處理和特征處理算子卸載加速等創(chuàng)新技術(shù),實現(xiàn)了對各種HPDA 應(yīng)用的性能加強。
比如,針對HPDA中愈發(fā)密集、愈發(fā)不可或缺的大數(shù)據(jù)環(huán)節(jié),數(shù)據(jù)處理流程的各類ETL嚴重影響了數(shù)據(jù)處理效率,而OceanStor Pacific分布式存儲靈活對接各種大數(shù)據(jù)引擎的“基操”,實現(xiàn)了數(shù)據(jù)湖和數(shù)倉之間的數(shù)據(jù)共享,大幅減少了ETL的需求。
再例如,DataTurbo數(shù)據(jù)加速引擎在存儲側(cè)為計算引擎開啟緩存能力,通過自動緩存熱點數(shù)據(jù)進行預處理,并在多個計算集群之間共享緩存數(shù)據(jù),以削除計算側(cè)加載時的資源消耗和時延,實現(xiàn)效率60倍提升,讓數(shù)百PB數(shù)據(jù)查詢縮減至10秒。
其次,在算法層面,華為OceanStor Pacific分布式存儲采用業(yè)內(nèi)獨創(chuàng)的SmartBalance全均衡設(shè)計,實現(xiàn)數(shù)據(jù)類型和I/O流的智能感知,解決CPU算力不足或調(diào)用堆棧深度等軟件問題引起的IOPS瓶頸、HPC多流程跨系統(tǒng)的數(shù)據(jù)遷移、數(shù)據(jù)膨脹等難題。
比如,華為OceanStor Pacific的大小IO分流處理技術(shù),實現(xiàn)了在一套存儲中帶寬、IOPS和OPS性能全優(yōu),單節(jié)點性能達到了20GB/s的帶寬和20萬IOPS,是業(yè)界的最高水準。
此外,獨創(chuàng)的融合非結(jié)構(gòu)化元數(shù)據(jù)索引,實現(xiàn)文件、對象和大數(shù)據(jù)等原生多協(xié)議無損互通,一份數(shù)據(jù)多端調(diào)用。并且,針對數(shù)字化病理、衛(wèi)星遙感、基因測序等,華為采用智能感知語義格式、多模態(tài)聚合、智能分區(qū)編碼等技術(shù),進行場景化二次壓縮算法,將壓縮比例提高了30~80%。
華為的算法創(chuàng)新在真實HPC場景中有何價值?以其獨創(chuàng)的融合非結(jié)構(gòu)化元數(shù)據(jù)索引為例,在科學計算等典型的HPC場景中,創(chuàng)建數(shù)據(jù)集一直都是老大難的問題,動輒又數(shù)十TB的數(shù)據(jù)集,過去如果需要創(chuàng)建多個數(shù)據(jù)集,以滿足不同研發(fā)團隊的需求,往往需要通過數(shù)據(jù)復制的方式,效率極其低下;如今,利用融合非結(jié)構(gòu)化元數(shù)據(jù)索引,則不需要通過數(shù)據(jù)復制的方式,一份數(shù)據(jù)集能夠輕松被多端靈活調(diào)用。
第三,在網(wǎng)存層面,華為OceanStor Pacific通過自研的網(wǎng)絡(luò)芯片支持RoCE,以及RDMA和IP的訪問能力。在同時支持帶寬、IOPS等不同類型的業(yè)務(wù)時,可以智能調(diào)整網(wǎng)絡(luò)的相關(guān)參數(shù),提供更好的擁塞控制,從而大幅降低不同存儲節(jié)點間的數(shù)據(jù)交換時延。
最后,在架構(gòu)層面,華為OceanStor Pacific采用全對稱架構(gòu),實現(xiàn)了智能IO路徑與磁盤管理,以及極高的數(shù)據(jù)可靠性保護,大幅領(lǐng)先開源方案。眾所周知,Lustre等開源分布式存儲在HPC領(lǐng)域被多年應(yīng)用,但Lustre的非對稱架構(gòu)、IO路徑漫長、磁盤碎片化嚴重、無冗余保護等劣勢,在如今的HPC場景中逐漸凸顯,越來越多用戶開始轉(zhuǎn)向以華為OceanStor Pacific為代表的商用方案,從而在架構(gòu)、性能和可靠性方面獲得更好的保障。
鵬程三在這個????7分15秒【華為昇騰開發(fā)者峰會上 關(guān)于鵬城云腦三的進度。還有芯片 6g的信息-嗶哩嗶哩】 https://b23.tv/UUGgvdA