《科技觀察》159:堅(jiān)持科技創(chuàng)新,天翼云鑄牢數(shù)字中國關(guān)鍵底座
毫無疑問,今天“算力就是生產(chǎn)力”已成為業(yè)界共識,特別是算力作為數(shù)字經(jīng)濟(jì)時(shí)代的關(guān)鍵生產(chǎn)力要素,已成為了挖掘數(shù)據(jù)要素價(jià)值,推動數(shù)字經(jīng)濟(jì)發(fā)展的核心支撐力和驅(qū)動力。
但也要看到,隨著數(shù)據(jù)空前地增長和擴(kuò)張,加上企業(yè)關(guān)鍵工作負(fù)載所處的環(huán)境正在發(fā)生著“翻天覆地”的巨大變化,整個社會對算力需求呈現(xiàn)出多樣化的趨勢,如何破解不同應(yīng)用需求和不同應(yīng)用場景下的算力挑戰(zhàn),不僅是“當(dāng)務(wù)之急”,更是“刻不容緩”。

在近期舉辦的首屆企業(yè)上云暨算云融合產(chǎn)業(yè)大會上,天翼云就帶來了智算超算一體化解決方案,該方案依托分布式架構(gòu)的云底座和海量的計(jì)算、存儲、網(wǎng)絡(luò)資源,融合智算、超算多樣化算力服務(wù),能夠?yàn)榇竽P陀?xùn)練、汽車碰撞、流體動力學(xué)、無人駕駛、生命科學(xué)等場景提供軟硬全棧解決方案。
而這僅僅是天翼云一直以來堅(jiān)持科技創(chuàng)新的一個“縮影”。作為數(shù)字中國建設(shè)主力軍和云服務(wù)國家隊(duì),天翼云始終以核心技術(shù)自主可控為本,打造全棧云產(chǎn)品體系,同時(shí)在操作系統(tǒng)、可信云、云數(shù)據(jù)庫、云原生安全產(chǎn)品、AI等領(lǐng)域積極布局和深耕,不但走出了一條科技創(chuàng)新的成長路徑,同時(shí)也更好地賦能了千行百業(yè)的數(shù)字化轉(zhuǎn)型。
算力進(jìn)化趨勢
目前,國家對數(shù)字經(jīng)濟(jì)給予了前所未有的高度重視。這也意味著一個以數(shù)據(jù)為中心的全新算力時(shí)代的到來,特別是隨著“新基建”的提速和“東數(shù)西算”工程的啟動,如今無論是產(chǎn)業(yè)變革還是技術(shù)迭代都在以驚人的速度向前演進(jìn),同時(shí)也讓算力加速“進(jìn)化”,具體來看:

一是異構(gòu)算力多元化。主要表現(xiàn)在目前傳統(tǒng)數(shù)據(jù)中心在面對各種業(yè)務(wù)應(yīng)用創(chuàng)新時(shí),往往需要不同的算力支撐。因此,如何通過異構(gòu)的方式提升服務(wù)器的系統(tǒng)級性能,用異構(gòu)的算力資源應(yīng)對不同的計(jì)算需求,已成為業(yè)內(nèi)的共同課題。
二是算力統(tǒng)一云化。隨著云計(jì)算技術(shù)的飛速發(fā)展,傳統(tǒng)數(shù)據(jù)中心目前也正在快速向云化數(shù)據(jù)中心轉(zhuǎn)型,算力更多地以云的方式供給出來,云計(jì)算既豐富了算力的供給方式,實(shí)現(xiàn)了算力的橫向切片,同時(shí)結(jié)合云計(jì)算的云化獲取以及彈性的能力,可以進(jìn)一步提升算力的使用效能。此外,云計(jì)算也能賦予算力更多的層次,讓算力形式更加多元,更加豐富。
三是智算和超算融合化。眾所周知,AI發(fā)展帶來了更多的計(jì)算類型,如AI推理、AI訓(xùn)練、大數(shù)據(jù)等都需要不同的計(jì)算類型,同時(shí)芯片種類繁多,數(shù)據(jù)量級也不斷提升。此外,算法模型需求的指數(shù)級增長也在不斷挑戰(zhàn)算力極限,數(shù)據(jù)和模型的巨量化也在加速算力的龐大需求,刺激了高并發(fā)存儲資源池和巨量算力的融合,而超算中心則能夠提供充足的算力支撐,因此智算和超算(AI+HPC)的融合化也成為新的趨勢。
不難看出,異構(gòu)算力多元化、算力統(tǒng)一云化以及智算和超算融合化,讓整個算力產(chǎn)業(yè)發(fā)展步入了一個全新的階段,而這也倒逼著整個算力體系要隨之進(jìn)化與演進(jìn),由此才能在企業(yè)的數(shù)字化轉(zhuǎn)型以及國家數(shù)字經(jīng)濟(jì)的發(fā)展中提供新的支撐力和驅(qū)動力。
加速算力普惠
也正是洞察到這種全新的變化趨勢,天翼云率先在業(yè)界發(fā)布了天翼云智算超算一體化解決方案(智算超算云平臺),這是集云、超、智一體的高性能算力服務(wù)平臺和方案,具有以下幾個方面的優(yōu)勢:
首先,構(gòu)建了“面向AI與HPC”的高性能基礎(chǔ)設(shè)施。方案中的“智能超算專屬池”能夠提供AI訓(xùn)練、HPC科學(xué)計(jì)算所需要的高性能算力服務(wù)。對于高性能算力需求的用戶,僅需要對計(jì)算、存儲等資源“按需付費(fèi)”,即可使用高擴(kuò)展性、高性能、強(qiáng)隔離的專屬基礎(chǔ)設(shè)施環(huán)境。
其次,方案還提供“AI+HPC”融合服務(wù)能力,作為智算超算云平臺,該平臺同時(shí)具有“智算AI服務(wù)能力”和“超算HPC服務(wù)能力”。其中,智算AI服務(wù)能力方面,方案既實(shí)現(xiàn)了算力資源彈性管理,又提供了集“訓(xùn)練、推理”為一體的AI賦能平臺,實(shí)現(xiàn)“一站式”的AI能力全流程服務(wù);而超算HPC平臺能力方面,方案也從基礎(chǔ)設(shè)施層、HPC調(diào)度層、行業(yè)應(yīng)用層不斷優(yōu)化服務(wù)能力,構(gòu)建出了具有超高性能、超大規(guī)模、且能夠適配不同行業(yè)需求的超算底座。
最后,天翼云自研的“算力調(diào)度系統(tǒng)”還能提供統(tǒng)一調(diào)度的能力,能夠?qū)崿F(xiàn)云上云下多算力數(shù)據(jù)中心的統(tǒng)一管理調(diào)度,包括AI任務(wù)調(diào)度、異構(gòu)算力調(diào)度、同時(shí)也支持近萬億級參數(shù)模型訓(xùn)練規(guī)模、3D并行分布式訓(xùn)練、推理加速引擎、數(shù)據(jù)加速等算力賦能調(diào)度能力,大大提升訓(xùn)練速度和推理效率。
也正因此,天翼云智算超算一體化解決方案能夠?qū)⒍鄻踊乃懔Y源實(shí)現(xiàn)生產(chǎn)、聚合、調(diào)度和釋放,最大化支撐產(chǎn)業(yè)的創(chuàng)新聚集。
以自動駕駛場景為例,天翼云智算超算一體化解決方案能為用戶提供全流程的服務(wù),完成“數(shù)據(jù)入云、數(shù)據(jù)存儲、數(shù)據(jù)標(biāo)注和處理、模型訓(xùn)練、驗(yàn)證仿真”等工作,滿足自動駕駛這類HPDA應(yīng)用中所需要的高性能和可擴(kuò)展的混合負(fù)載需求,同時(shí)方案中提供的“AI訓(xùn)練和AI推理”等服務(wù)也進(jìn)一步提升了用戶的自動駕駛研發(fā)效率,為自動駕駛提供了更為強(qiáng)大的技術(shù)能力。
由此可見,天翼云智算超算一體化解決方案真正滿足了更多應(yīng)用場景、更多元算力的需求,并以靈活、高性能的算力服務(wù)優(yōu)勢,加速算力實(shí)現(xiàn)“普惠”,更好地為千行百業(yè)的智能化轉(zhuǎn)型和升級創(chuàng)造出更多具有想象空間的新業(yè)態(tài)、新服務(wù)和新模式,并為人工智能“走深向?qū)崱钡於ɑA(chǔ)。
堅(jiān)持科技創(chuàng)新
事實(shí)上,天翼云過去多年來始終堅(jiān)持走科技創(chuàng)新之路,在自研產(chǎn)品能力和資源布局多方面發(fā)力,積極服務(wù)于國家戰(zhàn)略,賦能千行百業(yè)數(shù)字化轉(zhuǎn)型,推進(jìn)數(shù)字中國的建設(shè)。

第一,在全棧云方面,中國電信自2009年就開啟了“天翼云發(fā)展戰(zhàn)略”,在2018又從云網(wǎng)架構(gòu)、運(yùn)營模式等方面全面轉(zhuǎn)型,在2021年底推出天翼云4.0分布式云架構(gòu)。在此基礎(chǔ)上,天翼云在去年年底又進(jìn)一步推出混合云一體機(jī)iStack、裸金屬專屬云、SD-WAN尊享版網(wǎng)絡(luò)、云電腦、“息壤”、全新CDN產(chǎn)品及邊緣云安全底座等產(chǎn)品,在云計(jì)算布局上更進(jìn)一步。
第二,在操作系統(tǒng)方面,天翼云操作系統(tǒng)TeleCloudOS4.0 目前已實(shí)現(xiàn)從千臺到數(shù)萬臺服務(wù)器管理調(diào)度的能力跨越,彈性計(jì)算單集群支持虛機(jī)50萬臺,存儲支持百萬級IOPS,亞毫秒級的IO延遲,支持8大主流芯片和2大國產(chǎn)操作系統(tǒng)。此外,云服務(wù)器操作系統(tǒng)天翼云CTyunOS,也提供一云多芯服務(wù),通過CPU調(diào)度、內(nèi)存、網(wǎng)絡(luò)等多方面深度優(yōu)化,顯著提高了宿主服務(wù)器的性能與可靠性。
第三,在可信云方面,去年年底,天翼云也率先順利通過《混合云超融合平臺能力要求》《混合云應(yīng)用場景能力要求 第2部分:負(fù)載調(diào)度》《混合云應(yīng)用場景能力要求 第3部分:容災(zāi)備份》三項(xiàng)首批評估,成為業(yè)內(nèi)首家通過此三項(xiàng)評估的云服務(wù)商。而今年1月,天翼云全?;旌显聘樌ㄟ^商用密碼應(yīng)用安全性評估,這也標(biāo)志著天翼云全?;旌显泼艽a安全能力達(dá)到業(yè)內(nèi)領(lǐng)先水平,能夠?yàn)橛脩舫掷m(xù)提供合規(guī)、安全等能力和保障。
第四,在前沿技術(shù)創(chuàng)新方面,天翼云也推出了云原生數(shù)據(jù)庫TeleDB、云原生安全等產(chǎn)品,并積極布局AI領(lǐng)域。其中,天翼云自研的TeleDB數(shù)據(jù)庫歷經(jīng)“十年磨煉”,能夠支持千萬級并發(fā)和PB級數(shù)據(jù)處理,實(shí)現(xiàn)HTAP事務(wù)的一站式處理,目前TeleDB在電信系統(tǒng)上,穩(wěn)定承載著十億級用戶和千億級話單規(guī)模的高并發(fā)業(yè)務(wù)。
不僅如此,在云原生安全產(chǎn)品方面,天翼云也創(chuàng)新突破云原生安全關(guān)鍵技術(shù),打造了“紅盾”系列安全產(chǎn)品,以一體化云安全可信運(yùn)營體系和零信任架構(gòu),構(gòu)建了安全核心能力自主可控的技術(shù)壁壘;而在AI方面,為了適應(yīng)市場智能算力的快速增長,天翼云也聚焦人工智能場景創(chuàng)新,以普惠智能算力為基礎(chǔ),廣泛支持大模型訓(xùn)練、智能推薦、無人駕駛、生命科學(xué)、NLP等業(yè)務(wù)場景。
總的來說,今天,算力的重要性已被提升到了一個全新的高度,而在此過程中,天翼云始終堅(jiān)持科技創(chuàng)新,并“以行踐言”加速算力普惠,由此不僅成為了驅(qū)動中國數(shù)字經(jīng)濟(jì)高質(zhì)量發(fā)展的重要力量,同時(shí)也更好地鑄牢了“數(shù)字中國”的關(guān)鍵底座,其價(jià)值也可謂“不止于現(xiàn)在,更關(guān)乎未來?!?/p>