《科技觀察》180:華為云GaussDB:共建繁榮數(shù)據(jù)庫生態(tài),推動數(shù)據(jù)庫產(chǎn)業(yè)變革創(chuàng)新
當前數(shù)字化浪潮席卷現(xiàn)代社會的每一個角落,以數(shù)據(jù)作為關鍵生產(chǎn)要素的數(shù)字經(jīng)濟時代,數(shù)據(jù)庫技術(shù)不僅成為數(shù)字產(chǎn)業(yè)化的核心關鍵技術(shù),同時也構(gòu)成了新型基礎設施建設的堅實底座。同時,作為企業(yè)的核心系統(tǒng)之一,數(shù)據(jù)庫也是企業(yè)級用戶交易數(shù)據(jù)、客戶信息、存貨庫存等海量數(shù)據(jù)的載體,可以說數(shù)據(jù)庫產(chǎn)業(yè)發(fā)展的成敗事關國家的戰(zhàn)略全局。
但也要看到,在中國科技產(chǎn)業(yè)的發(fā)展過程中,基礎軟件領域一直是一大“短板”,特別是在高端數(shù)據(jù)庫市場,由于起步較晚,導致這個市場一直以來都被國外品牌所“壟斷”,因此業(yè)界也就有了“撼山易,撼O難”的戲稱。

這種被動的局面即將被改寫——6月7日,在華為全球智慧金融峰會2023上,華為常務董事、華為云CEO張平安正式發(fā)布了新一代分布式數(shù)據(jù)庫GaussDB,其具備高可用、高安全、高性能、高彈性、高智能以及易部署、易遷移特性,并且經(jīng)歷了全球最大銀行核心系統(tǒng)的苛刻驗證,這也標志著在基礎軟件領域,源自中國本土市場公司自主創(chuàng)新的分布式數(shù)據(jù)庫無論是其技術(shù)領先性,還是在市場實踐和驗證方面都走到了全球的前列。
正如張平安所言:“我們希望通過攻堅克難,哪怕這個市場只是數(shù)據(jù)庫產(chǎn)業(yè)中‘塔尖’上的一點點,華為也愿意堅定的投入,這是GaussDB的定位,同時通過持續(xù)的創(chuàng)新,GaussDB能夠給世界一個更優(yōu)選擇?!?/p>
毫無疑問,給世界一個更優(yōu)選擇,同樣也是這個時代的必然選擇,背后不僅是相比傳統(tǒng)的集中式數(shù)據(jù)庫,分布式數(shù)據(jù)庫的優(yōu)勢盡顯;更重要的底氣則是源于GaussDB的技術(shù)優(yōu)勢讓其具備了更為強大的競爭力,因此有信心在未來能夠在世界范圍內(nèi)參與數(shù)據(jù)庫市場的“角逐”,而這也正是GaussDB引領時代,更創(chuàng)造時代的真實寫照。
國產(chǎn)數(shù)據(jù)庫邁入新階段
作為新一代分布式云數(shù)據(jù)庫,GaussDB通過多維度的技術(shù)創(chuàng)新,在行業(yè)實踐中構(gòu)筑了高可用、高安全、高性能、高彈性、高智能的技術(shù)優(yōu)勢,而在數(shù)據(jù)庫替換場景中,又具備易部署、易遷移的特性,客觀說GaussDB能夠?qū)崿F(xiàn)這種技術(shù)突破性可謂“難能可靠”,也在中國數(shù)據(jù)庫發(fā)展歷程中留下了“濃墨重彩”的一筆。
為什么這么說呢?背后的原因在于,目前國內(nèi)數(shù)據(jù)庫市場其實主要可以劃分為“存量替換”和“增量市場”兩個部分,其中,“增量市場”主要以開源語法兼容為主,絕大部分業(yè)務邏輯在應用中實現(xiàn),對數(shù)據(jù)庫能力要求相對較低,很多開源數(shù)據(jù)庫產(chǎn)品也能滿足。對數(shù)據(jù)庫廠商來說,增量市場研發(fā)投入相對較少,因此大部分新興分布式數(shù)據(jù)庫廠商都在追逐這個市場,這也過去幾年國內(nèi)數(shù)據(jù)庫市場“百花齊放”的底層邏輯。
而“存量替換”則是大多數(shù)國內(nèi)企業(yè),尤其是大型企業(yè)遇到的真正難題,因為絕大部分大型企業(yè)的核心業(yè)務系統(tǒng)都運行在功能強大的集中式商業(yè)數(shù)據(jù)庫上,目前面臨著原有數(shù)據(jù)庫系統(tǒng)無法升級的困境,存在License過期的風險,而數(shù)據(jù)庫這種關鍵系統(tǒng)要進行重構(gòu)又存在成本高、風險大的問題,再加上集中式商業(yè)數(shù)據(jù)庫發(fā)展時間長,功能靈活、語法支持多等,都對分布式云數(shù)據(jù)庫的兼容能力設計提出了極大的挑戰(zhàn)。
以金融行業(yè)為例,金融業(yè)本身就是數(shù)據(jù)密集型行業(yè),同時隨著過去幾年移動互聯(lián)網(wǎng)和電子支付的蓬勃發(fā)展對金融系統(tǒng)能力帶來全新的挑戰(zhàn)。最為典型的是,是金融行業(yè)的數(shù)據(jù)量急劇增長,對數(shù)據(jù)存儲和管理提出了更高要求,同時面臨高并發(fā)業(yè)務和大用戶量帶來的系統(tǒng)壓力,這就要求移動應用響應速度更快。但目前我國絕大部分金融核心還運行在大型機系統(tǒng)上,而且往往也都采用集中式商業(yè)數(shù)據(jù)庫,因此要通過分布式云數(shù)據(jù)庫實現(xiàn)替換升級,可謂是“牽一發(fā)而動全身”。
這個過程中主要面臨的難題可以從幾個維度來看,首當其沖的是分布式事務的一致性保證,也就是高可用性,對于單機較容易實現(xiàn)的ACID,分布式環(huán)境中往往容易出現(xiàn)了更多的難題。這是分布式數(shù)據(jù)庫將需要處理的事務進行拆分,再部署到不同的服務器上進行處理,理想狀況下,整個過程需要全局一致性協(xié)議的保護,而分庫分表兩階段的方式在一些意外情況下容易出現(xiàn)問題。
在性能和可擴展性方面,當前各廠商在進行分布式改造時,很多分布式數(shù)據(jù)庫的架構(gòu)要么是對中間件負擔過重,可擴展性較差,要么是在多并發(fā)和低延時上還存在升級改造的空間等等。
此外,運維管理方面,相比傳統(tǒng)的集中式數(shù)據(jù)庫,分布式數(shù)據(jù)庫對運維也提出了更多的要求,例如,基于分布式數(shù)據(jù)庫分片特性,需要更準確地管理不同節(jié)點不同類型的數(shù)據(jù)表;基于分布式數(shù)據(jù)庫多節(jié)點特性,運維節(jié)點的數(shù)量也大幅增長;基于分布式數(shù)據(jù)庫架構(gòu)特性,運維過程中更加需要注意節(jié)點故障中留存的數(shù)據(jù)不一致問題。因此,這就需要數(shù)據(jù)庫廠商能夠提供全生命周期的運維管理工具,覆蓋遷移、開發(fā)、運維全流程等工具。
最為致命的還是數(shù)據(jù)庫的遷移,眾所周知將數(shù)據(jù)從傳統(tǒng)集中式數(shù)據(jù)庫遷移至分布式數(shù)據(jù)庫是一項復雜且龐大的工程。企業(yè)對于能否在不影響業(yè)務的條件下,實現(xiàn)安全的無損遷移,是至關重要的。同時,高度的商業(yè)數(shù)據(jù)庫兼容能力意味著大量的設計和研發(fā)工作,涉及產(chǎn)品整體架構(gòu)的多個方面,十分考驗廠商對底層數(shù)據(jù)庫代碼的理解和掌控能力。
由此可見,要在“存量替換”市場中贏得企業(yè)級客戶的認可和信賴,并非一日之功,而華為早在2001年就開始戰(zhàn)略投入數(shù)據(jù)庫,經(jīng)過20多年的技術(shù)積累,并融入華為長期以來對企業(yè)服務的質(zhì)量與可信規(guī)范,這也讓GaussDB不僅完全解決了大型企業(yè)客戶從集中式數(shù)據(jù)庫走向分布式數(shù)據(jù)中遭遇的“痛點”,撬開了過去難以撼動的“存量替換”市場。
也正因此,GaussDB的這種技術(shù)創(chuàng)新和突破真正讓國產(chǎn)數(shù)據(jù)庫邁入了一個新時代,可以說這不僅是GaussDB數(shù)據(jù)庫自己的勝利,也是其所代表的中國科技公司的勝利,更是中國在基礎軟件“根”技術(shù)領域?qū)崿F(xiàn)重大突破的勝利。

引領時代更創(chuàng)造時代
事實上,GaussDB之所以在中國的數(shù)據(jù)庫創(chuàng)新的歷程上具有重要的價值意義,關鍵在于其不僅打造了“五高兩易”的特點,同時其在實踐驗證和生態(tài)構(gòu)建方面也同樣取得了重要的突破和進展,這也讓GaussDB不僅引領了時代,更創(chuàng)造了時代。
首先,從技術(shù)創(chuàng)新角度看,從芯片、服務器、存儲、網(wǎng)絡,到操作系統(tǒng)、數(shù)據(jù)庫、編譯器和語言,GaussDB是當前國內(nèi)唯一能夠做到軟硬協(xié)同、全棧自主的數(shù)據(jù)庫,而這種全棧軟硬件“自研”,不僅造就了GaussDB的獨特優(yōu)勢,同時也打造出了“五高兩易”的特性。
所謂“五高兩易”指的是高可用方面,GaussDB創(chuàng)新了存算分離架構(gòu),采用華為云底座存儲硬件級、實時數(shù)據(jù)同步復制技術(shù),并結(jié)合分布式強一致算法,實現(xiàn)了分布式架構(gòu)下同城雙集群、雙活備份,可在突發(fā)狀況下確保數(shù)據(jù)零丟失(RPO=0)。同時,該架構(gòu)也可確保單集群的Bug風險半徑可控,各集群軟硬件可以分別獨立升級和修復;高安全方面,GaussDB作為業(yè)界首款純軟全密態(tài)數(shù)據(jù)庫,在安全上,GaussDB一直引領產(chǎn)業(yè)趨勢,國內(nèi)首個拿到國際CC EAL4+認證的數(shù)據(jù)庫,這是安全領域的最高認證。
此外,在高性能方面,GaussDB打造的Ustore存儲引擎,從數(shù)據(jù)庫自研內(nèi)核架構(gòu)實現(xiàn)創(chuàng)新,確保了數(shù)據(jù)庫高性能,極低抖動;高彈性方面,GaussDB基于原生分布式架構(gòu),能夠?qū)崿F(xiàn)云化彈性伸縮、秒級擴容,業(yè)務擴展不斷服;而高智能方面,指的是GaussDB在應用開發(fā)階段,提供SQL的全量全鏈路感知、分析及優(yōu)化能力,為客戶提供易用、高效的應用開發(fā)體驗;在運維階段,基于覆蓋全流程的監(jiān)控、智能化診斷能力,提供快速精準感知恢復的智能運維體驗。
而在易部署、易遷移方面,GaussDB則構(gòu)建了一站式的遷移自動化工具鏈,通過自動語法轉(zhuǎn)換工具UGO、數(shù)據(jù)遷移工具DRS、流量回放建模工具等,讓傳統(tǒng)數(shù)據(jù)庫更容易更平滑的遷移到GaussDB上,相比傳統(tǒng)作業(yè)模式,應用改造成本降低90%以上,這種一站式服務真正讓企業(yè)的數(shù)據(jù)庫替換工作實現(xiàn)了遷移無憂。
其次,從實踐驗證角度看,GaussDB不僅在華為內(nèi)部IT系統(tǒng)中歷經(jīng)考驗,同時在多個行業(yè)核心業(yè)務系統(tǒng)也得到了廣泛應用。以華為內(nèi)部IT系統(tǒng)為例,GaussDB已完成600多套數(shù)據(jù)庫的全面替換;在華為終端云,已建設6000多個分布式數(shù)據(jù)庫節(jié)點,承載高達6個PB數(shù)據(jù)。
在行業(yè)市場,華為與中國郵儲銀行合作,郵儲銀行向華為開放了6.5億用戶的銀行分布式新核心系統(tǒng)建設機會,其系統(tǒng)中即使用了GaussDB。目前,該系統(tǒng)已全面投產(chǎn)上線,可實現(xiàn)日均20億筆交易、峰值6.7萬筆/秒的能力,新系統(tǒng)效率平均提升40%。
數(shù)據(jù)顯示,目前GaussDB已廣泛應用于金融行業(yè),支撐了中國工商銀行、中國郵政儲蓄銀行、中國建設銀行、中國農(nóng)業(yè)銀行等國有大行的核心業(yè)務。此外,也服務了陜西省財政廳、中海油、國家管網(wǎng)、國網(wǎng)陜西電力、首都公路發(fā)展集團等關系到“國計民生”的關鍵行業(yè)。
最后,從生態(tài)構(gòu)建角度看,數(shù)據(jù)庫行業(yè)發(fā)展40多年來,比拼的不僅僅是技術(shù)創(chuàng)新能力,更是生態(tài)的競爭能力。在這方面,GaussDB持續(xù)擴大伙伴生態(tài)圈,已與上下游80+伙伴提供200有競爭力的聯(lián)合解決方案,涵蓋數(shù)據(jù)庫遷移、備份恢復、容災、一站式運維、數(shù)據(jù)庫咨詢服務、數(shù)據(jù)庫培訓等,也與行業(yè)內(nèi)知名伙伴公司建立面向客戶的應用系統(tǒng)。
回頭來看,正是GaussDB全棧軟硬件“自研”這種獨特優(yōu)勢,讓其無論是在兼容性適配還是產(chǎn)品能力的研發(fā)上能夠更勝一籌,加上實踐驗證和生態(tài)構(gòu)建方面的突破,也讓GaussDB在帶動中國數(shù)據(jù)庫乃至基礎軟件領域發(fā)展方面起到更大的作用。
共建繁榮的數(shù)據(jù)庫生態(tài)
面對世界百年未有之大變局,國家在“十四五”期間把科技創(chuàng)新擺在發(fā)展全局的核心位置,并提出要加快關鍵核心技術(shù)攻關,而GaussDB此時提出了“給世界一個更優(yōu)選擇”的新口號,在這背后不僅證明了GaussDB可以更好地服務好中國的企業(yè)客戶,也預示著GaussDB吹響了重構(gòu)數(shù)據(jù)庫市場格局的“新號角”,未來中國的數(shù)據(jù)庫廠商也能夠和世界頂級數(shù)據(jù)庫廠商同臺競技,“一決雌雄”。
一方面,從國產(chǎn)化“替代”視角看,在基礎軟件行業(yè),操作系統(tǒng)、數(shù)據(jù)庫是基礎軟件產(chǎn)業(yè)的核心控制點。數(shù)據(jù)庫更是被業(yè)界譽為“軟件皇冠上的明珠”,足以見其重要性和復雜性。因此,這些核心技術(shù)如果某個節(jié)點被“卡脖子”,可能就會影響整個國家的社會經(jīng)濟命脈。
而目前國內(nèi)很多金融機構(gòu)或者很多“國計民生”關鍵行業(yè)的數(shù)據(jù)庫系統(tǒng)仍然選用集中式數(shù)據(jù)庫,或者技術(shù)國外的技術(shù)平臺搭建,在當前復雜的環(huán)境下,供應鏈風險不可忽視,自主創(chuàng)新至關重要、迫在眉睫。
而GaussDB通過持續(xù)的技術(shù)創(chuàng)新,在很多關鍵業(yè)務場景中已能夠?qū)崿F(xiàn)“替代”甚至超越國外的產(chǎn)品,其價值不僅在于為關鍵行業(yè)的客戶的數(shù)字化轉(zhuǎn)型提供了一個安全可控的平臺選擇,更讓中國在數(shù)據(jù)領域領域的自主創(chuàng)新邁上了一個全新的高度。
另一方面,從全球競技的視角看,由于國內(nèi)龐大的人口基礎導致包括金融、電信等關系到“國計民生”的重點行業(yè),無論是其關鍵應用的規(guī)模還是其數(shù)據(jù)的體量都在全球領先,這都讓這些行業(yè)面臨“世界級”的數(shù)據(jù)處理壓力,而傳統(tǒng)數(shù)據(jù)庫的性能往往無法滿足這種規(guī)模的處理需求,因此也讓越來越多的行業(yè)用戶從集中式數(shù)據(jù)庫走向了分布式數(shù)據(jù)庫。不僅如此,在Gartner日前發(fā)布的《市場份額:2022年全球數(shù)據(jù)庫管理系統(tǒng)》中,基于分布式云構(gòu)建的數(shù)據(jù)庫廠商已經(jīng)占據(jù)了TOP10中的“半壁江山”,這也體現(xiàn)了未來走向分布式云數(shù)據(jù)庫已是行業(yè)大勢所趨。
而GaussDB更大的優(yōu)勢還在于,它不僅歷經(jīng)了眾多中國大型企業(yè)客戶的苛刻驗證,同時目前亞洲的很多銀行已經(jīng)開始選用和測試華為云GaussDB數(shù)據(jù)庫,在南美也有很多客戶開始測試??梢哉f,面向新時代,分布式云上的數(shù)據(jù)庫一定是一個更新的、更優(yōu)的選擇。同樣,GaussDB從中國的創(chuàng)新場景走向全球的客戶,也是這個時代必然的選擇。
當然,雖然中國數(shù)據(jù)庫產(chǎn)業(yè)迎來了巨大的市場發(fā)展空間,尤其是面向未來的云化、分布式等方向有很大的創(chuàng)新與領先機會,但同時也存在著一些現(xiàn)實的問題和挑戰(zhàn)。對此,張平安在本次大會上也提出了關于中國數(shù)據(jù)庫產(chǎn)業(yè)創(chuàng)新突破與健康良性發(fā)展五點建議,包括:聯(lián)合技術(shù)創(chuàng)新,實現(xiàn)數(shù)據(jù)庫核心技術(shù)的突破和創(chuàng)新超越;攻關典型場景,客戶開放更多場景,實戰(zhàn)中打磨可靠產(chǎn)品;優(yōu)化產(chǎn)業(yè)環(huán)境,打造健康的數(shù)據(jù)庫商業(yè)模式和產(chǎn)業(yè)環(huán)境;打造繁榮生態(tài),加速應用遷移,確保系統(tǒng)穩(wěn)定高效運行;培養(yǎng)關鍵人才,產(chǎn)教融合,保障開發(fā)者和創(chuàng)新人才供給。

與此同時,更為了更好的推動數(shù)據(jù)庫產(chǎn)業(yè)的繁榮發(fā)展,華為云GaussDB還與金融行業(yè)用戶、行業(yè)伙伴、產(chǎn)學研各界各方攜手合作,發(fā)起了三大產(chǎn)業(yè)行動。其中,生態(tài)合作方面,華為云攜手17家軟件伙伴企業(yè)、7家服務伙伴企業(yè),共同啟動了“GaussDB數(shù)據(jù)庫金融行業(yè)生態(tài)發(fā)展計劃”;產(chǎn)業(yè)合作方面,華為云聯(lián)合中國工商銀行、中國郵政儲蓄銀行、中國人保、華夏銀行、北京金融科技產(chǎn)業(yè)聯(lián)盟、新意科技、海量數(shù)據(jù)等15家產(chǎn)業(yè)伙伴共同發(fā)起“促進數(shù)據(jù)庫產(chǎn)業(yè)發(fā)展倡議”;下一代數(shù)據(jù)庫產(chǎn)業(yè)技術(shù)難題方面,華為云與包括清華大學、北京大學等11所高校的教授共同發(fā)起“數(shù)據(jù)庫產(chǎn)業(yè)技術(shù)難題揭榜”;此外,GaussDB持續(xù)重視人才培養(yǎng),通過產(chǎn)教融合等方式,培養(yǎng)未來數(shù)據(jù)庫產(chǎn)業(yè)人才,保障人才持續(xù)供給。
總的來說,無論是從短線看幫助中國關鍵行業(yè)客戶化解數(shù)字化轉(zhuǎn)型中的“挑戰(zhàn)”;中線看國內(nèi)數(shù)據(jù)庫行業(yè)堅持自主創(chuàng)新,實現(xiàn)國產(chǎn)化替代的必要性;以及長線看整個數(shù)據(jù)庫產(chǎn)業(yè)從集中是走向分布式云數(shù)據(jù)庫的發(fā)展趨勢,都需要更多的中國數(shù)據(jù)庫廠商有所作為和擔當,而歷經(jīng)二十年磨一劍打造的新一代分布式數(shù)據(jù)庫,具備“全棧全硬件自研”優(yōu)勢的GaussDB,通過與產(chǎn)業(yè)各方合作,共建繁榮的數(shù)據(jù)庫生態(tài),相信在未來可以更好地推動千行百業(yè)的數(shù)字化轉(zhuǎn)型,推動中國乃至全球數(shù)據(jù)庫產(chǎn)業(yè)的變革與創(chuàng)新。