華為云GaussDB,能否成為數據庫國產化替代的更優(yōu)選擇?
沒有一個行業(yè)比數據庫更需要長期主義,而在踐行長期主義的道路上,國內數據庫廠商中華為是不可忽視的存在。
近日,Gartner Peer Insights《Voice of the Customer for Cloud Database Management Systems,2023》報告發(fā)布,顯示華為云成為全球唯一獲得云數據庫管理系統(tǒng)“客戶之選”的云廠商,客戶滿意和推薦度高達98%。

而此前,在2023年華為全球智慧金融峰會上,華為云正式發(fā)布全新一代分布式數據庫GaussDB,軟硬協(xié)同、全棧自主,交出了公司研發(fā)數據庫二十年來的答卷。
縱觀國內外數據庫發(fā)展史,做好數據庫的確并非易事,不僅需要強勁的技術實力,還需要構建完善的商業(yè)生態(tài)。而且相對于前者,后者可能才是相關廠商成功的關鍵所在。
從商業(yè)替代的角度看,相比甲骨文等在數據庫領域積累超過45年的企業(yè),國內數據庫廠商雖然已經付出巨大的時間成本和資金投入,但似乎仍處于一個追趕階段。
而華為云持續(xù)深耕數據庫領域,并成為“客戶之選”,是否意味著真正的國產化替代已經來到?

圖片來源:網絡
數據庫60年,向商業(yè)繁榮而生
芯片、操作系統(tǒng)和數據庫并稱為科技領域的三大基礎設施。
相比前兩者,數據庫并不是日常新聞中的“主角”。但事實上,幾乎所有的商業(yè)系統(tǒng)都需要數據庫來進行組織、儲存、管理與調用。因此,數據庫也被稱為“基礎軟件皇冠上的明珠”。
1964年,通用電氣公司開發(fā)出了世界上第一個數據庫系統(tǒng)——IDS。自此之后的60年,美國開啟了一輪又一輪的數據庫技術浪潮。直至今日,美國依然在數據庫行業(yè)占據領先地位。
而為了增強競爭力,擺脫對國外技術和產品的依賴性,國內數據庫廠商也在持續(xù)推進數據庫研發(fā),以盡早實現國產化替代。在2009年,阿里巴巴就率先提出“去IOE”的概念。所謂“去IOE”,是指在IT基礎架構中排除IBM的小型機、Oracle數據庫和EMC高端存儲,代之在開源軟件基礎上開發(fā)的系統(tǒng)。
然而,十多年過去了,國產數據庫依然沒有占據主導地位。根據公開數據顯示,國外廠商仍然占據中國數據庫市場份額超50%,微軟、亞馬遜、甲骨文這幾家巨頭的地位難以動搖。
技術實力不足可能是一方面的原因。根據信通院發(fā)布的數據顯示,截至2022年6月,全球數據庫企業(yè)為363家,其中美國145家、中國116家。在中國的這些企業(yè)中,只有3家企業(yè)的規(guī)模達到了千人以上,而甲骨文等美國數據庫廠商的規(guī)模已達數萬人,反映出較大的人才儲備差距。
另據公開資料顯示,美國開源和商業(yè)數據庫的占比為48%和52%,我國為83.4%和16.6%,可以看出,國內數據庫主要基于開源技術開發(fā),自主研發(fā)較少,技術方面有較大提升空間。
而相比技術優(yōu)勢,國外廠商數據庫生態(tài)的商業(yè)優(yōu)勢可能更難超越。比如,占據市場主要份額的甲骨文早早完成了自身的數據庫生態(tài)建設。2009年,甲骨文推出合作伙伴計劃(OPN),在全球的合作伙伴早已突破2.5萬家。

圖片來源:甲骨文,OPN官方網站
這也意味著,第三方產品及服務基本可以解決絕大多數甲骨文數據庫的異常問題。對比來看,目前國內不少數據庫軟件仍然依賴原廠商的技術支持,難以形成完整的商業(yè)生態(tài),這也成為實現國產化替代道路上的一大阻力。
但國產數據庫并非完全沒有機會。當遷移收益遠遠大于遷移成本,產品替代就會自然而然地發(fā)生。
2012年,亞馬遜從自身業(yè)務的實際需求出發(fā),推出分布式存儲系統(tǒng)DynamoDB。在這之后,分布式云數據庫開始飛速發(fā)展,不斷搶占傳統(tǒng)數據庫的重要陣地。傳統(tǒng)數據庫看似固若金湯的“馬奇諾防線”,正在遭遇分布式云數據庫的“閃電戰(zhàn)”。

資料來源:Gartner《云數據庫管理系統(tǒng)魔力象限》
亞馬遜的DynamoDB為什么能獲得成功,并迅速成為數據庫行業(yè)的領導者?這主要歸功于電子商務這一全新的商業(yè)場景。在該商業(yè)場景下,亞馬遜的DynamoDB體現出極強的遷移收益,因此越來越多的企業(yè)選擇了“亞馬遜方案”。
可以這樣理解,更高的遷移收益實際上來源于商業(yè)場景的進化。縱觀整個數據庫的歷史,通用電氣、IBM、霍尼韋爾、亞馬遜、阿里巴巴等企業(yè)都因為新的商業(yè)場景而進一步發(fā)展了數據庫技術。
而對于華為等數據庫廠商而言,想要自身的技術路線得到認可,就必須找到面向未來的新商業(yè)圖景。這個新商業(yè)圖景包括更前沿的技術概念、更優(yōu)秀的性能處理以及更完善的商業(yè)生態(tài)。
GaussDB 20年,從技術可行到生態(tài)建設
2001年,為了支持自身的電信業(yè)務,華為開始研發(fā)數據存儲組件DopraDB。十年后,華為成立Gauss實驗室,DopraDB也成為GaussDB的GMDB V1系列產品。而后,再走過十年左右的時間,如今GaussDB已經完成了華為內部600多套數據庫的全面替換,累計建設超過6000個分布式數據庫節(jié)點,承載數據量高達6PB,并借此次發(fā)布會的機會,成功從幕后走到了臺前。
走到臺前的路途多少有些艱難,打造技術優(yōu)勢只是萬里長征的第一步。
所謂打造技術優(yōu)勢,本質上可以拆解成兩件事:提高數據庫性能和保障數據庫安全。作為國內唯一同時做到軟硬協(xié)同、全棧創(chuàng)新的自研數據庫,GaussDB在性能和安全上都實現了新的突破。
比如,性能方面,在招商銀行的實際應用中,GaussDB的抖動率比其他廠商減少了85.6%;在與郵儲銀行的合作中,郵儲銀行向華為開放了6.5億用戶用于建設分布式新核心系統(tǒng),和原有的系統(tǒng)相比,GaussDB的效率提升了40%。而故障處理方面,2023年,GaussDB在工行核心信貸系統(tǒng)中,上線了同城雙集群RPO=0方案。與原先甲骨文數據庫雙集群方案需15-30分鐘進行故障修復相比,GaussDB僅需2分鐘。

資料來源:華為云GaussDB發(fā)布會
然而在數據庫領域,技術領先并不代表商業(yè)成功。可以這么說,技術優(yōu)勢是商業(yè)成功的下限,生態(tài)建設是商業(yè)成功的上限,也是國內數據庫廠商急需突破的枷鎖。而在構建商業(yè)生態(tài)的過程中,確定好從什么行業(yè)入手至關重要。
從當前情況來看,金融行業(yè)已成為國內數據庫廠商瞄準的一大領域。
對比其他行業(yè),金融行業(yè)具有數據量大、性能要求高、故障容忍度低的特點。同時,該行業(yè)對數據庫國產化替代的需求也極為旺盛。從2022年國產數據庫的中標信息看,46%的采購單位集中在金融行業(yè),其次是政府。因此,金融行業(yè)可以說是一片挖掘商業(yè)價值的“廣闊天地”,能啃下這塊“硬骨頭”的數據庫廠商,在面對其他商業(yè)應用時也會更加游刃有余。
基于此,和OceanBase、騰訊TDSQL一樣,GaussDB將金融場景作為重點發(fā)力的商業(yè)應用。目前,GaussDB已廣泛應用于金融行業(yè),助力中國建設銀行、中國農業(yè)銀行等國有大行的核心業(yè)務運轉。
但只有金融場景是遠遠不夠的,想要深入更多商業(yè)場景,數據庫廠商必須和獨立軟件開發(fā)商建立聯(lián)系,形成連接上下游的全面產業(yè)協(xié)同。如果商業(yè)應用的目標是解決特定行業(yè)的特定問題,那么產業(yè)協(xié)同的終極就是建立更普適的系統(tǒng)方案。
面對甲骨文等領先者的先發(fā)優(yōu)勢,開源也許是后來者整合產業(yè)資源最重要的工具。從2022年開始,國產數據庫廠商開始陸續(xù)推出自家的開源產品,例如阿里云Polar-X的開源項目X-Paxos、螞蟻集團CeresDB的開源項目CeresDB 0.2.0、華為云GaussDB的開源項目OpenGemini等。
不過,開源是一種相對被動的產業(yè)協(xié)同,更主動的辦法是與上下游建立合作關系。由于數據庫軟件并不是一個孤立的系統(tǒng),其中包含數據庫遷移、備份恢復、容災、一站式運維、數據庫咨詢服務、數據庫培訓等解決方案,因此近年來相關廠商都在謀求更多合作機會,以打通商業(yè)鏈條各環(huán)節(jié)。
比如,從阿里獨立出去的OceanBase陸續(xù)與基礎硬件廠商、軟件服務廠商等建立產品適配認證體系,而華為也攜手17家軟件伙伴企業(yè)、7家服務伙伴企業(yè),共同啟動了GaussDB數據庫金融行業(yè)生態(tài)發(fā)展計劃。
但正如前文所說,生態(tài)建設成功的標志是遷移收益高于遷移成本。就這一點而言,華為能再現亞馬遜DynamoDB的成功嗎?結合產品功能和行業(yè)需求來看,還是存在一定的可能性。
據了解,華為云GaussDB具有易部署、易遷移的特性,可以實現存儲成本下降50%,整體資源利用率提升4倍以上,同時通過提供結構+數據一站式遷移解決方案,最大程度滿足相關行業(yè)的需求,并有望借助應用模式復制,走向更多場景。
當然,華為云GaussDB問世不等于數據庫的國產化替代已經完成。需要看到,國內數據庫廠商所面對的是一片“藍?!薄?018年,“信創(chuàng)”被納入國家戰(zhàn)略,并提出了“2+8+N”的發(fā)展體系。其中,“N”是指國內市場的千行百業(yè)。另外,數據顯示,預計到2025年,我國數據庫市場規(guī)模將達688億元,CAGR為23.4%。

在這種背景下,華為云GaussDB的發(fā)布自然不會是國產數據庫的終局,而可能是一個嶄新的開端。未來,隨著國產化替代的深入,國產數據庫將有機會在更多行業(yè)中發(fā)揮價值。
作者:添澤Tyler
來源:松果財經