《科技觀察》086:OceanBase 4.0,單機與分布式的新拐點
眾所周知,“數字經濟”自5年前在政府工作報告中首次提及至今,已對中國的經濟運行方式產生了非常深遠的影響,更成為目前經濟高質量發(fā)展中的核心主線。
而作為數字經濟中的關鍵生產要素,數據的重要性也愈發(fā)突出。在此過程中,對千行百業(yè)的行業(yè)用戶而言,隨著業(yè)務和應用的不斷拓展和增加,其關鍵業(yè)務系統(tǒng)也在持續(xù)地產生出大量高價值密度的核心數據,而這些數據如何高安全、高性能、高穩(wěn)定的運行以及如何更好地挖掘出其背后的價值就變得至關重要。
也正因此,過去幾年分布式數據庫強勢崛起。IDC的數據顯示,目前約26.8%的企業(yè)級市場用戶部署了分布式數據庫,超過90%的企業(yè)認可分布式數據庫部署后的效果。其中,更有約66%的被訪企業(yè)看到數據庫系統(tǒng)性能的明顯改善,切實解決了數據庫企業(yè)級應用的痛點和難點。
但也要看到,在數據量持續(xù)高速增長的情況下,企業(yè)對分布式數據庫也提出了更高的要求,如數據存儲越來越多,對數據庫的性能也越來越高;企業(yè)在數據遷移過程中,也對分布式數據庫的兼容性提出了新目標,同樣安全合規(guī)對分布式數據庫庫的安全性更提出新要求;不僅如此,應用場景多樣化也需要分布式數據庫有更強的適應能力等等。

8月10日,在2022 OceanBase年度發(fā)布會上,版本代號為“小魚”的OceanBase4.0正式發(fā)布,這是業(yè)內首個單機分布式一體化數據庫,它實現了單機部署并兼顧分布式架構的擴展性與集中式架構的性能優(yōu)勢,不僅一舉突破了分布式數據庫單機性能的瓶頸,實現了單機性能趕超集中式數據庫的行業(yè)歷史性“跨越”。
更關鍵的是,它還具備了更低的部署成本和運維復雜度,靈活滿足不同使用場景需求,極大降低了中小企業(yè)使用分布式數據庫的門檻,讓分布式數據庫在千行百業(yè)中實現“普惠化”夯實了基礎。
正如OceanBase CEO楊冰所言:“中國基礎軟件行業(yè)已經有能力‘根創(chuàng)新’,堅持長期投入,中國數據庫必將迎來大爆發(fā)。作為一款完全自研的企業(yè)級原生分布式數據庫,我們希望通過不斷地技術創(chuàng)新,為不同類型客戶降低企業(yè)數據庫的使用門檻,助力產業(yè)數字化?!?/p>
分布式數據庫≠分布式系統(tǒng)
從1970年,關系數據庫之父E.F.Codd在其論文中首次提出關系模型的概念算起,數據庫的歷史長河已經流淌了整整52年。這當中很長的一段時間內,集中式數據庫在信息化時代所構建起的商業(yè)模式和生態(tài)體系,都讓它的市場地位難以撼動。
但進入數字化時代,隨著各行各業(yè)產生的數據量呈爆炸式增長,集中式數據庫的局限性在面對大規(guī)模數據處理中逐漸顯露,由此也催生了分布式數據庫的出現,在國家工業(yè)信息安全發(fā)展研究中心等機構近期發(fā)布的《分布式數據庫發(fā)展趨勢研究報告》中,我們就看到了中國分布式數據庫強勢崛起的幾個關鍵原因:
一是,從產業(yè)發(fā)展背景看,可以看到隨著移動支付、大數據等新場景、新應用的出現,由此帶來的體量增長,數據形態(tài)變化,都要求底層數據庫處理能力需要持續(xù)的迭代升級,而在國家把數據確定為關鍵生產要素之后,一系列的政策驅動,更讓中國分布式數據庫產業(yè)的規(guī)模持續(xù)地壯大。
其中,在“十四五”軟件和信息技術服務業(yè)發(fā)展規(guī)劃中,就提出要“加速分布式分布式數據庫、混合事務分析處理數據庫、共享內存數據庫集群等產品研發(fā)和應用推廣。”此外,在《全國一體化大數據中心協(xié)同創(chuàng)新體系算力樞紐實施方案》中,也明確要求要“加大服務器芯片、操作系統(tǒng)、數據庫、分布式計算與存儲、數據流通模型等軟硬件產品的規(guī)模化應用”。
二是,從場景倒逼創(chuàng)新看,主要體現在由于國內龐大的人口基礎導致包括金融、電信等關系到“國計民生”的重點行業(yè),無論是其關鍵應用的規(guī)模還是其數據的體量都在全球領先,由此也讓這些行業(yè)面臨“世界級”的數據處理壓力,而傳統(tǒng)數據庫的性能往往無法滿足這種規(guī)模的處理需求,因此也讓越來越多的行業(yè)用戶從集中式數據庫走向了分布式數據庫。
三是,從技術演進趨勢看,分布式數據庫本身也在持續(xù)的迭代和升級,比如最初的“分布式中間件+單機數據庫”主要是在單機數據庫系統(tǒng)上進行改造,解決了數據庫擴展性的問題,但其本身也面臨著全局事務能力、高可用,以及節(jié)點無法按需擴展等“短板”;此后出現的“非對稱計算節(jié)點+分布式存儲”,則通過分布式存儲引擎,解決了數據一致性的問題,實現了寫能力的高可用,但其本身的劣勢也是有的,包括擴展性有限,需要分庫處理,同時難以做到跨地域的高可用,且對底層的數據中心基礎設施有著較強的依賴等等。
簡單理解,基于分布式技術+縫合系統(tǒng)搭建的“分布式系統(tǒng)”,與分布式數據庫有本質的區(qū)別,無論是分布分表帶來的額外開支,還是擴容容易縮容難的成本問題,都需要更好的方式去解決。
直到原生分布式數據庫的出現,可以說相當好地解決了上述技術路線中存在的難題。原生分布式數據庫的架構設計,本身就是按照分布式一致性協(xié)議做底層設計的,由此在一致性、全局MVCC、高可用等方面支持更好。尤為重要的是,它還能夠在普通服務器上實現無限水平擴展,通過添加低成本服務器即可擴展算力,提升數據庫集群的整體性能等,因此分布式數據庫走向原生設計在今天已成為大勢所趨。
而誕生于2010年的OceanBase,正是原生分布式數據庫的典型代表,同時 OceanBase還始終堅持“原創(chuàng)+自研”的模式,通過多樣化的業(yè)務場景加速產品迭代,大大降低了用戶的使用成本,讓部署更加便捷,用技術讓海量數據的管理和使用更簡單。
目前,OceanBase 已幫助400+行業(yè)客戶實現核心系統(tǒng)平滑遷移和升級,涉及金融、能源、通信等領域,這也讓OceanBase正從最初的金融行業(yè)走向關乎“國計民生”行業(yè),成為核心系統(tǒng)升級的首選??梢哉f在過去的十二年的時間,OceanBase以持續(xù)的技術創(chuàng)新和豐富的行業(yè)實踐,在中國走出了一條原生分布式數據庫的創(chuàng)新之路。
“小就是大”是把關鍵鑰匙
在此過程中,原生分布式數據庫雖然有著各種先天的優(yōu)勢,但其落地過程中也面臨著兩個方面的挑戰(zhàn):一方面,為了保證絕對高可用性,原生布式數據庫往往以“三副本”形式部署,這意味著企業(yè)如果想要部署分布式數據庫,就要同時進行多個服務器部署,門檻比單機高,且“分布”或“單體”的選擇通常不可逆,選擇了單機就意味著很難再去部署“分布式”。
另一方面,在過去通常都是大中型企業(yè)在部署原生分布式數據庫系統(tǒng),而中小企業(yè)由于數據量不大,應用場景相對簡單,并不需要在業(yè)務量不足時部署分布式數據庫系統(tǒng),反而購買單機更為劃算。但一旦部署單機,后續(xù)業(yè)務量龐大時再進行架構調整,又會進一步增加部署的難度。
如何解決這種“魚和熊掌”難以兼得的難題呢?版本代號為“小魚”的OceanBase4.0正是為此“應運而生”的,作為業(yè)內首個單機分布式一體化架構,有效兼顧了分布式架構的擴展性與集中式架構的性能優(yōu)勢,它的特點是既可以實現單機部署,又可以在單機部署下實現分布式部署的完整功能,從技術上首次突破了分布式數據庫的單機性能瓶頸。
楊冰說:“4.0版本使得OceanBase在具備大規(guī)模處理能力的同時,又具備能夠與傳統(tǒng)單機數據庫性能可以相媲美的能力,而且支持行業(yè)客戶在小規(guī)模的場景下進行單機化的部署,為此我們給它起了一個非常不同尋常又充滿寓意的名字——小魚,英文名字是Paetica,袖珍魚,是世界上最小的魚,這個版本代表著OceanBase在小型化上的探索與創(chuàng)新,也是分布式到單機分布式的一次轉折,真正讓OceanBase可以按需擴展,實現從0到1再到N的創(chuàng)新?!?/p>
那么,OceanBase4.0的這些新特性究竟體現在哪些方面呢?我們可以從以下幾個維度觀察:
首先,是部署能夠實現“小型化”,OceanBase4.0能在全球最小的電腦(樹莓派)上運行,即使是普通的個人電腦也可以流暢運行單機分布式一體化數據庫,讓分布式數據庫觸手可及。換句話說,OceanBase4.0可以適應從個人小站點到銀行核心系統(tǒng)、巨型電商網站等各種規(guī)模的業(yè)務。企業(yè)選用后,可以在業(yè)務發(fā)展不同階段根據自身特點,靈活滿足性價比和高可用的要求,極大地降低企業(yè)使用分布式數據庫的門檻。技術的突破和使用成本的降低,也意味著 OceanBase 4.0 突破了分布式數據庫的邊界,讓分布式數據庫向通用性數據庫又邁進了一步。
其次,是系統(tǒng)具備強大的“易用性”,具體體現在OceanBase4.0即便在單機部署模式下,仍然可以實現分布式部署的完整功能,包括 Oracle/MySQL 兼容性、TP 事務處理能力、AP 并行分析查詢能力、租戶資源隔離等。此外,相比前幾個版本,OceanBase 4.0還大幅度提升交易處理能力,分析處理能力再上臺階,實現了由全場景向量化能力覆蓋,同時還在業(yè)內率先將故障恢復時間(RTO)從 30 秒優(yōu)化到 8 秒,而RTO的數值越小,代表系統(tǒng)故障恢復能力越強,這是中國數據庫的第一次,也是全球數據庫的第一次,這也意味著未來系統(tǒng)的故障恢復時間將真正跨入到秒級時代。
最后,是運營和維護的“低成本”,OceanBase Cloud 的正式發(fā)布也讓OceanBase能夠以更好的計費模式降低服務中小企業(yè)的門檻。OceanBase Cloud擁有 OceanBase 100% 的能力,可以讓更多中小企業(yè)在云上更便捷、更低成本地擁有金融級高性能數據庫,最快僅需幾分鐘即可在云上完成數據庫設置。
也正因此,過去一年,OceanBase Cloud 年營收同比增長 300%,已成為強有力的第二增長曲線。據了解,OceanBase Cloud 除支持阿里云外,還將在今年9月份正式上線亞馬遜云科技(AWS),后續(xù)也將陸續(xù)支持全球主流公有云基礎設施,這不僅讓OceanBase今后可以更好地賦能千行百業(yè),也能夠在全球市場更快地實現“開疆拓土”。
對此,楊冰也表示:“歷史上OceanBase往前演進的時候一共有兩次大的重構,第一次大重構是在0.5版本到1.0版本的過程中,這次大的重構讓OceanBase變成今天對等化的分布式架構,成為真正的金融級分布式數據庫;而第二次就是3.0到4.0的重構,而這次升級則徹底讓OceanBase真正成為了面向云時代的通用數據庫?!?/p>
從這個角度來看,OceanBase4.0真正詮釋了“小就是大”的理念,它不僅讓原生分布式數據庫真正走向了“small is new big”的新時代,同時通過這種持續(xù)的技術創(chuàng)新,實現了不同企業(yè)對分布式數據庫不同需求的合理匹配,更讓“小就是大”成為了撬動產業(yè)數字化的關鍵鑰匙,由此讓千行百業(yè)都能夠更好地奔赴數字化的“星辰大?!薄?/p>
“四位一體”打造創(chuàng)新發(fā)動機
值得一提的是,OceanBase除了技術上首次突破分布式數據庫的單機性能瓶頸之外,還在服務、生態(tài)、開源領域發(fā)布了一系列的新政策和新舉措,希望以“四位一體”的新模式,釋放OceanBase4.0不斷創(chuàng)新帶來的技術紅利。

在服務方面,為了更好地服務行業(yè)客戶,OceanBase推出“無憂 365”代運維服務,該服務針對客戶核心場景,并聯(lián)合中國信通院、中國人民保險和太平洋保險提供了三種不同等級的服務可用性等級保障方案,最高等級服務可用性達到 99.99%,即可以保障用戶每個月單次服務故障不超過 5 分鐘。讓數據庫筆筆算數,“你敢用,我敢賠?!?/p>
在生態(tài)方面,OceanBase全面升級商業(yè)生態(tài)策略,未來將構建以“合作伙伴”為中心的商業(yè)生態(tài)模式,并全面布局區(qū)域市場。為此,OceanBase 計劃推出“珊瑚計劃”,該計劃將在未來3年,面向全國重點省會城市,培養(yǎng) 60 家核心經銷商。在此基礎上,通過政策支持,OceanBase將會幫助核心經銷商持續(xù)成長,三年實現合作伙伴收入份額占總銷售份額60% 以上。
在開源方面,去年6月1日,OceanBase正式宣布開源,經過過去一年多的努力,OceanBase已連接了超過3萬多的社區(qū)開發(fā)者,并有超過100位小伙伴為OceanBase貢獻了代碼。同樣,作為OceanBase的戰(zhàn)略方向,OceanBase的開源政策也迎來了再次升級,包括OceanBase 將發(fā)布 4.0 社區(qū)版,進一步開源OceanBase的內核代碼,即針對“MySQL兼容能力”全部開放,此外社區(qū)版將享受企業(yè)版同等性能等。而接下來,OceanBase 4.X 社區(qū)版也會走向“小型化”,未來最小將支持 4 核 8G 小規(guī)格,為更多開發(fā)者降低應用門檻的同時,也在中國開源數據庫產業(yè)中貢獻出更大的價值。

展望未來,楊冰最后強調說:“產品、服務、生態(tài)、開發(fā)者‘四維一體’將是OceanBase不斷前進的金鑰匙;而核心系統(tǒng)升級、全面上云、業(yè)務出海將是支持OceanBase未來增長的三級火箭,未來我們針對不同業(yè)務規(guī)模的客戶、不同區(qū)域的客戶都會提供優(yōu)質的數據庫產品和服務,在為客戶創(chuàng)造價值的同時也實現自身的發(fā)展和共贏,共同推動中國產業(yè)數字化的新進程?!?/p>
全文總結,基于單機分布式一體化架構,OceanBase在技術創(chuàng)新上跨出的這“一小步”,對整個數據庫產業(yè)而言無疑又是重要的“一大步”, 相信OceanBase未來持續(xù)的創(chuàng)新,以及在產品、服務、生態(tài)和開源領域的不斷投入,所釋放出來的強大勢能,一定會讓OceanBase從顛覆自我到顛覆行業(yè),并對重構全球數據庫市場的新格局,起到起到更加決定性的價值和作用。