帶你來(lái)吃瓜!Andy Pavlo教授帶您一文回顧數(shù)據(jù)庫(kù)的2022年



編輯/翻譯:宇亭
校對(duì):王學(xué)姣、李浩
?本文是由數(shù)據(jù)庫(kù)界知名專家 Andy Pavlo教授寫的2022年數(shù)據(jù)庫(kù)回顧文章,這個(gè)系列從去年開始,非常經(jīng)典,也比較系統(tǒng)的整理了一下數(shù)據(jù)庫(kù)界的大事件(當(dāng)然,主要還是以國(guó)外的居多),StoneDB團(tuán)隊(duì)對(duì)本文進(jìn)行了翻譯,小編在一些鏈接部分加了注釋,方便大家理解相關(guān)內(nèi)容,更好地了解全球的數(shù)據(jù)庫(kù)動(dòng)態(tài),當(dāng)然,由于篇幅所限,我們這篇只翻譯前三大節(jié)的主要內(nèi)容,想了解更多,推薦您閱讀原文:
https://ottertune.com/blog/2022-databases-retrospective/
?
又一年過(guò)去了,我還活著。既然如此,那么我們現(xiàn)在來(lái)對(duì)過(guò)去一年數(shù)據(jù)庫(kù)領(lǐng)域的變化進(jìn)行回顧和反思是再好不過(guò)了。
隨著 DBMS 廠商之間的基準(zhǔn)測(cè)試之爭(zhēng)逐漸平息,這一年的數(shù)據(jù)庫(kù)領(lǐng)域可以稱得上“安靜”二字了。(小編注:這里來(lái)自 Andy 在去年的回顧文章里講的數(shù)據(jù)庫(kù)評(píng)測(cè)大戰(zhàn),分別是?Databricks vs. Snowflake、Rockset vs. Apache Druid vs. ClickHouse、ClickHouse vs. TimescaleDB,感興趣可以閱讀原文)
前年(2021 年)的回顧文章我寫得很開心,所以我很高興能與你們分享 2022 年里發(fā)生的大事件以及我對(duì)它們的看法。

一、大額數(shù)據(jù)庫(kù)融資已經(jīng)放緩
Big Database Funding Has Slowed Big Time
正如我去年討論的那樣,2021 年是數(shù)據(jù)庫(kù)融資的豐年。隨著投資者繼續(xù)尋找下一個(gè) Snowflake,大量資金被投入到建立新的數(shù)據(jù)庫(kù)初創(chuàng)企業(yè)中。2022 一開始我們便目睹了多家公司完成大規(guī)模融資,似乎 2022 會(huì)是 2021 的翻版。這場(chǎng)投資盛宴始于今年 2 月份,Timescale 獲得?1.1 億美元的 C 輪融資,Voltron Data 獲得?1.1 億美元的種子輪+A輪融資,Dbt Labs 獲得?2.22 億美元的 D 輪融資。Starburst 在 3 月份宣布了?2.5 億美元的 D 輪融資,以擴(kuò)大其 Trino 產(chǎn)品的規(guī)模。5 月份,Imply 給他們的 Druid 商業(yè)版募集到了?1 億美元的 D 輪融資。DataStax 在 6 月份的 IPO 中獲得了?1.15 億美元的融資。最后,SingleStore 在 7 月份公布獲得了?1.16 億美元的?F 輪融資,然后在 10 月份又將該輪融資規(guī)模擴(kuò)大了 3000 萬(wàn)美元。還有幾家較小的公司在?2022 上半年完成的 A 輪融資也同樣令人印象深刻:包括 Neon 為他們的 Serverless PostgreSQL 籌集到了?3000 萬(wàn)美元;ReadySet 為他們的查詢緩存層(Query Caching Layer)籌集了?2900 萬(wàn)美元;Convex 為他們?cè)?PostgreSQL 上構(gòu)建的應(yīng)用程序框架籌集了?2600 萬(wàn)美元;QuestDB 為他們的時(shí)序數(shù)據(jù)庫(kù)籌集了?1500 萬(wàn)美元。我們的 OtterTune 雖然沒(méi)有構(gòu)建新的 DBMS 或相關(guān)基礎(chǔ)設(shè)施,但在 4 月份也籌集到了自己的?1200 萬(wàn)美元 A 輪融資。
但到了 2022 年下半年,數(shù)據(jù)庫(kù)行業(yè)再無(wú)大規(guī)模融資發(fā)生。盡管有一些早期初創(chuàng)企業(yè)籌集到了較小規(guī)模的融資,但那些經(jīng)驗(yàn)更豐富的公司的融資規(guī)模沒(méi)有一個(gè)達(dá)到九位數(shù)(美元)。RisingWave 在 10 月份為他們的流處理引擎籌集了?3600 萬(wàn)美元的 A 輪融資。Keebo 為他們的 Snowflake 查詢加速器籌集了?1050 萬(wàn)美元的 A 輪融資。在 11月,我們看到了 MotherDuck 宣布獲得了?4500 萬(wàn)美元的種子+A 輪融資,用于將 DuckDB 的云版本商業(yè)化,EdgeDB 也在 11 月宣布了?1500 萬(wàn)美元的 A 輪融資。最后,由 Morgan Hitchcock 兩兄弟成立的 SurrealDB 獲得了?600 萬(wàn)美元的種子輪融資。我可能漏掉了其他一些融資信息,但我本來(lái)也并沒(méi)有打算在這里做一個(gè)詳盡的列表。
小編注:你不做,我來(lái)做,哈哈哈哈

除此之外,數(shù)據(jù)庫(kù)領(lǐng)域唯一值得注意的其他金融事件就是 MariaDB 在 12 月災(zāi)難性的公開發(fā)行(通過(guò) SPAC),其股票價(jià)格在第一個(gè)交易日就下跌了 40%。

與 2021 年相比,造成 2022 年的大規(guī)模融資輪數(shù)減少的原因有二。最明顯的原因是整個(gè)科技行業(yè)已經(jīng)降溫,部分原因是對(duì)通貨膨脹、利率和加密經(jīng)濟(jì)崩潰的擔(dān)憂。另一個(gè)原因是,在資金枯竭之前,所有有能力進(jìn)行大規(guī)模融資的公司已經(jīng)完成了資金的募集。例如,Starburst 在 2021 年籌集了 1 億美元的 C 輪融資后,于 2022 年籌集了 D 輪融資。在過(guò)去兩年里進(jìn)行了巨額融資的數(shù)據(jù)庫(kù)公司需要盡快籌集更多資金,以保持增長(zhǎng)的勢(shì)頭。也有其他人對(duì)這些公司獲得的驚人金額發(fā)表了評(píng)論。
壞消息是,除非科技行業(yè)有所改善,大型機(jī)構(gòu)投資者開始再次將資金投入市場(chǎng),否則這些公司將陷入困境。市場(chǎng)無(wú)法維持如此多的數(shù)據(jù)庫(kù)獨(dú)立軟件供應(yīng)商?(ISV)。這些估值?10?億美元的公司繼續(xù)發(fā)展下去的結(jié)局只會(huì)是兩個(gè)極端:IPO?或是破產(chǎn)。對(duì)于大多數(shù)公司來(lái)說(shuō),收購(gòu)它們的成本太高了(除非風(fēng)投機(jī)構(gòu)愿意大幅削減成本)。此外,進(jìn)行大型并購(gòu)的主要科技公司(如亞馬遜、谷歌、微軟)已經(jīng)有了自己的云數(shù)據(jù)庫(kù)產(chǎn)品。因此,目前還不清楚誰(shuí)將收購(gòu)這些數(shù)據(jù)庫(kù)初創(chuàng)企業(yè)。舉個(gè)例子,亞馬遜每年可以從?Redshift?身上每年賺數(shù)十億美元,它沒(méi)有任何必要花?20?億美元(ClickHouse?2021?年的估值)收購(gòu)?ClickHouse。這個(gè)問(wèn)題并非 OLAP 數(shù)據(jù)庫(kù)公司獨(dú)有的,OLTP 數(shù)據(jù)庫(kù)公司很快也將面臨同樣的問(wèn)題。
我并不是唯一一個(gè)對(duì)數(shù)據(jù)庫(kù)初創(chuàng)企業(yè)的命運(yùn)做出如此可怕預(yù)測(cè)的人。Gartner 分析師預(yù)測(cè),到 2025 年,50% 的獨(dú)立 DBMS 供應(yīng)商將倒閉。我的觀點(diǎn)肯定不是完全客觀的,但我認(rèn)為能夠生存下來(lái)的公司將是那些致力于改進(jìn)/增強(qiáng)現(xiàn)有 DBMS 而不是取代它們的公司(例如 dbt、ReadySet、Keebo 和 OtterTune)。
我無(wú)法評(píng)價(jià) SPAC 的“快速上市”模式是好是壞,就像 MariaDB 所做的那樣。這類金融工具超出了我的專業(yè)領(lǐng)域(即數(shù)據(jù)庫(kù))知識(shí)范疇。

二、區(qū)塊鏈數(shù)據(jù)庫(kù)仍然是一個(gè)愚蠢的想法
Blockchain Databases Are Still a Stupid Idea
市場(chǎng)上已經(jīng)出現(xiàn)了各種各樣的狂熱觀點(diǎn),宣稱 Web3 將如何徹底改變?nèi)藗儤?gòu)建新應(yīng)用的方式。我曾有一個(gè)學(xué)生沖出了我的課堂,就因?yàn)槲医痰氖顷P(guān)系型數(shù)據(jù)庫(kù)而不是 Web3。(小編注:眾所周知,Andy 在 CMU 教授數(shù)據(jù)庫(kù),沒(méi)錯(cuò),就是最經(jīng)典的 CMU 15-445 系列課程,這課每年都在上,就在 2022 Fall 的第一節(jié)課上,當(dāng) Andy 介紹數(shù)據(jù)庫(kù)的 Data Model 種類時(shí),一位同學(xué)站起來(lái)問(wèn)怎么 PPT 上沒(méi)有寫區(qū)塊鏈,區(qū)塊鏈?zhǔn)俏磥?lái),比其他的 Data Model 都要好,應(yīng)該加上,Andy 說(shuō)區(qū)塊鏈不是一個(gè) Data Model,應(yīng)該算 implementation,再說(shuō)我這課是教數(shù)據(jù)庫(kù)的,也不是教區(qū)塊鏈/Web3 的,兩人激辯一番,最后那位同學(xué)說(shuō)區(qū)塊鏈?zhǔn)亲?diao 的,你不加上我很遺憾,你擱這兒純純浪費(fèi)了大家的時(shí)間,然后當(dāng)場(chǎng)沖出了教室,場(chǎng)面一度非常尷尬,這個(gè)操作也是令人二丈和尚摸不著頭腦,Web3 的狂熱粉絲在此給 Andy 留下了深刻印象)Web3 運(yùn)動(dòng)的核心原則是將狀態(tài)存儲(chǔ)在區(qū)塊鏈數(shù)據(jù)庫(kù)中。區(qū)塊鏈本質(zhì)上是去中心化的日志結(jié)構(gòu)數(shù)據(jù)庫(kù)(即賬本),它使用默克爾樹(也稱哈希樹)的一些變體和 BFT 共識(shí)協(xié)議來(lái)維護(hù)增量校驗(yàn)和,以確定安裝到數(shù)據(jù)庫(kù)中的下一個(gè)更新。這些增量校驗(yàn)和是區(qū)塊鏈確保數(shù)據(jù)庫(kù)日志記錄不可變的方式:客戶端使用這些校驗(yàn)和來(lái)驗(yàn)證以前的數(shù)據(jù)庫(kù)更新沒(méi)有被篡改。
區(qū)塊鏈?zhǔn)菍?duì)以前一系列想法的巧妙融合。但是,認(rèn)為每個(gè)人都應(yīng)該使用去中心化的賬本來(lái)構(gòu)建他們的 OLTP 應(yīng)用的想法是錯(cuò)誤的。(小編注:這里 Andy 貼了個(gè)鏈接,內(nèi)容是維基百科創(chuàng)始人 Jimmy Wales 在 Twitter 上的聲明:一個(gè)加密貨幣的大 V 說(shuō)讓維基百科通過(guò)區(qū)塊鏈技術(shù)(用于存儲(chǔ))和加密貨幣(用于激勵(lì))運(yùn)作,Jimmy 表示強(qiáng)烈反對(duì),他認(rèn)為數(shù)據(jù)已經(jīng)存在數(shù)據(jù)庫(kù)里了,有數(shù)據(jù)庫(kù)就夠了,區(qū)塊鏈技術(shù)很好,但可不是這樣用的,至于加密貨幣用于激勵(lì)——如果平臺(tái)支持人們存款,就無(wú)法吸引那些真正對(duì)主題感興趣而做出貢獻(xiàn)的專家和愛(ài)好者,取而代之的是人們相互競(jìng)爭(zhēng)以獲取金錢利益為目的來(lái)創(chuàng)建和編輯內(nèi)容,這嚴(yán)重違反了維基百科的平臺(tái)愿景。當(dāng)然了,Jimmy 個(gè)人其實(shí)也一直認(rèn)為加密貨幣就是泡沫經(jīng)濟(jì),他多次公開表示不會(huì)支持在維基百科平臺(tái)上使用區(qū)塊鏈技術(shù)和加密貨幣)從數(shù)據(jù)庫(kù)的角度來(lái)看,除了加密貨幣之外,區(qū)塊鏈技術(shù)在任何實(shí)際用例上都不能提供比現(xiàn)有 DBMS 技術(shù)更好的功能。此外,任何聲稱區(qū)塊鏈在數(shù)據(jù)庫(kù)中提供了比現(xiàn)有 DBMS 更好的安全性和可審計(jì)性的說(shuō)法都是錯(cuò)誤的。
因此,如果加密貨幣是區(qū)塊鏈數(shù)據(jù)庫(kù)的最佳案例,那么實(shí)際上當(dāng)在 2022 年加密市場(chǎng)面臨崩潰時(shí),這個(gè)最佳案例也沒(méi)提供什么幫助,反倒是進(jìn)一步阻礙了區(qū)塊鏈數(shù)據(jù)的未來(lái)。在這里,我將忽略 FTX 的崩潰,因?yàn)樗雌饋?lái)是赤裸裸的欺詐,與數(shù)據(jù)庫(kù)沒(méi)有任何關(guān)系。但是我要指出的是,與所有其他加密交易所一樣,F(xiàn)TX 并沒(méi)有在區(qū)塊鏈數(shù)據(jù)庫(kù)上運(yùn)行業(yè)務(wù),而是使用的 PostgreSQL。其他與加密貨幣無(wú)關(guān)的區(qū)塊鏈數(shù)據(jù)庫(kù)用例,如交易和游戲平臺(tái),由于它們的不實(shí)用性或欺詐而逐漸失敗。

在評(píng)估一項(xiàng)技術(shù)時(shí)要遵循的一個(gè)規(guī)則是,一旦 IBM 為它做了電視廣告,它就不再是“新”技術(shù)了。這意味著,如果在 IBM 開始宣傳某樣?xùn)|西時(shí),還沒(méi)有令人信服的用例,那么就永遠(yuǎn)不會(huì)有。例如,IBM 在 2002 年的一個(gè)商業(yè)廣告中吹捧 Linux 是一個(gè)熱門的新事物,但那時(shí)已經(jīng)有數(shù)以千計(jì)的公司將 Linux 作為他們的主要服務(wù)器操作系統(tǒng)(包括 Google)。因此,當(dāng) IBM 在 2018 年推出區(qū)塊鏈商業(yè)廣告時(shí),我知道這項(xiàng)技術(shù)不會(huì)超越加密貨幣,因?yàn)椴淮嬖谌ブ行幕瘏^(qū)塊鏈可以解決而中心化 DBMS 無(wú)法解決的問(wèn)題。IBM 今年宣布關(guān)閉與航運(yùn)巨頭馬士基(Maersk)合作的供應(yīng)鏈 IT 基礎(chǔ)設(shè)施檢修項(xiàng)目(小編注:這里引用的新聞標(biāo)題是?Blockchain Fails to Gain Traction in the Enterprise)也就不足為奇了(這也是他們?cè)谏虡I(yè)廣告中大肆宣傳的事情)。
與由受信任的機(jī)構(gòu)控制、只允許受信任的客戶端直接連接、精心編寫的事務(wù)性?DBMS 相比,區(qū)塊鏈的效率低得可怕。除了加密貨幣(見(jiàn)上文)或誘捕之類的非法活動(dòng)外,幾乎所有現(xiàn)實(shí)世界的交互都是以這種方式工作的。我們需要信任他人才能擁有一個(gè)正常運(yùn)轉(zhuǎn)的社會(huì)。例如,我授權(quán)托管 OtterTune 網(wǎng)站的公司收取我們的信用卡費(fèi)用,而他們信任云提供商托管他們的軟件。這些交易不需要區(qū)塊鏈數(shù)據(jù)庫(kù)。
從工作量證明(Proof-of-Work, PoW)切換到能耗更低的權(quán)益證明(Proof-of-Stake, PoS)共識(shí)機(jī)制確實(shí)提高了區(qū)塊鏈數(shù)據(jù)庫(kù)的性能(小編注:這里 Andy 舉了以太坊的例子:Ethereum switches to proof-of-stake consensus after completing The Merge)。但這只會(huì)影響數(shù)據(jù)庫(kù)的吞吐量,區(qū)塊鏈?zhǔn)聞?wù)延遲仍然以數(shù)十秒為單位測(cè)量。如果解決長(zhǎng)延遲的方法是使用參與者更少的 PoS 區(qū)塊鏈,那么應(yīng)用程序還不如只使用 PostgreSQL,再對(duì)這些參與者進(jìn)行身份驗(yàn)證就好了。
大家可以看看 Tim Bray 寫的這篇很棒的文章(小編注:Tim Bray 是前AWS副總裁兼資深工程師,是XML的發(fā)明者,不過(guò)20年因?yàn)椴粷M亞馬遜疫情期間對(duì)待員工的方式憤然辭職,現(xiàn)在回老東家谷歌了,這篇博客主要是講 AWS 高層對(duì)區(qū)塊鏈的態(tài)度),他與AWS高層就區(qū)塊鏈?zhǔn)欠裼锌尚械穆涞赜美M(jìn)行了內(nèi)部討論。請(qǐng)注意,他說(shuō)?AWS 在2016年就得出結(jié)論,區(qū)塊鏈數(shù)據(jù)庫(kù)是一個(gè)有問(wèn)題的解決方案,比 IBM 推出他們的商業(yè)廣告早了兩年!盡管 AWS 最終在 2018 年發(fā)布了它的 QLDB 服務(wù),但它與區(qū)塊鏈不是一回事。QLDB 是一個(gè)中心化的可驗(yàn)證賬本,不使用 BFT 共識(shí)??蛻魧?duì) QLDB 的采用并不是很理想,特別是與亞馬遜非常成功的 Aurora 系列產(chǎn)品相比。
附注1:我最近參加了 SFO 會(huì)議的一個(gè)小組討論(小編注:這里是指?Andy?在22年10月參加了硅谷著名?VC?機(jī)構(gòu)?Race?Capital?組織的年度峰會(huì),值得一提的是,Race曾投資了?FTX種子輪),SBF 也從巴哈馬飛來(lái)出席( 小編注:給不混幣圈的同學(xué)科普一下,SBF是人名縮寫,即 Sam Bankman-Fried,是 FTX 創(chuàng)始人兼首席執(zhí)行官,2017 年開始涉足加密貨幣行業(yè),僅用了4年時(shí)間累積了上百億美元的加密資產(chǎn),并躋身福布斯全球富豪榜,不過(guò),就在22年12月,SBF 被美國(guó)多個(gè)聯(lián)邦機(jī)構(gòu)起訴通過(guò) FTX 詐騙)。我當(dāng)時(shí)留下來(lái)看了他的演講。當(dāng) SBF 上臺(tái)時(shí),觀眾們欣喜若狂。不過(guò)我當(dāng)時(shí) Slack 上的聊天記錄顯示,我對(duì) SBF 對(duì)主持人問(wèn)題的 “yep” 回答印象并不深刻。
附注2:?在FTX崩潰的三周前,有人向 Dana Van Aken 和我指出,OtterTune 擁有的全職工程師數(shù)量與FTX在巴哈馬的團(tuán)隊(duì)相同。這個(gè)人告訴我們,既然我們有相同數(shù)量的工程師,OtterTune 應(yīng)該像 FTX 一樣更敏捷或者積極,現(xiàn)在應(yīng)該已經(jīng)有 10 億美元的 ARR 了。嘔吼~

三、值得關(guān)注的新數(shù)據(jù)庫(kù)系統(tǒng)
New Database Systems
今年有幾個(gè)主要的新數(shù)據(jù)庫(kù)被公布。
Google AlloyDB
今年的重磅消息是谷歌云在5月宣布了新的數(shù)據(jù)庫(kù)服務(wù) AlloyDB(小編注:沒(méi)錯(cuò),就是那個(gè)主打 HTAP 的云數(shù)據(jù)庫(kù))。與構(gòu)建在 Spanner 之上不同,AlloyDB是PostgreSQL的一個(gè)修改版本,它分離了計(jì)算層和存儲(chǔ)層,并直接在存儲(chǔ)中支持 WAL 記錄處理。
Snowflake Unistore
在6月,Snowflake 宣布了他們新的 Unistore 引擎(小編注:沒(méi)錯(cuò),就是那個(gè)支持 HTAP 的引擎),它具有“hybrid tables”,以支持低延遲事務(wù)的DML操作。當(dāng)查詢更新表時(shí),更改會(huì)同步到 Snowflake 的列式存儲(chǔ)中。SingleStore(前MemSQL) 的一些人有點(diǎn)生氣(小編注:這里說(shuō)的是 SingleStore 的總裁Domenic Ravita,可見(jiàn)國(guó)外數(shù)據(jù)庫(kù)圈還是蠻喜歡互懟的),嘲諷 Snowflake 在 HTAP 領(lǐng)域只是有一些專利,但沒(méi)有任何實(shí)際成果。
MySQL Heatwave
在甲骨文意識(shí)到亞馬遜從MySQL上賺的錢比他們多之后,他們最終決定在2020年為MySQL建立自己的云服務(wù)。但是他們并沒(méi)有做一個(gè)RDS的克隆,而是用一個(gè)叫 Heatwave 的內(nèi)存向量化 OLAP 引擎擴(kuò)展了 MySQL。(小編注:這個(gè)和StoneDB正在做的事兒一樣~)去年,Oracle 宣布他們的 MySQL 服務(wù)也支持了自動(dòng)數(shù)據(jù)庫(kù)優(yōu)化(小編注:這里是指MySQL HeatWave加入了ML的功能,實(shí)現(xiàn)了 Autopilot),但與 OtterTune 提供的不同。今年,Oracle 終于意識(shí)到他們不是領(lǐng)先的云供應(yīng)商,開始選擇在 AWS 上提供 MySQL Heatwave 的支持了。
Velox
2020年,Meta 開始為 PrestoDB 構(gòu)建新的執(zhí)行引擎 Velox。兩年后,他們宣布了這個(gè)項(xiàng)目,并發(fā)表了一篇關(guān)于它的 VLDB 論文(小編注:論文為《Velox: Meta's Unified Execution Engine》)。Velox 不是一個(gè)完整的 DBMS:它沒(méi)有SQL解析器、catalog、優(yōu)化器或網(wǎng)絡(luò)支持。相反,它是一個(gè)具有內(nèi)存池(memory pool)和存儲(chǔ)連接器(storage connectors)的 C++ 可擴(kuò)展執(zhí)行引擎。我們可以使用 Velox 來(lái)構(gòu)建一個(gè)完整的數(shù)據(jù)庫(kù)管理系統(tǒng)。
InfluxDB IOx
就像 Meta 研發(fā) Velox 一樣,在過(guò)去兩年里,Influx 團(tuán)隊(duì)一直在開發(fā)他們的新 IOx 引擎。最終,他們?cè)谌ツ?0月宣布這個(gè)新引擎正式發(fā)布 GA 版本。InfluxDB 基于 DataFusion 和 Apache Arrow 從頭構(gòu)建了 IOx。值得慶幸的是,在我 2017 年警告過(guò) Influx 的 CTO 使用 MMAP 是一個(gè)壞主意之后,他們?cè)谛孪到y(tǒng)中拋棄了 MMAP。

數(shù)據(jù)庫(kù)是我生命中第二重要的東西,所以我很高興看到去年的所有發(fā)展。

我對(duì) AlloyDB 的看法是,它是一個(gè)簡(jiǎn)潔的系統(tǒng),包含了大量令人印象深刻的工程設(shè)計(jì),但我覺(jué)得它并不新奇。AlloyDB 的架構(gòu)類似于 Amazon Aurora 和 Neon,其中 DBMS 存儲(chǔ)有一個(gè)額外的計(jì)算層,可以獨(dú)立于計(jì)算節(jié)點(diǎn)處理 WAL 記錄。盡管谷歌云已經(jīng)有了一個(gè)可靠的數(shù)據(jù)庫(kù)組合(例如 Spanner 和 BigQuery ),但它覺(jué)得仍有必要構(gòu)建 AlloyDB 來(lái)追趕亞馬遜和微軟。
值得關(guān)注的長(zhǎng)期趨勢(shì)是 Velox、DataFusion 和 Polars 等框架的激增。再加上 Substrait 這樣的項(xiàng)目,這些查詢執(zhí)行組件的商業(yè)化意味著所有OLAP數(shù)據(jù)庫(kù)在未來(lái)五年內(nèi)將旗鼓相當(dāng)。與其完全從頭開始構(gòu)建一個(gè)新的數(shù)據(jù)庫(kù),或者對(duì)現(xiàn)有系統(tǒng)進(jìn)行硬分叉(例如 Firebolt 如何對(duì) Clickhouse 進(jìn)行分叉),我覺(jué)得還不如直接使用像 Velox 這樣的可擴(kuò)展框架。這意味著每個(gè)數(shù)據(jù)庫(kù)都將具有與十年前 Snowflake 所特有的相同的向量化執(zhí)行能力。由于在云中,存儲(chǔ)層對(duì)每個(gè)人都是相同的(例如,Amazon 控制著 EBS/S3), 數(shù)據(jù)庫(kù)產(chǎn)品之間的關(guān)鍵區(qū)別將是難以量化的東西,如UI/UX和查詢優(yōu)化。