出道即巔峰,圖數(shù)據(jù)庫(kù)要火?
時(shí)下,隨著千行百業(yè)進(jìn)入數(shù)字化轉(zhuǎn)型的快車道,關(guān)系型數(shù)據(jù)越來(lái)越多,擅長(zhǎng)處理關(guān)系型數(shù)據(jù)的圖數(shù)據(jù)庫(kù)逐漸受到市場(chǎng)的關(guān)注。圖數(shù)據(jù)可以通過(guò)實(shí)體與關(guān)系點(diǎn)變化的方式,將知識(shí)結(jié)構(gòu)化保存,已經(jīng)成為基于事務(wù)關(guān)聯(lián)關(guān)系的模型表達(dá),且具有數(shù)據(jù)天然可解釋性。正因?yàn)槿绱耍瑘D數(shù)據(jù)庫(kù)也成為2013年以來(lái)增速最快的分類,像極了“出道即巔峰”,圖數(shù)據(jù)技術(shù)也被業(yè)內(nèi)看好,甚至被認(rèn)為“未來(lái)十年,將是圖數(shù)據(jù)平臺(tái)成為主流并大放異彩的十年”。?

數(shù)據(jù)庫(kù)流量小生——圖數(shù)據(jù)庫(kù)出道
當(dāng)前,物聯(lián)網(wǎng)、互聯(lián)網(wǎng)、金融等領(lǐng)域中積累了海量的數(shù)據(jù),數(shù)據(jù)間的關(guān)聯(lián)可以產(chǎn)生重要的價(jià)值。在對(duì)數(shù)據(jù)處理的探索中,圖處理技術(shù)為數(shù)據(jù)賦能提供了新的方式,驅(qū)動(dòng)行業(yè)更好地發(fā)展。Gartner調(diào)查顯示,圖數(shù)據(jù)已經(jīng)成為當(dāng)下數(shù)據(jù)分析的基礎(chǔ),圖分析在數(shù)據(jù)分析創(chuàng)新領(lǐng)域的占比為10%。另外,中國(guó)信通院預(yù)計(jì)到2025年,圖分析的占比將提升至80%。
圖數(shù)據(jù)庫(kù)的火熱從數(shù)據(jù)庫(kù)市場(chǎng)的發(fā)展也可見(jiàn)一些端倪。面臨復(fù)雜、互聯(lián)、動(dòng)態(tài)的數(shù)據(jù)洪流,數(shù)據(jù)庫(kù)平臺(tái)在過(guò)去十年如雨后春筍般涌現(xiàn),市場(chǎng)上的選擇增加到350多個(gè)。近幾年,數(shù)據(jù)庫(kù)市場(chǎng)以5%至6%的年復(fù)合增長(zhǎng)率高速擴(kuò)張,市場(chǎng)體量未來(lái)4到5年有望從現(xiàn)在的500?億美元攀升至1000億美元。換言之,數(shù)據(jù)庫(kù)的發(fā)展成功孕育著圖數(shù)據(jù)庫(kù)的未來(lái)。?

在很早之前,大型互聯(lián)網(wǎng)公司便開(kāi)始創(chuàng)建自己專有的圖處理技術(shù)及圖數(shù)據(jù)庫(kù)系統(tǒng),用于社交網(wǎng)絡(luò)、推薦系統(tǒng)、網(wǎng)頁(yè)檢索與排序,并獲得成功。時(shí)至今日,通信、互聯(lián)網(wǎng)、社交網(wǎng)絡(luò)、物聯(lián)網(wǎng)等領(lǐng)域積累了大量的圖數(shù)據(jù),規(guī)模巨大且不斷增長(zhǎng)。據(jù)悉,F(xiàn)acebook的社交網(wǎng)絡(luò)規(guī)模在2011年已超過(guò)8億頂點(diǎn);而騰訊QQ的社交網(wǎng)絡(luò)目前在10億個(gè)頂點(diǎn)的規(guī)模;在電信行業(yè)中,廣州市僅一個(gè)月內(nèi)由電話呼叫方和被呼叫方組成的圖的規(guī)模就超過(guò)4.5?千萬(wàn)個(gè)頂點(diǎn)、1.5?億條邊。
不僅如此,圖數(shù)據(jù)庫(kù)還受到國(guó)內(nèi)外企業(yè)的重視,包括甲骨文、微軟、亞馬遜在內(nèi)的海外科技巨頭先后推出了Oracle?Graph、Microsoft?Azure?Cosmos?DB、Amazon?Neptune等圖數(shù)據(jù)庫(kù)產(chǎn)品,阿里、騰訊、滴滴、美團(tuán)、字節(jié)等國(guó)內(nèi)互聯(lián)網(wǎng)巨頭也紛紛入局,推出了Graph?DB、TGDB、ByteGraph之類的圖分析工具。巨頭的入場(chǎng)也讓Neo4J、TigerGraph等圖領(lǐng)域早期玩家受到關(guān)注。圖數(shù)據(jù)庫(kù)市場(chǎng)正處在隨時(shí)爆發(fā)的邊緣。
解決復(fù)雜數(shù)據(jù)分析,圖數(shù)據(jù)庫(kù)魅力何在?
我們知道,在數(shù)據(jù)的關(guān)聯(lián)分析中,傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(kù)需要進(jìn)行大量的關(guān)聯(lián)操作,在小規(guī)模數(shù)據(jù)的情況下這樣的操作還可以接受,但是當(dāng)數(shù)據(jù)規(guī)模逐漸增大,關(guān)聯(lián)操作會(huì)造成性能呈指數(shù)級(jí)下降。而圖數(shù)據(jù)通過(guò)將實(shí)體與關(guān)系點(diǎn)變化的方式,將知識(shí)結(jié)構(gòu)保存,這使得數(shù)據(jù)擁有天然可解釋性。因此,圖數(shù)據(jù)庫(kù)相較于傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)和NoSQL數(shù)據(jù)庫(kù),其豐富完整的關(guān)系表達(dá)提供了高效的關(guān)聯(lián)查詢和完備的實(shí)體信息。
同時(shí),圖數(shù)據(jù)庫(kù)可以使用小成本,在原有架構(gòu)上獲得性能提升。圖數(shù)據(jù)庫(kù)不僅可以在物聯(lián)網(wǎng)、5G、AI等領(lǐng)域發(fā)揮作用,也可以用來(lái)重構(gòu)原本的遺留系統(tǒng)。雖然不同的圖數(shù)據(jù)庫(kù)可能有截然不同的底層,但這些都完全支持用圖的方式,來(lái)構(gòu)建數(shù)據(jù)模型,從而讓不同組件之間互相聯(lián)系。圖數(shù)據(jù)庫(kù)會(huì)極大地簡(jiǎn)化很多日常數(shù)據(jù)系統(tǒng)中所面臨的問(wèn)題,增大系統(tǒng)的吞吐量并且降低運(yùn)維的需求。?

以物聯(lián)網(wǎng)為例,大數(shù)據(jù)時(shí)代不只是數(shù)據(jù)量的增長(zhǎng),數(shù)據(jù)之間的聯(lián)系也更加復(fù)雜多樣化,比如社交軟件中的點(diǎn)贊、評(píng)論、關(guān)注等行為構(gòu)成的社交網(wǎng)絡(luò),移動(dòng)通信的短信、電話構(gòu)成的通信網(wǎng)絡(luò),移動(dòng)支付場(chǎng)景如微信支付、紅包、面對(duì)面的支付、掃碼等構(gòu)成了支付網(wǎng)絡(luò),電商場(chǎng)景的瀏覽、購(gòu)買、收藏、評(píng)論行為構(gòu)成了用戶和物品之間的購(gòu)物網(wǎng)絡(luò)。?

圖數(shù)據(jù)平臺(tái)讓用戶能夠在圖數(shù)據(jù)庫(kù)上開(kāi)發(fā)和運(yùn)行應(yīng)用程序,直接將關(guān)系和數(shù)據(jù)在物理層面上一并存儲(chǔ)下來(lái),使得訪問(wèn)數(shù)據(jù)結(jié)點(diǎn)和關(guān)系的操作能夠以線性時(shí)間復(fù)雜度完成。在物聯(lián)網(wǎng)時(shí)代,圖變得無(wú)處不在,以往傳統(tǒng)的單點(diǎn)分析技術(shù)逐漸難以準(zhǔn)確或完整的刻劃個(gè)體,針對(duì)圖數(shù)據(jù)的關(guān)聯(lián)性計(jì)算和查詢分析成為常態(tài)需求。
圖數(shù)據(jù)庫(kù)能夠大行其道嗎?
在20世紀(jì)70年代,得益于圖數(shù)據(jù)模型表達(dá)能力強(qiáng)的優(yōu)勢(shì),數(shù)據(jù)管理領(lǐng)域的研究人員提出圖模型對(duì)客觀世界的數(shù)據(jù)進(jìn)行建模,并設(shè)計(jì)了相關(guān)的圖數(shù)據(jù)管理原型系統(tǒng)。其中,Charles?W.?Bachman還由于其在圖數(shù)據(jù)模型方面的貢獻(xiàn)于1973年獲得圖靈獎(jiǎng)。
然而,由于圖數(shù)據(jù)查詢?cè)诒磉_(dá)和執(zhí)行方面的復(fù)雜度都很高,圖數(shù)據(jù)管理系統(tǒng)在應(yīng)用方面存在挑戰(zhàn),研究趨緩。在那個(gè)時(shí)候,關(guān)系數(shù)據(jù)庫(kù)由于其操作接口簡(jiǎn)單,查詢優(yōu)化技術(shù)實(shí)現(xiàn)突破,逐漸成為數(shù)據(jù)管理中的主流。?

進(jìn)入千禧之年,隨著社交網(wǎng)絡(luò)等真實(shí)大圖數(shù)據(jù)的迅猛增長(zhǎng)和其上應(yīng)用需求的推動(dòng),圖數(shù)據(jù)的相關(guān)研究工作重新成為熱點(diǎn)。VLDB2014國(guó)際會(huì)議中出現(xiàn)了4個(gè)圖數(shù)據(jù)管理的專題討論。包括Google、?Facebook、微軟等在內(nèi)的國(guó)際巨頭正在進(jìn)行分布式大圖數(shù)據(jù)管理系統(tǒng)的研發(fā),支持包括海量Web網(wǎng)頁(yè)重要性排序、社區(qū)發(fā)現(xiàn)等操作。圖數(shù)據(jù)庫(kù)開(kāi)始蓬勃發(fā)展起來(lái)。
當(dāng)今的世界是數(shù)據(jù)的世界,而這個(gè)數(shù)據(jù)時(shí)代對(duì)開(kāi)發(fā)者而言堪稱高光時(shí)刻。面向未來(lái)中國(guó)市場(chǎng),中國(guó)不僅擁有龐大的開(kāi)發(fā)者社區(qū)和創(chuàng)新的技術(shù),還有數(shù)量眾多的企業(yè)在開(kāi)展數(shù)字化轉(zhuǎn)型,數(shù)字化企業(yè)必須將數(shù)據(jù)轉(zhuǎn)化為切實(shí)可行的商業(yè)洞見(jiàn)才能創(chuàng)造價(jià)值,而這正是圖數(shù)據(jù)平臺(tái)的用武之地。
寫(xiě)在最后
當(dāng)前,圖數(shù)據(jù)庫(kù)在社交網(wǎng)絡(luò)、金融領(lǐng)域、知識(shí)圖譜等均有不俗表現(xiàn)。隨著5G、物聯(lián)網(wǎng)時(shí)代的到來(lái),萬(wàn)物互聯(lián)越發(fā)深入人心,圖數(shù)據(jù)正式這種關(guān)聯(lián)方式直接的表達(dá)。然而,圖數(shù)據(jù)庫(kù)產(chǎn)業(yè)的發(fā)展仍需要標(biāo)準(zhǔn)化工作來(lái)找尋正確的方向,普及觀點(diǎn)、規(guī)范產(chǎn)品能力依然是產(chǎn)業(yè)當(dāng)前的重中之重。