時(shí)序數(shù)據(jù)庫(kù)的流計(jì)算支持
一、時(shí)序數(shù)據(jù)及其特點(diǎn)?
時(shí)序數(shù)據(jù)(Time Series Data)是基于相對(duì)穩(wěn)定頻率持續(xù)產(chǎn)生的一系列指標(biāo)監(jiān)測(cè)數(shù)據(jù),比如一年內(nèi)的道瓊斯指數(shù)、一天內(nèi)不同時(shí)間點(diǎn)的測(cè)量氣溫等。時(shí)序數(shù)據(jù)有以下幾個(gè)特點(diǎn):
歷史數(shù)據(jù)的不變性
數(shù)據(jù)的有效性
數(shù)據(jù)的時(shí)效性
結(jié)構(gòu)化的數(shù)據(jù)
數(shù)據(jù)的大量性
?
二、時(shí)序數(shù)據(jù)庫(kù)基本架構(gòu)
?

?
針對(duì)時(shí)序數(shù)據(jù)的特點(diǎn),時(shí)序數(shù)據(jù)庫(kù)一般具有以下特性:
高速的數(shù)據(jù)入庫(kù)
數(shù)據(jù)的生命周期管理
數(shù)據(jù)的流處理
高效的數(shù)據(jù)查詢
定制的數(shù)據(jù)壓縮
?
三、流計(jì)算介紹?
流計(jì)算主要是指針對(duì)實(shí)時(shí)獲取來(lái)自不同數(shù)據(jù)源的海量數(shù)據(jù),經(jīng)過(guò)實(shí)時(shí)分析處理,從而獲得有價(jià)值的信息。常見(jiàn)的業(yè)務(wù)場(chǎng)景包括實(shí)時(shí)事件的快速反應(yīng),市場(chǎng)變化的實(shí)時(shí)告警,實(shí)時(shí)數(shù)據(jù)的交互分析等。流計(jì)算一般包括如下幾方面的功能:
1)過(guò)濾和轉(zhuǎn)換 (filter & map)
2)聚合以及窗口函數(shù) (reduce,aggregation/window)
3)多數(shù)據(jù)流合并以及模式匹配 (joining & pattern detection)
4)從流到塊處理
?
四、時(shí)序數(shù)據(jù)庫(kù)對(duì)流計(jì)算的支持? ?
案例一:使用定制化的流計(jì)算 API,如下面例子所示:
案例二:使用類 SQL 指令,創(chuàng)建流計(jì)算以及定義流計(jì)算規(guī)則,如下: