商業(yè)智能BI - 派可數(shù)據(jù)商業(yè)智能BI可視化分析平臺
指標(biāo)爆炸這個詞大家可能都是第一次聽說,指標(biāo)怎么會爆炸呢?其實(shí)這個是我們很多年前在一些商業(yè)智能BI項(xiàng)目上總結(jié)出來的一種場景或者現(xiàn)象,就是過于的開放給業(yè)務(wù)人員在BI自助分析過程中創(chuàng)造了很多衍生性的分析指標(biāo),結(jié)果就造成了前端指標(biāo)過于臃腫的局面。
什么是指標(biāo)爆炸
簡單來說,指標(biāo)爆炸具體的表現(xiàn)主要是:
第一,每個人都有能力自己造指標(biāo),造成指標(biāo)的定義在不同的部門或者業(yè)務(wù)領(lǐng)域出現(xiàn)重復(fù),但實(shí)際指標(biāo)的含義相差甚遠(yuǎn)。比如名稱叫的一樣,但是業(yè)務(wù)計(jì)算公式可能不相同,在可視化頁面上大家可能看到的名稱一樣,但解釋口徑完全不同,指標(biāo)相互打架。
第二,造了很多臨時性的分析指標(biāo),指標(biāo)越來越多,缺乏統(tǒng)一管理,復(fù)用度很低,指標(biāo)像爆炸了一樣,越到后期越難管理。
第三,隨著業(yè)務(wù)的變化和調(diào)整,指標(biāo)的業(yè)務(wù)計(jì)算規(guī)則可能在一個新的業(yè)務(wù)周期它的業(yè)務(wù)邏輯已經(jīng)發(fā)生更改,于是業(yè)務(wù)人員在前端對指標(biāo)的一些計(jì)算邏輯、聚合規(guī)則做了改變,但是這種改變是以直接覆蓋的形式,即早期的數(shù)據(jù)應(yīng)該保留早期計(jì)算規(guī)則的但并沒有保留,就形成了在一些歷史數(shù)據(jù)在呈現(xiàn)的時候不正確,因?yàn)橛昧诵碌挠?jì)算規(guī)則來計(jì)算。

這上面的三種情況隨著商業(yè)智能BI的應(yīng)用面越深、越廣就越來越混亂,所以我們把這種場景就叫做指標(biāo)爆炸。
這種場景一般的公司可能基本上碰不到指標(biāo)爆炸,為什么?這些公司對商業(yè)智能BI的應(yīng)用能力還沒有真正達(dá)到讓業(yè)務(wù)人員能夠完全自助的參與到可視化分析、可視化報(bào)表的設(shè)計(jì)上。只有對商業(yè)智能BI應(yīng)用比較深的,業(yè)務(wù)人員參與越多的、對業(yè)務(wù)人員開放性更大的企業(yè)才會出現(xiàn)這種問題。
指標(biāo)爆炸分析
這個問題我們之前碰到過,基本上一碰到苗頭就打下去了,但也要去做出一些平衡。有兩個關(guān)鍵的點(diǎn):第一,就是IT和業(yè)務(wù)在商業(yè)智能BI上的邊界是什么?第二,指標(biāo)應(yīng)該如何統(tǒng)一來管理,如何在自助和規(guī)范上做到平衡。自助就意味著能力的開放,規(guī)范就是往回拉,要控制。
先來說下第一個點(diǎn),IT和業(yè)務(wù)在商業(yè)智能BI上的邊界是什么?這個大家要結(jié)合之前發(fā)過的文章視頻《BI的后端建模和前端建模有什么區(qū)別和聯(lián)系》,去了解下前后端建模。簡單來說IT和業(yè)務(wù)的邊界就在于數(shù)據(jù)倉庫這個層面,從底層業(yè)務(wù)系統(tǒng)數(shù)據(jù)源到數(shù)據(jù)倉庫的數(shù)據(jù)打通、ETL開放、建模等等這些都是IT的活,BI開發(fā)人員的活。

在數(shù)據(jù)倉庫這個層面對業(yè)務(wù)人員、前端的BI可視化分析工具開放數(shù)據(jù)集市層即Data Mart,業(yè)務(wù)人員日常用到的維度或者事實(shí)表指標(biāo)都在這個層上,通過權(quán)限控制讓不同的業(yè)務(wù)人員訪問不同的分析模型,這樣通過前端建模也可以自助的做各種各樣的自助分析,這個問題是可以解決的。
其次,原則上不允許前端業(yè)務(wù)人員在做商業(yè)智能BI分析的時候自己創(chuàng)建新的指標(biāo),對于分析指標(biāo)有一套完整的管理機(jī)制,從指標(biāo)的定義、業(yè)務(wù)規(guī)則的審核、開發(fā)、發(fā)布和培訓(xùn)有一套完整的流程。
每一個指標(biāo)都有一個Owner 所有者,避免指標(biāo)的定義發(fā)生歧義,指標(biāo)的業(yè)務(wù)規(guī)則只能有一套口徑,這些指標(biāo) 定義好了,IT、BI開發(fā)人員來開發(fā),開發(fā)好了更新到某一個分析模型中或者發(fā)布一個新的模型,給業(yè)務(wù)人員做好分析場景的演示和培訓(xùn),告訴大家怎么用。
如果業(yè)務(wù)人員就是想自己造一個指標(biāo)來用,那這個指標(biāo)一定是臨時性的,就自己在自己的私有報(bào)表頁面上用,不允許發(fā)布到對外的正式可視化頁面當(dāng)中。如果這個指標(biāo)經(jīng)過驗(yàn)證,并且得到一致的認(rèn)同,可以按照之前的管理流程走一遍。這個時候可以通知IT部門BI團(tuán)隊(duì)將這個臨時性的指標(biāo)維護(hù)到正式的商業(yè)智能BI數(shù)據(jù)倉庫中,這樣就形成了指標(biāo)的統(tǒng)一管理,指標(biāo)也得到了高度可復(fù)用、沉淀下來,并且一定是一套統(tǒng)一的口徑。

這種方式就可以解決很多問題,既可以保證指標(biāo)的統(tǒng)一管理、公共指標(biāo)下沉、指標(biāo)的復(fù)用性,又可以避免業(yè)務(wù)人員自造指標(biāo)出現(xiàn)指標(biāo)爆炸的問題。包括像前面講到的指標(biāo)場景,由于業(yè)務(wù)邏輯發(fā)生變更的情況下,需要維護(hù)兩套或者多套的業(yè)務(wù)計(jì)算規(guī)則,這個問題在底層數(shù)據(jù)倉庫上就很容易維護(hù)進(jìn)去,對于業(yè)務(wù)人員在前端根本就不用關(guān)心這些事情了。
這種方法論可以支撐非常大體系的商業(yè)智能BI項(xiàng)目,我們之前在一個項(xiàng)目上就涉及到了幾百個業(yè)務(wù)用戶,幾千張分析報(bào)表,業(yè)務(wù)人員自助做的可視化頁面就達(dá)到了兩千多張,靠的就是這種方式,是已經(jīng)驗(yàn)證過的非常成功的一種方式。
指標(biāo)爆炸問題核心
大家注意到?jīng)]有,解決指標(biāo)爆炸的核心是什么?第一就是后端建模、完整的數(shù)據(jù)倉庫底座作為基礎(chǔ),沒有底層的數(shù)據(jù)倉庫構(gòu)建,是不可能解決這類問題的,這個結(jié)論我就在這里直接告訴給大家。

第一不管你是傳統(tǒng)的基于關(guān)系型的數(shù)據(jù)倉庫建模,還是基于大數(shù)據(jù)架構(gòu)的數(shù)據(jù)倉庫建模,都是數(shù)據(jù)倉庫建模。第二就是一套完整的關(guān)于指標(biāo)的管理機(jī)制,沒有這種機(jī)制去管理、去控制和平衡IT和業(yè)務(wù)的邊界,對于指標(biāo)的管理一定會失控,只是會在第一年失控還是在第二年、第三年失控。
規(guī)矩往往是最開始定下來比較好,等到真正出現(xiàn)指標(biāo)失控、指標(biāo)爆炸的情況再去解決,基本上就已經(jīng)喪失最好的時機(jī)了。客戶就會覺得你很不專業(yè),后面要投入這么大的精力、時間來解決這個問題,你到底有沒有大項(xiàng)目的規(guī)劃和建設(shè)經(jīng)驗(yàn)?zāi)??這些問題為什么不一開始就告訴我們呢?當(dāng)這些事情發(fā)生的時候就會很被動。