大數(shù)據(jù)平臺運營的基礎(chǔ)是什么
作者:鄧天佐
越來越多的企業(yè)開始搭建自己的大數(shù)據(jù)平臺體系,并傾注大量資源用于平臺的迭代和運營。那么大數(shù)據(jù)平臺作為越來越被關(guān)注的企業(yè)新興價值點,它應(yīng)該以何種方式看待,并且以什么樣的方式去建設(shè)和運營,值得每一位企業(yè)運營者思考。
本文提供大數(shù)據(jù)平臺運營的三元素模型,旨在幫助企業(yè)管理層以全面的視角審視企業(yè)當前正在建設(shè)的大數(shù)據(jù)體系,真正地實現(xiàn)數(shù)據(jù)驅(qū)動。
1.??? 大數(shù)據(jù)平臺的數(shù)據(jù)指標體系
雖然技術(shù)在不斷地拓展,但很多的商業(yè)邏輯并沒有變化,數(shù)據(jù)指標體系體現(xiàn)的正是企業(yè)最為關(guān)注的各種商業(yè)目標與邏輯。具體來說,可以分為以下三點:
1)??????? 市場端數(shù)據(jù)??蛻魯?shù)據(jù)和產(chǎn)品數(shù)據(jù)。應(yīng)用場景一般來說是構(gòu)建客戶畫像(包括基本信息和生命周期分析)以及產(chǎn)品分不同維度(時間、地點、經(jīng)銷商、生成質(zhì)量、SKU等)的銷售情況。
2)??????? 經(jīng)營數(shù)據(jù)。傳統(tǒng)上也被稱為財務(wù)數(shù)據(jù),收入、成本、毛利、費用。此處不展開闡述。
3)??????? 運營數(shù)據(jù)。關(guān)鍵KPI,運作情況等。主要應(yīng)用場景體現(xiàn)在指標的完成情況(目標、實際、達成率),復雜的分析包含趨勢預(yù)測分析和果因分析。
2.??? 大數(shù)據(jù)平臺的工具體系
為了闡述的簡潔,這里僅將工具體系分為前端和后端。
后端:其主要的工作組成部分是數(shù)據(jù)的儲存和ETL。以2018年為分界點,很多企業(yè)已經(jīng)在逐步地拋棄傳統(tǒng)的關(guān)系型數(shù)據(jù)庫,轉(zhuǎn)向更為靈活高校的數(shù)據(jù)倉庫建設(shè),同時在整體的選擇上也更傾向于迭代更快,成本更低的開源技術(shù)。Hadoop和Python的火爆已經(jīng)預(yù)示著開源數(shù)據(jù)分析體系的來臨。同時,無論是架構(gòu)還是代碼,都在朝著云端化發(fā)展,隨著5G時代的來臨,整個大數(shù)據(jù)平臺都將實現(xiàn)云端化。
前端:數(shù)據(jù)分析及可視化軟件的使用門檻顯著降低,業(yè)務(wù)人員不再過分依賴技術(shù)人員才能完成整個的分析工作。各種BI工具(Tableau、SEMF、Microstrategy、帆軟等)都朝著敏捷化方向快速發(fā)展,傳統(tǒng)BI已經(jīng)走入末路。高效的部署速度和快捷優(yōu)質(zhì)的分析交互使得企業(yè)節(jié)省大量的部署維護成本,進而用于更高價值的分析工作。在前端技術(shù)領(lǐng)域值得關(guān)注的發(fā)展趨勢具體體現(xiàn)在人工智能領(lǐng)域的響應(yīng)式BI工具(如tableau和power bi推出的問答式BI)以及能夠集成多種工具的微服務(wù)架構(gòu)平臺式BI(如SEMF)。
在獨立于前端后端外,值得注意的還有傳統(tǒng)的優(yōu)質(zhì)數(shù)據(jù)工具Excel,仍然在發(fā)揮著巨大的作用,企業(yè)大可不必將其視為落后的生產(chǎn)力工具。作為目前仍然少數(shù)的圖靈完備工具,Excel仍然適用于大量數(shù)據(jù)分析場景,并且還在不斷地完善功能與性能。
3.??? 大數(shù)據(jù)平臺的分析思維方法論
提到數(shù)據(jù)分析的方法論,最主要的便是數(shù)據(jù)分析的流程。一方面大數(shù)據(jù)分析講究對業(yè)務(wù)流程的梳理、一方面是對數(shù)據(jù)模型的建立,這兩個過程中其實是貫穿在整個數(shù)據(jù)分析流程中的,而整個數(shù)據(jù)分析流程又是一個PDCA的閉環(huán)過程。
在數(shù)聚股份看來,對于企業(yè)數(shù)據(jù)分析,首要的任務(wù)是流程的梳理,同時建立起標準化,格式、出處、名稱等多個方面都要建立起一套標準的統(tǒng)一范式,同時不斷強化數(shù)據(jù)治理文化,形成有序高效的數(shù)據(jù)準備氛圍。再者,要結(jié)合業(yè)務(wù)場景的變化,不斷地對各項指標制定出符合場景的分析標準,特別是區(qū)分出不同時間和場景的分析側(cè)重點,這樣才能讓數(shù)據(jù)分析真正地產(chǎn)生價值。
通過對業(yè)務(wù)數(shù)據(jù)、財務(wù)數(shù)據(jù)的梳理,將這些數(shù)據(jù)標準化,然后進行分析,這時變需要用到各種常用的分析方法。常用的幾種數(shù)據(jù)分析方法:
1、交叉表分析
2、聚類分析
3、回歸分析
4、杜邦分析
5、RFM分析
6、因果分析與果因分析
當然,數(shù)據(jù)分析的方法模型,不僅僅限于這幾種,不同的行業(yè)涉及的方法與指標組合及其側(cè)重也有所不同。具體的方法原理描述此處不做詳細介紹,可以自行進行網(wǎng)絡(luò)查找并學習了解。