數(shù)據(jù)即資產,有效的管理使數(shù)據(jù)更具價值
對于銀行業(yè)金融機構而言,數(shù)據(jù)是通過驅動業(yè)務發(fā)展和提升經營質效服務,從而實現(xiàn)其價值的,“數(shù)據(jù)即資產”“數(shù)據(jù)有價”的觀念已逐漸成為行業(yè)共識。
怎樣識別數(shù)據(jù)資產、有效管理和運營數(shù)據(jù)資產,利用現(xiàn)有的數(shù)據(jù)資產創(chuàng)造價值,也是數(shù)據(jù)治理中的一項重要工作和目標。
數(shù)據(jù)資產的分類
把數(shù)據(jù)想象成實物資產,如大型超市的庫存商品,如果沒有進行商品盤點,形成分類索引,記錄每件商品的價格、生產日期、供應商、產地、物流、倉儲、銷售等信息,對于商品管理將一團混亂。數(shù)據(jù)資產的管理同樣如此。
?

我們對數(shù)據(jù)資產進行識別與盤點,了解數(shù)據(jù)的存儲分布和加工鏈路;按業(yè)務視角建立數(shù)據(jù)資產主題分類和目錄,形成數(shù)據(jù)層面業(yè)務與技術的鏈接,是數(shù)據(jù)認責、數(shù)據(jù)標準建立、數(shù)據(jù)質量管理、數(shù)據(jù)安全定級及權限管理等一系列數(shù)據(jù)管理工作的基礎。
和實物資產一樣,數(shù)據(jù)資產也需要通過盤點,對必要的信息進行記錄。這時,就要介紹元數(shù)據(jù)的概念了。類比超市商品,我們會對其分類、用途、產地、生產日期、保管員等方面的信息進行描述與記錄。
對于數(shù)據(jù),我們同樣也會對其分類、來源、分布、采集日期、管理責任人等信息進行記錄。這些用于“描述數(shù)據(jù)的數(shù)據(jù)”,我們就稱之為“元數(shù)據(jù)”。按照描述的不同視角,我們又將元數(shù)據(jù)分為業(yè)務元數(shù)據(jù)、技術元數(shù)據(jù)、管理元數(shù)據(jù)。
業(yè)務元數(shù)據(jù):從業(yè)務視角描述數(shù)據(jù),如數(shù)據(jù)的主題分類、概念模型、業(yè)務含義、業(yè)務規(guī)則等,形成統(tǒng)一的數(shù)據(jù)語言。
技術元數(shù)據(jù):從技術的視角描述數(shù)據(jù),如數(shù)據(jù)所在的存儲位置(庫、表、字段)、字段長度、字段類型、SQL腳本、血緣關系(ETL過程、接口映射)等。
管理元數(shù)據(jù):從管理的視角描述數(shù)據(jù),如數(shù)據(jù)的管理部門、管理責任人等。
?

數(shù)據(jù)資產盤點內容
基于不同的數(shù)據(jù)來源,根據(jù)不同的劃分策略,盤點的內容側重會有所不同:
▲基礎數(shù)據(jù):需要盤點數(shù)據(jù)分布在哪些IT系統(tǒng),區(qū)分其中哪些是需要跨系統(tǒng)流轉、共享使用且變化緩慢的主數(shù)據(jù)信息,哪些是與IT系統(tǒng)定位相匹配的業(yè)務流程交易信息。
▲衍生數(shù)據(jù):需要盤點數(shù)據(jù)的不同應用場景,比如監(jiān)管、統(tǒng)計、內部管理等等。一方面根據(jù)衍生數(shù)據(jù)基于不同使用場景進行分類,另一方面通過盤點,梳理對基礎數(shù)據(jù)的使用熱度。
?

▲外部數(shù)據(jù):需要盤點外部數(shù)據(jù)需求、數(shù)據(jù)類型、數(shù)據(jù)來源、采集頻率、獲取成本、數(shù)據(jù)質量以及數(shù)據(jù)價值評估方式等。
數(shù)據(jù)資產目錄特點
區(qū)別于技術人員使用的數(shù)據(jù)字典,數(shù)據(jù)資產目錄的定位是面向業(yè)務的,鼓勵業(yè)務人員參與建設和使用十分關鍵,數(shù)據(jù)資產目錄必須是業(yè)務人員所熟悉的場景和流程,是客觀反映銀行目前數(shù)據(jù)現(xiàn)狀的,是可擴展的支持未來取數(shù)用數(shù)的。
一個使用友好的數(shù)據(jù)資產目錄,能夠打通查數(shù)/取數(shù)環(huán)節(jié)、打通基礎類數(shù)據(jù)和指標類數(shù)據(jù)的聯(lián)系,并通過人工智能和機器學習等先進技術,更好地支持數(shù)據(jù)的探查和關聯(lián)推薦。
數(shù)據(jù)資產目錄體系框架
我們在進行數(shù)據(jù)資產目錄構建時,需要結合數(shù)據(jù)資產類型,定義數(shù)據(jù)資產的屬性,不同資產類型對應不同業(yè)務屬性,管理屬性,應用模式、資產目錄視角等,達到千數(shù)千面的效果,最終形成數(shù)據(jù)資產權威、可信、可用的企業(yè)級數(shù)據(jù)資產目錄。
?

以業(yè)務領域構建資產目錄為例,可以通過資產盤點,梳理銀行數(shù)據(jù)主題分類/核心業(yè)務板塊,再根據(jù)業(yè)務要素逐步向下劃分二級目錄、三級目錄,最后到葉子結點的信息項上。信息項的定義也是從業(yè)務出發(fā),梳理業(yè)務板塊都有哪些數(shù)據(jù)內容,例如客戶信息包括:客戶名稱、聯(lián)系方式、地址、證件類型、證件號碼等。
數(shù)據(jù)資產分布與映射關系建立
在技術元數(shù)據(jù)采集的基礎上,探索信息項所屬系統(tǒng)來源,確認其系統(tǒng)分布情況,將數(shù)據(jù)資產信息項與物理表/字段間構建映射關系,并確定權威數(shù)據(jù)來源。
對于單個業(yè)務系統(tǒng)而言,只需要將主表中經過分析最準的內容映射過來,而不是所有表,避免數(shù)據(jù)使用者因為多表冗余存儲造成混淆。
數(shù)據(jù)資產目錄的應用價值
通過數(shù)據(jù)資產目錄,可以解決數(shù)據(jù)在哪里、數(shù)據(jù)誰負責,數(shù)據(jù)如何用等一系列問題。數(shù)據(jù)資產目錄的準確性,也決定了應用時的效果。
數(shù)據(jù)在哪里:業(yè)務部門能夠通過數(shù)據(jù)目錄查詢到現(xiàn)有數(shù)據(jù)資產情況以及索引對應的系統(tǒng)表字段,定位權威系統(tǒng)數(shù)據(jù)來源。
數(shù)據(jù)誰負責:在數(shù)據(jù)質量檢核規(guī)則發(fā)現(xiàn)問題時,根據(jù)字段所屬的數(shù)據(jù)資產來確定數(shù)據(jù)質量問題的牽頭整改責任歸屬。
數(shù)據(jù)如何用:精準定位數(shù)據(jù)所在系統(tǒng)/表/字段,提升數(shù)據(jù)提取需求的準確性和效率;打通系統(tǒng)間形成的數(shù)據(jù)孤島,實現(xiàn)編碼規(guī)則等標準的統(tǒng)一規(guī)范、使數(shù)據(jù)互聯(lián)互通。
免責聲明:本公眾號所發(fā)布的文章為本公眾號原創(chuàng),或者是在網絡搜索到的優(yōu)秀文章進行的編輯整理,文章版權歸原作者所有,僅供讀者朋友們學習、參考。對于分享的非原創(chuàng)文章,有些因為無法找到真正來源,如果標錯來源或者對于文章中所使用的圖片、鏈接等所包含但不限于軟件、資料等,如有侵權,請直接聯(lián)系后臺,說明具體的文章,后臺會盡快刪除。給您帶來的不便,深表歉意。
?