CDGA|數(shù)據(jù)資產(chǎn)目錄如何建設(shè)?

數(shù)據(jù)資產(chǎn)目錄的建設(shè)是數(shù)據(jù)治理中重要的一環(huán),創(chuàng)建可訪問的數(shù)據(jù)資產(chǎn)目錄,用戶可以快速發(fā)現(xiàn)數(shù)據(jù)的影響,使其適合企業(yè)業(yè)務(wù)流程并做出更明智的數(shù)據(jù)決策。

那么,數(shù)據(jù)資產(chǎn)目錄該如何建設(shè)呢?
第1步:數(shù)據(jù)資產(chǎn)盤點
數(shù)據(jù)資產(chǎn)盤點是使用科學(xué)的數(shù)據(jù)盤點方法,以“摸清家底”為目標,對企業(yè)的數(shù)據(jù)資源進行統(tǒng)籌規(guī)劃,全面梳理。一方面,從業(yè)務(wù)視角對數(shù)據(jù)資源進行梳理和規(guī)劃;另一方面,從技術(shù)視角對系統(tǒng)數(shù)據(jù)進行盤點,梳理數(shù)據(jù)資產(chǎn)的技術(shù)屬性。
第2步:數(shù)據(jù)資產(chǎn)登記
根據(jù)數(shù)據(jù)盤點結(jié)果,在數(shù)據(jù)資產(chǎn)目錄完成數(shù)據(jù)資產(chǎn)概要信息的登記。數(shù)據(jù)資產(chǎn)登記主要包含三個方面信息:業(yè)務(wù)方面、技術(shù)方面、 管理方面。數(shù)據(jù)資產(chǎn)登記可以采用人工方式或者基于AI的數(shù)據(jù)資產(chǎn)識別。
第3步:采集元數(shù)據(jù)
在登記完數(shù)據(jù)資產(chǎn)基本信息后,接下來關(guān)鍵一步是采集數(shù)據(jù)資產(chǎn)的元數(shù)據(jù)。數(shù)據(jù)資產(chǎn)目錄使用元數(shù)據(jù)來識別數(shù)據(jù)表、文件和數(shù)據(jù)庫。
第4步:標記數(shù)據(jù)關(guān)系
標記關(guān)系是管理數(shù)據(jù)資產(chǎn)的一個重要步驟,通過這一步,用戶可以跨多個數(shù)據(jù)庫發(fā)現(xiàn)相關(guān)數(shù)據(jù)。有了數(shù)據(jù)目錄的幫助,可以構(gòu)建一個實驗區(qū)域,在那里可以連接所有數(shù)據(jù),清理數(shù)據(jù),然后使用合并的客戶數(shù)據(jù)來實現(xiàn)業(yè)務(wù)目標。
第5步:建立血緣關(guān)系
標記關(guān)系后,數(shù)據(jù)目錄會構(gòu)建血緣,。數(shù)據(jù)血緣的可視化表示有助于跟蹤從源到目的地的數(shù)據(jù),它解釋了數(shù)據(jù)流中涉及的不同過程。數(shù)據(jù)分析師能夠根據(jù)數(shù)據(jù)血緣追溯分析中錯誤的根本原因。?第 6 步:數(shù)據(jù)資產(chǎn)組織
采集過來的元數(shù)據(jù)以技術(shù)格式排列,缺少表、列的中文注釋,不利于業(yè)務(wù)人員理解數(shù)據(jù)。這時候需要基于這些技術(shù)元數(shù)據(jù)構(gòu)建語義層,對相關(guān)數(shù)據(jù)表、列進行中文標記,以便業(yè)務(wù)人員能夠發(fā)現(xiàn)、訪問和理解它們。