CDGA|做好數(shù)據(jù)質(zhì)量管理的十條最佳實(shí)踐

數(shù)據(jù)質(zhì)量管理是所有數(shù)據(jù)類(lèi)項(xiàng)目重點(diǎn)關(guān)注的領(lǐng)域,從20多年前的數(shù)據(jù)倉(cāng)庫(kù)到如今的數(shù)據(jù)湖、數(shù)據(jù)中臺(tái),企業(yè)都試圖將通過(guò)對(duì)改善數(shù)據(jù)質(zhì)量來(lái)提升數(shù)據(jù)的價(jià)值。
但是在追求新技術(shù)、新概念的過(guò)程中不能盲目,更不能過(guò)度迷信平臺(tái)和工具。
數(shù)據(jù)項(xiàng)目還是應(yīng)該回歸到其本質(zhì)上來(lái),那就是提高數(shù)據(jù)質(zhì)量,提升數(shù)據(jù)價(jià)值。?

關(guān)于如何做好數(shù)據(jù)質(zhì)量的管理,以下有10條最佳實(shí)踐,希望對(duì)您有所啟發(fā)。
1、對(duì)其業(yè)務(wù)目標(biāo)
?
企業(yè)的數(shù)據(jù)治理不是為治理數(shù)據(jù)而治理數(shù)據(jù),背后都是為了支持業(yè)務(wù)和管理目標(biāo)的實(shí)現(xiàn)。提升數(shù)據(jù)質(zhì)量的主要目的是推動(dòng)業(yè)務(wù)發(fā)展:
(1)將企業(yè)的業(yè)務(wù)目標(biāo)映射到數(shù)據(jù)質(zhì)量管理計(jì)劃中來(lái)。
(2)讓業(yè)務(wù)人員深度參與甚至主導(dǎo)數(shù)據(jù)質(zhì)量管理,作為該數(shù)據(jù)主要用戶(hù)的業(yè)務(wù)部門(mén)可以更好地定義數(shù)據(jù)質(zhì)量參數(shù)。
(3)將業(yè)務(wù)問(wèn)題定義清楚,只有在業(yè)務(wù)問(wèn)題定義清楚之后,才能分析出數(shù)據(jù)質(zhì)量問(wèn)題的根本原因,以及制定出更合理的解決方案。
?
2、評(píng)估數(shù)據(jù)質(zhì)量
?
(1)數(shù)據(jù)質(zhì)量評(píng)估以數(shù)據(jù)質(zhì)量問(wèn)題對(duì)業(yè)務(wù)的影響分析為指導(dǎo),清楚的定義出待評(píng)估數(shù)據(jù)的范圍和優(yōu)先級(jí)等重要參數(shù)。
(2)采用自上而下和自下而上相結(jié)合的策略識(shí)別數(shù)據(jù)中的異常問(wèn)題。自上而下是以業(yè)務(wù)目標(biāo)為出發(fā)點(diǎn),對(duì)待評(píng)估的數(shù)據(jù)集進(jìn)行評(píng)估和衡量。自下而上的方法是基于數(shù)據(jù)概要分析,識(shí)別數(shù)據(jù)問(wèn)題并將其映射到對(duì)業(yè)務(wù)目標(biāo)的潛在影響。
(3)形成數(shù)據(jù)治理評(píng)估報(bào)告,通過(guò)該報(bào)告清楚列出數(shù)據(jù)質(zhì)量的評(píng)估結(jié)果,該報(bào)告可以在利益相關(guān)者,決策者之間分發(fā),從而推動(dòng)數(shù)據(jù)質(zhì)量改進(jìn)行動(dòng)。
3、分析根本原因
?
要做好數(shù)據(jù)質(zhì)量的管理,應(yīng)抓住影響數(shù)據(jù)質(zhì)量的關(guān)鍵因素,設(shè)置質(zhì)量管理點(diǎn)或質(zhì)量控制點(diǎn),從數(shù)據(jù)的源頭抓起,從根本上解決數(shù)據(jù)質(zhì)量問(wèn)題。對(duì)于數(shù)據(jù)質(zhì)量問(wèn)題采用量化管理機(jī)制,分等級(jí)和優(yōu)先級(jí)進(jìn)行管理,嚴(yán)重的數(shù)據(jù)質(zhì)量問(wèn)題或數(shù)據(jù)質(zhì)量事件可以升級(jí)為故障,并對(duì)故障進(jìn)行定義、等級(jí)劃分、預(yù)置處理方案和Review。
4、制定解決方案
?
企業(yè)數(shù)據(jù)質(zhì)量的治理需要結(jié)合數(shù)據(jù)問(wèn)題對(duì)業(yè)務(wù)的影響程度以及數(shù)據(jù)問(wèn)題發(fā)生的根本原因制定數(shù)據(jù)質(zhì)量管理的解決方案。明確數(shù)據(jù)質(zhì)量的改進(jìn)目標(biāo),制定數(shù)據(jù)質(zhì)量問(wèn)題處理策略,并立即付諸行動(dòng)。?
5、控制數(shù)據(jù)質(zhì)量
?
數(shù)據(jù)質(zhì)量控制是在企業(yè)的數(shù)據(jù)環(huán)境中設(shè)置一道數(shù)據(jù)質(zhì)量的“防火墻”,以預(yù)防不良數(shù)據(jù)的發(fā)生。
數(shù)據(jù)質(zhì)量“防火墻”就是根據(jù)數(shù)據(jù)問(wèn)題的根因分析和問(wèn)題處理策略,在發(fā)生數(shù)據(jù)問(wèn)題的入口點(diǎn)設(shè)置的數(shù)據(jù)問(wèn)題測(cè)量和監(jiān)控程序,在數(shù)據(jù)環(huán)境的源頭或者上游進(jìn)行數(shù)據(jù)問(wèn)題的防治,從而避免不良數(shù)據(jù)向下游傳播并污染后續(xù)的存儲(chǔ),進(jìn)而影響業(yè)務(wù)。
6、糾正數(shù)據(jù)問(wèn)題
?
盡管有效數(shù)據(jù)質(zhì)量控制可以在很大程度上起到控制和預(yù)防不良數(shù)據(jù)發(fā)生的作用,但事實(shí)上,再?lài)?yán)格的質(zhì)量控制也無(wú)法做到100%數(shù)據(jù)問(wèn)題防治,甚至有時(shí)候嚴(yán)格的數(shù)據(jù)質(zhì)量控制還會(huì)引出其他更多的數(shù)據(jù)問(wèn)題。
因此,企業(yè)還需要不時(shí)進(jìn)行主動(dòng)的數(shù)據(jù)清理和處理補(bǔ)救,以糾正現(xiàn)有的數(shù)據(jù)問(wèn)題。?? ???
?
7、組織體系保障
?
企業(yè)需要建立一種文化,以讓更多的人認(rèn)識(shí)到數(shù)據(jù)質(zhì)量的重要性,這離不開(kāi)組織體系的保障。
建立數(shù)據(jù)質(zhì)量管理的組織體系并為具有適當(dāng)技能的人員分配角色以確保數(shù)據(jù)質(zhì)量。
在整個(gè)企業(yè)中實(shí)施數(shù)據(jù)質(zhì)量管理時(shí),應(yīng)考慮以下角色:數(shù)據(jù)治理委員會(huì)、數(shù)據(jù)分析師、數(shù)據(jù)管理員。?
?
8、質(zhì)量考核體系
?
數(shù)據(jù)質(zhì)量考核建立數(shù)據(jù)質(zhì)量KPI,通過(guò)專(zhuān)項(xiàng)考核計(jì)分的方式對(duì)各企業(yè)各業(yè)務(wù)域、各部門(mén)的數(shù)據(jù)質(zhì)量管理情況進(jìn)行評(píng)估。
以數(shù)據(jù)質(zhì)量的評(píng)估結(jié)果為依據(jù),并將問(wèn)題數(shù)據(jù)歸結(jié)到相應(yīng)的分類(lèi),并按所在分類(lèi)的權(quán)值進(jìn)行量化。
總結(jié)發(fā)生數(shù)據(jù)質(zhì)量問(wèn)題的規(guī)律,利用數(shù)據(jù)質(zhì)量管理工具定期對(duì)數(shù)據(jù)質(zhì)量進(jìn)行監(jiān)控和測(cè)量,及時(shí)發(fā)現(xiàn)存在的數(shù)據(jù)質(zhì)量問(wèn)題,并督促落實(shí)改正。?
?
9、先進(jìn)技術(shù)賦能
?
數(shù)據(jù)質(zhì)量管理的速度必須與數(shù)據(jù)生成的速度相匹配才能保證干凈、完整、可靠、一致的數(shù)據(jù)。
傳統(tǒng)的數(shù)據(jù)質(zhì)量方法很難實(shí)現(xiàn)這一結(jié)果,但先進(jìn)的現(xiàn)代技術(shù)為數(shù)據(jù)質(zhì)量管理提供了更好的解決方案。
我們可以利用機(jī)器學(xué)習(xí)技術(shù)來(lái)進(jìn)行數(shù)據(jù)質(zhì)量的監(jiān)控,評(píng)分和改善數(shù)據(jù)質(zhì)量,以應(yīng)對(duì)不斷增加的數(shù)據(jù)速度和日趨復(fù)雜的數(shù)據(jù)環(huán)境等挑戰(zhàn)。??
?
10、在數(shù)據(jù)生命周期中關(guān)注數(shù)據(jù)質(zhì)量
?
數(shù)據(jù)的生命周期從數(shù)據(jù)規(guī)劃開(kāi)始,中間是一個(gè)包括設(shè)計(jì)、創(chuàng)建、處理、部署、應(yīng)用、監(jiān)控、存檔、銷(xiāo)毀這幾個(gè)階段并不斷循環(huán)的過(guò)程。企業(yè)的數(shù)據(jù)質(zhì)量管理應(yīng)貫穿數(shù)據(jù)生命周期的全過(guò)程。??
數(shù)據(jù)質(zhì)量管理需要的是工匠精神,需要不斷地對(duì)企業(yè)擁有的數(shù)據(jù)進(jìn)行反復(fù)“打磨”,循環(huán)迭代,將數(shù)據(jù)治理“常態(tài)化”,而不是指望實(shí)施一個(gè)項(xiàng)目就能實(shí)現(xiàn)數(shù)據(jù)質(zhì)量的百分百提升。