關(guān)于數(shù)據(jù)倉庫那點事,一文捋清
借助海量的數(shù)據(jù),企業(yè)進行了深層次的數(shù)字化改革,把數(shù)據(jù)當成了企業(yè)發(fā)展的核心,但無效的數(shù)據(jù)即使規(guī)模再大,也對企業(yè)沒有意義,所以數(shù)據(jù)質(zhì)量也就愈發(fā)重要。
數(shù)據(jù)倉庫
事實上,很多人在看到數(shù)據(jù)倉庫的第一眼,就把數(shù)據(jù)倉庫當成了數(shù)據(jù)庫。當然這也很正常,畢竟從名字來看這兩者確實區(qū)別不大,真正區(qū)分兩者的是定位、作用等更深一層的東西。不過在這里還是先解釋數(shù)據(jù)倉庫的概念,不同之處后邊會進行詳細講解。
數(shù)據(jù)倉庫是一個面向主題的、集成的、隨時間變化但信息本身相對穩(wěn)定的數(shù)據(jù)集合,用于支持管理決策過程。其本質(zhì)就是完成從面向業(yè)務(wù)過程數(shù)據(jù)的組織管理到面向業(yè)務(wù)分析數(shù)據(jù)的組織和管理的轉(zhuǎn)變過程,也是商業(yè)智能BI中數(shù)據(jù)倉庫的主要作用。
?

數(shù)據(jù)倉庫就像企業(yè)的總的大倉庫,能夠存儲不同來源、不同格式的數(shù)據(jù),并且可以通過ETL和數(shù)據(jù)模型,對數(shù)據(jù)進行高質(zhì)量的篩選,分級分類進行存儲。具有很強的穩(wěn)定性,不會頻繁的進行增刪改等操作,能夠反應(yīng)歷史變化。
用通俗的話來說就是數(shù)據(jù)倉庫就像一個終端的大倉庫,其他小倉庫的各種貨品會通過各種方式統(tǒng)一存儲到這里,然后通過倉庫位置的劃分、貨品的擺放進行歸納分類,實現(xiàn)規(guī)范、標準的從存放,到分類,再到使用的完整過程。
數(shù)倉主題域是什么
讓我們來看看百度上的定義,數(shù)倉主題域是指將業(yè)務(wù)對象高度概括的概念層次歸類,目的是便于數(shù)據(jù)的管理和應(yīng)用。
其實說白了,數(shù)據(jù)倉庫主題域就是把那些關(guān)聯(lián)緊密但不同的數(shù)據(jù)主題,交匯融合到一個更大的主題域當中,讓他們能夠憑借相通點更完善的儲存在數(shù)倉中,也更容易被分析人員調(diào)取利用。
同樣,為了方便理解,舉個例子,一名顧客通過手機在APP上購買了一件衣服,在這個過程中涉及到了顧客主題、庫存主題、產(chǎn)品主題、訂單主題等,這些主題雖然不同但因為關(guān)系緊密可以融入到一個更大的主題域。
更簡單粗暴點理解,主題就是主題域的子集。
如何劃分主題域
就和多個主題組合成主題域一樣,主題域自然也能進一步地分解、細化為不同的主題,這些主題也可以再次分解,產(chǎn)生更多的“小主題”,直到觸及業(yè)務(wù)流程才不能再繼續(xù)劃分。
?

在企業(yè)實際搭建數(shù)據(jù)倉庫時,一般都是把一個比較深層的主題或部分主題當做核心,圍繞它來進行建設(shè)。這種建設(shè)方式因為涉及到主題的選擇,必須先由最終用戶和數(shù)據(jù)倉庫建設(shè)人員共同確認主題域,然后繼續(xù)完成搭建過程。
進行劃分主題域時需要數(shù)倉建設(shè)人員了解業(yè)務(wù)流程,通過總結(jié)和分析清楚各個不同的業(yè)務(wù)流程都有哪些業(yè)務(wù)活動參與其中。
劃分主題域的方法有很多,不同企業(yè)采取的方法也有所不同,總的來說,用得最多的有下面幾種。
1.按照業(yè)務(wù)系統(tǒng)劃分
因為大部分企業(yè)都已經(jīng)經(jīng)歷過了信息化建設(shè)或者正處于信息化建設(shè)當中,企業(yè)各種業(yè)務(wù)系統(tǒng)都已經(jīng)部署完成,財務(wù)部門有財務(wù)系統(tǒng)、銷售部門有銷售系統(tǒng)、生產(chǎn)部門有生產(chǎn)系統(tǒng)、供應(yīng)鏈部門有供應(yīng)鏈系統(tǒng)......
這些不同的業(yè)務(wù)系統(tǒng),因為只會儲存對應(yīng)業(yè)務(wù)流程中產(chǎn)生的數(shù)據(jù),下級數(shù)據(jù)主題都互相緊貼,是天然的主題域,業(yè)務(wù)系統(tǒng)有幾種,就可以劃分為幾種主題域。
?

2.按照需求劃分
很多時候,企業(yè)需要長期對某個方向進行分析,因為這個長期分析的過程涉及到各種主題,會對數(shù)據(jù)進行細分、歸納,在這個過程中,就由需求誕生了主題域。
就拿銷售分析來說,這個分析過程會涉及到的對象有產(chǎn)品、倉庫、經(jīng)銷商、顧客等,其中每一個分析對象就是一個數(shù)倉主題,而包含歸納這些主題的銷售分析就成為了一個相應(yīng)的主題域。
?

3.按照功能劃分
在現(xiàn)代社會,軟件是每個加入互聯(lián)網(wǎng)的網(wǎng)民都會使用到的東西,這些由企業(yè)開發(fā)的軟件擁有著不同的功能模塊,比如說社交軟件中就會有聊天、朋友圈、群聊、發(fā)送文件等功能。
從這些功能中選一個模塊,聊天模塊會涉及到數(shù)據(jù)倉庫中的用戶主題、圖片主題、文字主題等,所以聊天模塊也能被歸納為聊天主題域。
?

4.按照部門劃分
現(xiàn)代企業(yè)都有著不同的業(yè)務(wù)部門,這些部門也會形成各種不同的主題域,比如說銷售域、生產(chǎn)域、財務(wù)域等,而這些主題域也是由不同的數(shù)據(jù)主題組成的。
?
