博睿學(xué)院 | 本周四:ETL技術(shù)在數(shù)據(jù)標(biāo)準(zhǔn)化中的應(yīng)用實踐
隨著當(dāng)前數(shù)據(jù)環(huán)境的愈發(fā)復(fù)雜,建設(shè)數(shù)據(jù)中臺,構(gòu)建出一個高效、可靠、安全、可擴(kuò)展的數(shù)據(jù)共享平臺,實現(xiàn)數(shù)據(jù)在企業(yè)內(nèi)部的共享、交換、加工、挖掘和應(yīng)用,已成為企業(yè)推進(jìn)數(shù)據(jù)流動與融合,實現(xiàn)數(shù)據(jù)價值的必經(jīng)之路。
如何打破數(shù)孤島,實現(xiàn)數(shù)據(jù)互聯(lián),博睿學(xué)院邀請中臺能力研發(fā)團(tuán)隊負(fù)責(zé)人羅俊就數(shù)據(jù)集成進(jìn)行公開課分享。
本周四14:30羅俊將對數(shù)據(jù)集成技術(shù)中關(guān)于ETL(數(shù)據(jù)抽取、轉(zhuǎn)換、加載)相關(guān)內(nèi)容進(jìn)行課程講解。

由于開發(fā)時間或開發(fā)部門的不同,往往有多個異構(gòu)的、運行在不同的軟硬件平臺上的信息系統(tǒng)同時運行,這些系統(tǒng)的數(shù)據(jù)源彼此獨立、相互封閉,使得數(shù)據(jù)難以在系統(tǒng)之間交流、共享和融合,從而形成了"信息孤島"。此外,還有來自開放標(biāo)準(zhǔn)的平臺數(shù)據(jù),其他廠商采集的數(shù)據(jù)、用戶個性化數(shù)據(jù)等多種數(shù)據(jù)源。面對這些格式、粒度、結(jié)構(gòu)不一的數(shù)據(jù)。由此帶來數(shù)據(jù)質(zhì)量不高、分析成本昂貴的問題。
原始數(shù)據(jù)須經(jīng)過ETL處理,才能用于后續(xù)的分析挖掘工作。讓所有的數(shù)據(jù)可以通過統(tǒng)一的邏輯進(jìn)行查詢和展示,為實現(xiàn)深度分析提供有效支撐。
此外,由于數(shù)據(jù)來源的業(yè)務(wù)系統(tǒng)處于不斷地更新維護(hù)中,這些變更也將對下游數(shù)據(jù)分析程序產(chǎn)生巨大的影響。而ETL過程作為一個緩沖區(qū),當(dāng)上游的業(yè)務(wù)系統(tǒng)變更時,通過對ETL過程進(jìn)行相應(yīng)變更,即可保持下游的數(shù)據(jù)分析的相對穩(wěn)定,從而降低系統(tǒng)維護(hù)成本。
更多ETL相關(guān)知識,歡迎掃描二維碼預(yù)約觀看直播

在上一期課程中,博睿數(shù)據(jù)羅俊就數(shù)據(jù)中臺賦能業(yè)務(wù)決策相關(guān)內(nèi)容進(jìn)行了分享,對如何在數(shù)據(jù)中臺進(jìn)行一體化、分層設(shè)計、高并發(fā)、高性能、高可用的架構(gòu)設(shè)計,為企業(yè)提供數(shù)據(jù)管理能力滿足各個業(yè)務(wù)部門和業(yè)務(wù)場景的需求的相關(guān)內(nèi)容進(jìn)行了講解。
直播回放請關(guān)注公眾號,點擊菜單欄“資源中心-直播回放”。
博睿學(xué)院數(shù)據(jù)集成系列公開課4月課程預(yù)約通道已開啟,歡迎掃描下圖二維碼預(yù)約,課后將發(fā)送課程資料到您的郵箱。
