女朋友試圖以“數(shù)據(jù)孤島”挫敗我,直男怎么可能就范?!

自從筆者用獨特的“男友力”成功壓制住女朋友對“什么是大數(shù)據(jù)”的好奇心之后,女朋友仿佛沒有善罷甘休,并多次以“數(shù)據(jù)孤島”、“數(shù)據(jù)中臺”、“聯(lián)邦學習”等知識點百般刁難于我。
為了掩飾自己不懂裝懂的“心虛”,筆者還是很討巧地回應:
請別用如此簡單的問題“打攪我”,沒看見我在為你烹飪美食!
別來打攪我了,我在幫小仙女打掃衛(wèi)生!
嘀嘀嘀......
事實證明,對于不懂裝懂的我,解決恐懼最好的方式,就是直面恐懼。
于是,我鑿壁偷光、挑燈夜戰(zhàn)、廢寢忘食、宵衣旰食、寒窗苦讀。
終于著成一部秘籍。
傳言大海的另一邊有一塊島嶼,人跡罕至、相對孤立、與世隔絕,我們稱之為孤島。孤島上的植被、天氣、地貌、土壤等重要數(shù)據(jù)相對孤立,引誘充滿好奇心的人們?nèi)ッ半U、去探索。
類似于“世外桃源”,與世隔絕,乃不知有漢,無論魏晉,卻又讓人心生向往。
如今,孤島的概念被用在“大數(shù)據(jù)”之上,衍生出“數(shù)據(jù)孤島”的新名詞,借以形容“數(shù)據(jù)之間缺乏關(guān)聯(lián)性,數(shù)據(jù)庫無法兼容”客觀情況。并且這個狀況廣泛存在于企業(yè)之中。
企業(yè)成立早期,由于人員和業(yè)務的精簡,一般會采用個別的系統(tǒng)來存儲數(shù)據(jù),比如銷售系統(tǒng)、財務系統(tǒng)。
隨著企業(yè)業(yè)務的發(fā)展,企業(yè)采用越來越多的系統(tǒng),比如生產(chǎn)系統(tǒng)、銷售系統(tǒng)、采購系統(tǒng)、訂單系統(tǒng)、財務系統(tǒng)、人力系統(tǒng)等。
這些企業(yè)發(fā)展到一定階段,數(shù)據(jù)量持續(xù)龐大,并存放于多個不同的系統(tǒng)/部門之中,數(shù)據(jù)各自存儲、各自定義。每個系統(tǒng)/部門的數(shù)據(jù)就像一個個孤島一樣無法和企業(yè)內(nèi)部的其他數(shù)據(jù)進行連接互動。
這就造成數(shù)據(jù)孤島問題。
近期熱播的《大秦賦》中,齊、楚、燕、韓、趙、魏、秦等七國彼此之間的主權(quán)、領(lǐng)土、經(jīng)濟、文化、社會等數(shù)據(jù)相對獨立,經(jīng)過征伐、通婚、連橫等“打通數(shù)據(jù)”方略,七國不斷融合、連接與互動。
最終,在秦王政的帶領(lǐng)下,書同文、車同軌、行同倫、統(tǒng)一度量衡等開放API接口方法,讓天下大一統(tǒng),政治、經(jīng)濟、文化、人口、土地等數(shù)據(jù)融合!
事實上,數(shù)據(jù)孤島分為物理性、邏輯性兩種。數(shù)據(jù)在不同部門獨立存儲、維護,相互孤立,形成物理上的孤島。不同部門站在自己的角度對數(shù)據(jù)理解和定義,使一些相同的數(shù)據(jù)被賦予了不同的含義,形成邏輯上的孤島。
假如某電商平臺部門之間數(shù)據(jù)不通,那經(jīng)常購買母嬰用品而不購買電子產(chǎn)品的筆者,對母嬰部門來講是有意義的,對電子產(chǎn)品來講是沒有意義的。
是什么導致信息孤島的產(chǎn)生?
首先,企業(yè)以部門為主的功能型工作,使得每個部門都有業(yè)務數(shù)據(jù)產(chǎn)生,所以各部門之間的數(shù)據(jù)不能互通。
其次,如果信息部門不能盡快滿足業(yè)務對數(shù)據(jù)處理的要求,那業(yè)務部門就可能獨自開發(fā)業(yè)務系統(tǒng)。
最后,缺少企業(yè)內(nèi)信息化建設的戰(zhàn)略和標準,如果不能做到信息系統(tǒng)建設的統(tǒng)一,由不同部門,不同公司來建設的話,必須有一個標準能夠使得日后的互通比較容易實現(xiàn)。
長遠來看,數(shù)據(jù)孤島將掣肘企業(yè)業(yè)務的發(fā)展。
為了解決、緩解數(shù)據(jù)孤島,或企業(yè)內(nèi)部、或大數(shù)據(jù)公司都有所嘗試,比如開放API接口、建立數(shù)據(jù)集成框架、聯(lián)邦學習、數(shù)據(jù)中臺等。
數(shù)據(jù)集成框架促成各應用系統(tǒng)之間實現(xiàn)數(shù)據(jù)共享和數(shù)據(jù)交換,主要包括建設數(shù)據(jù)接口統(tǒng)一管理系統(tǒng)、梳理現(xiàn)有數(shù)據(jù)集成情況,將在建的業(yè)務系統(tǒng)集成到數(shù)據(jù)集成框架中。
簡言之,數(shù)據(jù)集成框架是建立一個統(tǒng)一的管理系統(tǒng),將企業(yè)現(xiàn)有業(yè)務系統(tǒng)進行集成。
聯(lián)邦學習主要用在人工智能領(lǐng)域,我們知道,機器學習需要大量的、跨行業(yè)的大數(shù)據(jù),礙于數(shù)據(jù)孤島,機器學習需要精進技能。既然數(shù)據(jù)不挪動,那就得挪動算法模型。
聯(lián)邦學習大抵的工作步驟如下:
1.用戶A、B、C各自使用粗糙模型進行訓練得到參數(shù)W。
2.用戶A、B、C在本地對算法模型參數(shù)W進行加密得到MW。
3.用戶A、B、C上傳加密模型MW。
4.服務器使用同態(tài)加密算法整合加密模型。
5.將更新后的MW下發(fā)到用戶A、B、C。
6.用戶A、B、C使用各自的秘鑰解鎖更新自己的W,得到更精確的算法模型。
數(shù)據(jù)沒動,但模型更精確了!
數(shù)據(jù)中臺是由阿里提出來的,馬云先生曾這樣定義數(shù)據(jù)中臺:“企業(yè)的發(fā)展,往往伴隨著業(yè)務更多元化,而與此同時企業(yè)在積極推進業(yè)務數(shù)據(jù)化,因此越來越多的企業(yè)伴隨著各個垂直業(yè)務的發(fā)展,形成了一個個垂直的數(shù)據(jù)中心,數(shù)據(jù)中臺是為了打通這些數(shù)據(jù)并且以統(tǒng)一的標準進行建設,以達到技術(shù)降本、應用提效、業(yè)務賦能的目標”。
目前,數(shù)據(jù)中臺并沒有明確的定義,并且數(shù)據(jù)中臺與云、數(shù)字化轉(zhuǎn)型聯(lián)系緊密,因此數(shù)據(jù)中臺被賦予厚望。
當我把一切陳述出來,猛灌兩杯水之后。
女朋友冷不丁的來了一句:
數(shù)據(jù)孤島就像是咱們倆人,你不說有多少私房錢,我永遠不知道。
要不咱們聯(lián)邦學習一下?
女朋友試圖以“數(shù)據(jù)孤島”挫敗我,直男怎么可能就范?!的評論 (共 條)
