數(shù)據(jù)挖掘,在商業(yè)智能BI領(lǐng)域的運(yùn)用
數(shù)據(jù)挖掘在商業(yè)領(lǐng)域,特別是在零售業(yè)的運(yùn)用是比較成功的。由于各業(yè)務(wù)系統(tǒng)的普遍使用,再加上商業(yè)智能BI的可視化分析,企業(yè)可以收集到大量關(guān)于購買情況的數(shù)據(jù),并且數(shù)據(jù)量在不斷激增。利用數(shù)據(jù)挖掘技術(shù)可以為經(jīng)營管理人員提供正確的決策手段,這樣對促進(jìn)銷售及提高競爭力是有幫助的。
一、什么是數(shù)據(jù)挖掘
所站立場不同,對數(shù)據(jù)挖掘的定義也是不一樣的。
1. 技術(shù)上的定義
數(shù)據(jù)挖掘(Data Mining)就是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。?

2. 商業(yè)角度的定義
數(shù)據(jù)挖掘是一種新的商業(yè)信息處理技術(shù),其主要特點(diǎn)是對商業(yè)數(shù)據(jù)庫中的大量業(yè)務(wù)數(shù)據(jù)進(jìn)行抽取、轉(zhuǎn)換、分析和其他模型化處理,從中提取輔助商業(yè)決策的關(guān)鍵性數(shù)據(jù)。
因此,數(shù)據(jù)挖掘可以描述為:按企業(yè)既定業(yè)務(wù)目標(biāo),對大量的企業(yè)數(shù)據(jù)進(jìn)行探索和分析,揭示隱藏的、未知的或驗(yàn)證已知的規(guī)律性,并進(jìn)一步將其模型化的先進(jìn)有效的方法。
二、數(shù)據(jù)挖掘的分類
數(shù)據(jù)挖掘分為有指導(dǎo)的數(shù)據(jù)挖掘和無指導(dǎo)的數(shù)據(jù)挖掘。有指導(dǎo)的數(shù)據(jù)挖掘是利用可用的數(shù)據(jù)建立一個(gè)模型,這個(gè)模型是對一個(gè)特定屬性的描述。無指導(dǎo)的數(shù)據(jù)挖掘是在所有的屬性中尋找某種關(guān)系。具體而言,分類、估值和預(yù)測屬于有指導(dǎo)的數(shù)據(jù)挖掘;關(guān)聯(lián)規(guī)則和聚類屬于無指導(dǎo)的數(shù)據(jù)挖掘。?

分類
它首先從數(shù)據(jù)中選出已經(jīng)分好類的訓(xùn)練集,在該訓(xùn)練集上運(yùn)用數(shù)據(jù)挖掘技術(shù),建立一個(gè)分類模型,再將該模型用于對沒有分類的數(shù)據(jù)進(jìn)行分類。?
估值
估值與分類類似,但估值最終的輸出結(jié)果是連續(xù)型的數(shù)值,估值的量并非預(yù)先確定。估值可以作為分類的準(zhǔn)備工作。?
預(yù)測
它是通過分類或估值來進(jìn)行,通過分類或估值的訓(xùn)練得出一個(gè)模型,如果對于檢驗(yàn)樣本組而言該模型具有較高的準(zhǔn)確率,可將該模型用于對新樣本的未知變量進(jìn)行預(yù)測。?
關(guān)聯(lián)
關(guān)聯(lián)的目的是發(fā)現(xiàn)某些事情總是一起發(fā)生。?
聚類
它是自動尋找并建立分組規(guī)則的方法,它通過判斷樣本之間的相似性,把相似樣本劃分在一個(gè)簇中。
三、數(shù)據(jù)分析和數(shù)據(jù)挖掘的區(qū)別
數(shù)據(jù)分析,是用適當(dāng)?shù)慕y(tǒng)計(jì)方法對收集的海量數(shù)據(jù)進(jìn)行分析、提取有用的信息和形成結(jié)論,然后對數(shù)據(jù)加以詳細(xì)研究和概括總結(jié)的過程。
數(shù)據(jù)挖掘,是從海量的數(shù)據(jù)中通過相應(yīng)的算法,挖掘其中有價(jià)值(未知的、有規(guī)律的)的信息的復(fù)雜過程。?

數(shù)據(jù)挖掘是深層次的數(shù)據(jù)分析,數(shù)據(jù)分析是淺層次的數(shù)據(jù)挖掘,數(shù)據(jù)挖掘更偏重于探索性數(shù)據(jù)分析,因?yàn)閿?shù)據(jù)挖掘的重點(diǎn)是從數(shù)據(jù)中發(fā)現(xiàn)知識規(guī)律。
四、應(yīng)用領(lǐng)域
搜索引擎:數(shù)據(jù)挖掘技術(shù)應(yīng)用到搜索引擎領(lǐng)域,從而產(chǎn)生智能搜索引擎,將會給用戶提供一個(gè)高效、準(zhǔn)確的檢索工具。
金融領(lǐng)域:可以利用數(shù)據(jù)挖掘?qū)蛻粜抛u(yù)進(jìn)行分析。典型的金融分析領(lǐng)域有投資評估和股票交易市場預(yù)測。

數(shù)據(jù)挖掘還可用于工業(yè)、農(nóng)業(yè)、交通、電信、軍事、互聯(lián)網(wǎng)等其它行業(yè)。數(shù)據(jù)挖掘具有廣泛的應(yīng)用前景,它既可應(yīng)用于決策支持,也可用于數(shù)據(jù)庫管理系統(tǒng)中。
隨著近些年數(shù)字經(jīng)濟(jì)的快速增長,有關(guān)數(shù)字和數(shù)據(jù)的新名詞成為了世界范圍內(nèi)的熱點(diǎn)詞匯。企業(yè)想要在數(shù)字時(shí)代增強(qiáng)競爭力,就要善用企業(yè)的數(shù)據(jù)資產(chǎn),一方面是自身的改革發(fā)展,另一方面也有著引領(lǐng)其它企業(yè)數(shù)字化轉(zhuǎn)型。
?