SQL Server Analysis Services數(shù)據(jù)挖掘聚類(lèi)分析職業(yè)、地區(qū)、餐飲消費(fèi)水平數(shù)據(jù)
全文鏈接:http://tecdat.cn/?p=31887
原文出處:拓端數(shù)據(jù)部落公眾號(hào)
本文通過(guò) SQL Server Analysis Services數(shù)據(jù)挖掘的分析模塊,幫助客戶對(duì)一個(gè)職業(yè)、地區(qū)、餐飲消費(fèi)水平的數(shù)據(jù)挖掘,并用可視化分析圖表顯示數(shù)據(jù)。該結(jié)果可為餐飲業(yè)的管理者提供決策依據(jù),進(jìn)而使餐飲企業(yè)獲得更多利潤(rùn)。同時(shí),挖掘出與該職業(yè)相對(duì)應(yīng)的地區(qū)及消費(fèi)水平,可以為職業(yè)發(fā)展規(guī)劃、餐飲市場(chǎng)的開(kāi)拓提供有效依據(jù)。
準(zhǔn)備工作:數(shù)據(jù).xls?數(shù)據(jù)導(dǎo)入數(shù)據(jù)庫(kù)中。
將表格命名
在相應(yīng)數(shù)據(jù)庫(kù)中找到對(duì)應(yīng)的數(shù)據(jù)
商業(yè)智能項(xiàng)目
選擇商業(yè)智能項(xiàng)目,analysis?services項(xiàng)目,并選擇目標(biāo)文件夾
在解決方案資源管理器中,右鍵單擊數(shù)據(jù)源,選擇新建數(shù)據(jù)源
在解決方案資源管理器中,右鍵單擊挖掘結(jié)構(gòu),選擇新建挖掘結(jié)構(gòu)
設(shè)置輸入數(shù)據(jù)與鍵Id
設(shè)置訓(xùn)練集和測(cè)試集的百分比
點(diǎn)擊部署模型
看到右下角 部署完成
查看結(jié)果
從聚類(lèi)結(jié)果可以看到,聚類(lèi)將所有用戶分成了2個(gè)聚類(lèi)結(jié)果。
從不同類(lèi)別的依賴(lài)圖可以看到,類(lèi)別10、4、8、6、7、5之間具有較強(qiáng)的相關(guān)關(guān)系。說(shuō)明這幾個(gè)類(lèi)別中的變量特征是類(lèi)似的。下面可以具體看下每個(gè)類(lèi)別中的各個(gè)屬性的分布的比例。
另外一個(gè)聚類(lèi)中,1、2、9為一個(gè)聚類(lèi)簇,說(shuō)明這幾類(lèi)別中的變量特征類(lèi)似。
同時(shí)可以看到每個(gè)變量再每個(gè)類(lèi)別中的分布情況
可以看到消費(fèi)水平很低的樣本主要分布在分類(lèi)10中
從上圖可以看到 餐飲消費(fèi)水平較高的類(lèi)別是1,2,9類(lèi)別中。
下面可以看到各個(gè)分類(lèi)的剖面圖
?可以看到每個(gè)分類(lèi)中各個(gè)level所占的比例。西餐主要分布在分類(lèi)1、2中。拍檔主要分布在分類(lèi)6、10中。
年齡的分布也非常明顯。大多數(shù)分布在26歲左右,分類(lèi)10的樣本年齡最大。同時(shí)可以看到分類(lèi)1 和9 的收入最高,同時(shí)他們常去的餐廳類(lèi)型為西餐。同時(shí)可以看到所在城市在分類(lèi)3中主要是通遼和根河市。他們主要去的餐廳類(lèi)型是中餐和排檔。在分類(lèi)9中,可以看到醫(yī)生職業(yè)的樣本主要去的也是中餐類(lèi)型。分類(lèi)1中可以看到,去西餐的樣本主要是少了的醫(yī)生。
然后可以看到總體的分類(lèi)特征。最常去的餐廳類(lèi)型為中餐,其次是西餐。年收入最多的區(qū)間是51900到67000之間。餐飲消費(fèi)在10元到18元之間。樣本的主要年齡段在20歲到25歲。所在城市主要為根河市,其次是烏蘭浩特。樣本的職業(yè)中,最多的是客服專(zhuān)員。
從每個(gè)類(lèi)別的傾向程度來(lái)看,分類(lèi)1中,主要的樣本區(qū)的是西餐餐廳。每次的消費(fèi)在20到30元之間。年收入在8萬(wàn)到12萬(wàn)之間,說(shuō)明這些樣本的收入較高。其中,行政主管所占的百分比較高。有少量的創(chuàng)意總監(jiān)。
從每個(gè)類(lèi)別的傾向程度來(lái)看,分類(lèi)1中,主要的樣本區(qū)的是西餐餐廳。他們所在的城市主要在鄂爾多斯。
?
從每個(gè)類(lèi)別的傾向程度來(lái)看,分類(lèi)3中,主要的樣本收入在3萬(wàn)3到3萬(wàn)6之間。他們的職業(yè)主要是文案策劃,常去的餐廳為非西餐餐廳。
從每個(gè)類(lèi)別的傾向程度來(lái)看,分類(lèi)4中,主要的樣本區(qū)的是中餐餐廳。主要的職業(yè)為市場(chǎng)總監(jiān)。
從每個(gè)類(lèi)別的傾向程度來(lái)看,分類(lèi)5中,主要的樣本區(qū)的是中餐餐廳。 主要的職業(yè)為電工和電話銷(xiāo)售以及教師。
從每個(gè)類(lèi)別的傾向程度來(lái)看,分類(lèi)6中,主要的樣本去的是排擋餐廳。 主要的職業(yè)為學(xué)生和服務(wù)員及會(huì)計(jì)師。該群體大部分收入較低或者沒(méi)有收入。因此每次的餐廳消費(fèi)也較低。
最受歡迎的見(jiàn)解
1.R語(yǔ)言k-Shape算法股票價(jià)格時(shí)間序列聚類(lèi)
2.R語(yǔ)言基于溫度對(duì)城市層次聚類(lèi)、kmean聚類(lèi)、主成分分析和Voronoi圖
3.R語(yǔ)言對(duì)用電負(fù)荷時(shí)間序列數(shù)據(jù)進(jìn)行K-medoids聚類(lèi)建模和GAM回歸
4.r語(yǔ)言鳶尾花iris數(shù)據(jù)集的層次聚類(lèi)
5.Python Monte Carlo K-Means聚類(lèi)實(shí)戰(zhàn)
6.用R進(jìn)行網(wǎng)站評(píng)論文本挖掘聚類(lèi)
7.R語(yǔ)言KMEANS均值聚類(lèi)和層次聚類(lèi):亞洲國(guó)家地區(qū)生活幸福質(zhì)量異同可視化
8.PYTHON用戶流失數(shù)據(jù)挖掘:建立邏輯回歸、XGBOOST、隨機(jī)森林、決策樹(shù)、支持向量機(jī)、樸素貝葉斯模型和KMEANS聚類(lèi)用戶畫(huà)像
9.R語(yǔ)言基于Keras的小數(shù)據(jù)集深度學(xué)習(xí)圖像分類(lèi)