數(shù)據(jù)分析+數(shù)據(jù)挖掘告訴你:電商銷售額與哪些因素有關(guān)?

轟轟烈烈的“雙十一大戰(zhàn)”剛剛落下帷幕。作為電商行業(yè)一年一度的“大戰(zhàn)”,各家電商和品牌方都在摩拳擦掌,火力全開。作為品牌方,想要在電商大戰(zhàn)中拔得頭籌,那么,對消費者的洞察就必不可少。品牌方對消費者的購買行為了解地越透徹,就越能有效地幫助企業(yè)更有針對性地開展市場營銷活動。
今天,我們就借助文獻(xiàn)Sakar, C.O., Polat, S.O., Katircioglu, M. et al. Neural Comput & Applic (2018) 中的一份公開樣本數(shù)據(jù),結(jié)合JMP軟件來對網(wǎng)購用戶購買行為做一些有趣的探索性數(shù)據(jù)分析。
Step.1?數(shù)據(jù)獲取
原始數(shù)據(jù)來源
原始數(shù)據(jù)的獲取,可以通過以下網(wǎng)址下載csv格式原始數(shù)據(jù)到本地,并通過JMP打開:
https://archive.ics.uci.edu/ml/machine-learning-databases/00468/
也可以直接利用JMP的網(wǎng)頁讀取功能,直接獲取網(wǎng)頁端數(shù)據(jù)。(JMP操作:文件-> 從internet打開 ->網(wǎng)頁)

數(shù)據(jù)介紹
該數(shù)據(jù)集包含12,330 名網(wǎng)購用戶一年內(nèi)在該網(wǎng)站的購買行為,以及對應(yīng)的17個用戶特征記錄和最終交易結(jié)果。

17個特征記錄,包括10個數(shù)值型特征,7個分類型特征。
@No.1??基本信息
管理類網(wǎng)頁,管理類停留時間,信息類網(wǎng)頁,信息類停留時間,產(chǎn)品類網(wǎng)頁,產(chǎn)品類停留時間,表示用戶在不同類型網(wǎng)頁上的打開數(shù)量及停留時間總和;
@No.2??跳出率
跳出率表示從某個特定路徑進(jìn)入網(wǎng)站頁面,有多少百分比的用戶什么都沒有做,就直接離開了網(wǎng)站,它既可作為衡量整個網(wǎng)站的度量,也可作為衡量頁面的度量。
@No.3?退出率
退出率表示對某一個特定頁面而言,從這個頁面離開網(wǎng)站占所有訪問到這個頁面的百分比,一般作為衡量頁面的度量;
@No.4?頁面價值
頁面價值表示用戶在完成交易之前訪問過的網(wǎng)頁的平均值;
@No.5?特殊日
特殊日表示站點訪問時間與特定特殊日子的間隔;
@No.6?其他
此外還包括用戶使用的操作系統(tǒng)、瀏覽器、區(qū)域、流量類型、訪客類型,是否為周末以及一年中的月份信息。
Step.2?可視化探索性分析
跳出率的好壞(高低)關(guān)系到網(wǎng)絡(luò)營銷的成功與否
客戶僅僅查看單個頁面后退出,讓品牌方很難有機(jī)會說服消費者購買產(chǎn)品,畢竟他們只瀏覽了一頁。讓我們來查看下跳出率的情況吧。(JMP操作:分析-> 分布)

從圖上可以看出,90%客戶的跳出率低于6%,所有用戶的平均跳出率只有2%,是不是很完美?請先不要著急高興。它可能是不準(zhǔn)確的,或許是網(wǎng)站的分析跟蹤代碼如何集成到站點出現(xiàn)了技術(shù)問題。因為根據(jù)以往經(jīng)驗,“正常”跳出率在 40%-60% 之間,低于 40% 是非常罕見的,高于 70% 是令人擔(dān)憂的,并且是需要趕緊采取行動的。
當(dāng)前跳出率超出預(yù)期范圍并且看起來“好得令人難以置信”,應(yīng)該是網(wǎng)站中的某個地方重復(fù)的分析代碼造成的。
用戶數(shù)值型特征的多元探索
在做購物行為分析的時候,用戶的數(shù)值型特征可能維度很多,借助JMP的多元分析方法,可以快速發(fā)現(xiàn)各個維度之間的關(guān)系,并有可能實現(xiàn)降維操作,為后續(xù)的特征監(jiān)控減少不必要的資源浪費(JMP操作:分析 -> 多元方法 ->多元)。

基于當(dāng)前數(shù)據(jù),用戶在各個不同類型網(wǎng)頁上的打開數(shù)量和停留時間成正相關(guān), 這個很好理解。跳出率和退出率因為計算公式相似也成明顯正相關(guān),此外,沒有發(fā)現(xiàn)明顯的數(shù)值特征相關(guān)。
用戶上網(wǎng)方式對銷售的影響
通過下圖卡方檢驗的統(tǒng)計結(jié)果,我們可以捕捉到完成交易與否與客戶的操作系統(tǒng)、瀏覽器類型和流量類型之間的關(guān)系。(JMP操作:分析->以X擬合Y)

就操作系統(tǒng)而言,不同操作系統(tǒng),用戶完成交易的比例是不一樣的。
通過圖形也能看出,操作系統(tǒng)是“2”的時候略高,而“1”和“3”則偏低,這可能意味著網(wǎng)站頁面對這些操作系統(tǒng)的支持不夠友好,如果要提升這部分的收益轉(zhuǎn)化,則需要做出相應(yīng)的改進(jìn)。同理,對瀏覽器類型和流量類型,我們也看到了他們對用戶完成交易比例的統(tǒng)計學(xué)影響,說明網(wǎng)站在這方面也有改進(jìn)空間。
新老客戶和工作日/周末對銷售的影響
借助2.3部分卡方檢驗的方法,我們也能快速發(fā)現(xiàn)一些新老客戶和工作日/周末對銷售的規(guī)律,但這里嘗試另一種數(shù)據(jù)表匯總的方法(JMP操作:分析-> 消費者研究 -> 分類)。

結(jié)合上面的圖形和數(shù)據(jù),能清楚地看到:
老客戶是網(wǎng)站訪問的主力,說明網(wǎng)站在客戶維系上做得很好;
但是我們也看到,不管是在平日(13.2% vs 26.1%)還是在周末(16.5% vs 21.9%),新客戶的完成交易的比例都要高于老客戶,這說明網(wǎng)站可以在老客戶的轉(zhuǎn)化率上做出些改進(jìn)。
比如老客戶在購買商品的時候可以通過介紹新客戶的方式來享受更大的折扣,這樣既調(diào)動了老客戶的購買熱情,也為網(wǎng)站增加了更多的新客戶。
多樣分析結(jié)果的集中展示
如果想把各種分析圖表以報表的形式集中展示, 可以通過JMP的腳本功能,就可以一鍵實現(xiàn)報表鏈接數(shù)據(jù)的實時更新,節(jié)省大量的重復(fù)性手動操作(JMP操作:文件 ->?新建 ->?應(yīng)用程序)。??

以上是一些探索性數(shù)據(jù)分析的結(jié)果。下面,我們來進(jìn)一步嘗試用數(shù)據(jù)挖掘的方法對上面提到的用戶主要特征與交易結(jié)果建立量化的統(tǒng)計模型。
Step.3??數(shù)據(jù)預(yù)測建模
通過決策樹,篩選影響銷售的關(guān)鍵特征
決策樹是一種有監(jiān)督學(xué)習(xí)方法,能夠從一系列有特征和標(biāo)簽的數(shù)據(jù)中總結(jié)出決策規(guī)則,并用樹狀圖的結(jié)構(gòu)來呈現(xiàn)這些規(guī)則,結(jié)果解釋方便,在各個行業(yè)和領(lǐng)域都有著廣泛的應(yīng)用(JMP操作:分析 ->?預(yù)測建模 ->?分割)。

從圖中我們可以觀察決策樹的各個階段,從上到下顯示影響交易結(jié)果的最重要的特征。
其中最重要的是網(wǎng)頁價值,網(wǎng)頁價值低于0.067和高于0.067的成交比率分別為3.85%和56.4%,差距明顯。后面還有些比較重要的特征參數(shù)也都一并列出,比如跳出率,月份和產(chǎn)品相關(guān)頁面等,這些信息都是驅(qū)動交易結(jié)果的重要因素,現(xiàn)在可以快速被挑選展示出來,從而讓品牌方有了一個更清晰的改進(jìn)優(yōu)化重點。
優(yōu)中選優(yōu),更多數(shù)據(jù)挖掘方法的嘗試
除了決策樹,JMP還提供了諸如神經(jīng)網(wǎng)絡(luò)、隨機(jī)森林、提升樹和支持向量機(jī)等多種數(shù)據(jù)挖掘的方法,并且可以輕松完成模型算法之間的比較,實現(xiàn)優(yōu)中選優(yōu)。

通過JMP Pro 16 全新的模型篩選來對多種數(shù)據(jù)挖掘方法一次性完成比較,在這之前,為了防止構(gòu)建的模型過擬合,可以先按照訓(xùn)練集,測試集,驗證集 6:2:2的比例對原始數(shù)據(jù)進(jìn)行拆分,生成驗證列(JMP操作:分析->預(yù)測建模 ->生成驗證列)。

如下圖所示,一次輸入特征參數(shù)和交易結(jié)果,平臺會同時構(gòu)建多個算法模型,并自動篩選出當(dāng)前的最佳建模方法為隨機(jī)森林,模型在測試集上的表現(xiàn),也就是對將來新數(shù)據(jù)的預(yù)測能力R方達(dá)到了0.6,預(yù)測準(zhǔn)確性達(dá)到了90.7%。
精確的預(yù)測模型可以幫助品牌方盡早了解每一個用戶可能的交易結(jié)果,尤其是預(yù)測交易失敗的情況,提早做出應(yīng)對和補(bǔ)救,比如打折,比如在客戶退出頁面前彈出挽留界面等(JMP操作:分析?-> 預(yù)測建模?->模型篩選)。

看了今天的分析,是不是讓你在以后的“電商大戰(zhàn)”中更有信心了呢?
對品牌方而言,提供個性化的產(chǎn)品與服務(wù),并針對個別需求做出一對一的營銷,是網(wǎng)絡(luò)營銷相對于傳統(tǒng)營銷的一個巨大優(yōu)勢。結(jié)合JMP數(shù)據(jù)分析軟件,通過對網(wǎng)購用戶消費行為的深入分析,可以幫助企業(yè)設(shè)計出更能滿足目標(biāo)顧客群需求的特色網(wǎng)頁,并及時針對發(fā)現(xiàn)的潛在問題,做出相應(yīng)的改進(jìn),從而為企業(yè)帶來更大的收益。

最后,如果你也想在JMP中自己動手試試看的話,可掃描下面的二維碼下載試用:
