【數(shù)據(jù)分享】數(shù)據(jù)驅(qū)動(dòng)營(yíng)銷活動(dòng):最優(yōu)子集算法篩選有價(jià)值的客戶信息
原文出處:拓端數(shù)據(jù)部落公眾號(hào)
“?
哪種營(yíng)銷活動(dòng)最成功?這家公司的普通客戶是什么樣的?營(yíng)銷活動(dòng)沒有預(yù)期的那么有效,如何分析數(shù)據(jù)了解此問題并提出數(shù)據(jù)驅(qū)動(dòng)的解決方案?
”
要點(diǎn)提示
在競(jìng)爭(zhēng)非常激烈的市場(chǎng)中,公司必須優(yōu)化其潛在的可尋市場(chǎng)?(PAM)。使用市場(chǎng)細(xì)分,好處是更少花費(fèi)資源(時(shí)間和金錢)。讓公司通過了解他們的需求和愿望并滿足他們來定位最有可能變成真正客戶的特定潛在客戶。
市場(chǎng)細(xì)分可以幫助您定義和更好地了解您的目標(biāo)受眾和理想客戶。如果您是營(yíng)銷人員,這可以讓您為您的產(chǎn)品確定合適的市場(chǎng),然后更有效地定位您的營(yíng)銷。同樣,發(fā)布商可以使用市場(chǎng)細(xì)分以提供更有針對(duì)性的廣告選項(xiàng),并為不同的受眾群體定制其內(nèi)容。
本文分析了 2240 個(gè)觀察(客戶)的營(yíng)銷數(shù)據(jù)(查看文末了解數(shù)據(jù)獲取方式),其中包含 28 個(gè)與營(yíng)銷數(shù)據(jù)相關(guān)的變量:客戶資料、購(gòu)買的產(chǎn)品、營(yíng)銷活動(dòng)成功(或失敗)、渠道表現(xiàn)等,以最佳子集回歸篩選的形式運(yùn)行統(tǒng)計(jì)測(cè)試來回答這些問題。
主題一
客戶資料和促銷活動(dòng)效果的關(guān)系
我們通過同心圓,可視化投訴客戶與客戶個(gè)人情況的層次關(guān)系。每個(gè)圓環(huán)的大小代表其對(duì)內(nèi)部父類別的貢獻(xiàn)。圍繞這個(gè)中心圓(客戶是否投訴)設(shè)置一個(gè)同心環(huán)(客戶是否在第一次推銷時(shí)就接受促銷商品),來查看該項(xiàng)目的分解情況。

圖一
我們可以看到,此環(huán)已被分割以顯示主要分類——投訴和未投訴。未投訴的客戶占比99%,進(jìn)一步在外圈細(xì)分未投訴客戶,其中在第一次推銷時(shí)接受促銷商品的比例為6.5%。投訴的客戶占比1%,其中在第一次推銷時(shí)接受促銷商品的比例為0%。

圖二
本科的客戶占比50.3%,其中在第一次推銷時(shí)接受促銷商品的比例為3.7%。博士的客戶占比21.7%,其中在第一次推銷時(shí)接受促銷商品的比例為1.3%。碩士的客戶占比16.5%,其中在第一次推銷時(shí)接受促銷商品的比例為0.8%。
圖三?
可以看到,已婚的客戶占比38.6%,其中在第一次推銷時(shí)接受促銷商品的比例為2.8%。戀愛中的客戶占比25.9%,其中在第一次推銷時(shí)接受促銷商品的比例為1.4%。單身的客戶占比21.4%,其中在第一次推銷時(shí)接受促銷商品的比例為1.4%。
主題二
客戶婚姻學(xué)歷情況與促銷活動(dòng)效果關(guān)系
我們對(duì)促銷活動(dòng)效果的分布可視化。構(gòu)建促銷活動(dòng)效果流動(dòng)圖,對(duì)于每個(gè)維度(學(xué)歷、婚姻和是否接受促銷商品),每個(gè)類別都顯示一個(gè)垂直條。條形的長(zhǎng)度表示該類別的樣本數(shù)。

圖四?
從第一個(gè)維度(婚姻情況)開始,它的每個(gè)類別都連接到下一個(gè)維度中的多個(gè)類別,顯示該類別是如何細(xì)分的。遞歸地重復(fù)這種細(xì)分,產(chǎn)生一棵樹。
戀愛和已婚人士更容易接受促銷商品?我們一眼就能看出,戀愛和已婚的相對(duì)比例遠(yuǎn)遠(yuǎn)大于單身或離異。我們還發(fā)現(xiàn)本科更容易接受促銷商品,然后是博士學(xué)歷客戶,相對(duì)比例遠(yuǎn)遠(yuǎn)大于碩士研究生或?qū)?啤?/p>
主題三
最佳促銷影響因素子集選擇
一個(gè)自然的問題是:我們最終應(yīng)該選擇哪些最佳模型進(jìn)行促銷效果預(yù)測(cè)分析?
要回答這個(gè)問題,需要一些統(tǒng)計(jì)指標(biāo)或策略來比較模型的整體性能并選擇最好的。您需要估計(jì)每個(gè)模型的預(yù)測(cè)誤差并選擇預(yù)測(cè)誤差較低的模型。
最佳子集回歸是一個(gè)模型選擇方法,其由測(cè)試所述預(yù)測(cè)變量的所有可能的組合,然后根據(jù)一些統(tǒng)計(jì)標(biāo)準(zhǔn)選擇最佳模型。調(diào)整后的 R2、 BIC允許我們確定最佳的模型,其中最佳定義為最大化調(diào)整后的 R2 和最小化預(yù)測(cè)誤差 BIC。
接下來,我們根據(jù) R2和 BIC 統(tǒng)計(jì)值直接繪制估計(jì)模型,比較差異。

圖五
調(diào)整后的 R2 表示結(jié)果中由預(yù)測(cè)變量值的變化解釋的變化比例。調(diào)整后的 R2 越高,模型越好。

圖六
在這里,調(diào)整后的?R2?告訴我們最好的模型是具有所有?8個(gè)預(yù)測(cè)變量的模型。但是,使用?BIC標(biāo)準(zhǔn),我們應(yīng)該選擇具有?7?個(gè)變量的模型。
因此,根據(jù)我們考慮的指標(biāo),我們有不同的“最佳”模型。我們需要額外的策略。另請(qǐng)注意,調(diào)整后的?R2、BIC是根據(jù)已用于擬合模型的訓(xùn)練數(shù)據(jù)計(jì)算得出的。這意味著,使用這些指標(biāo)的模型選擇可能會(huì)過度擬合,并且在應(yīng)用于新數(shù)據(jù)時(shí)可能表現(xiàn)不佳。更嚴(yán)格的方法是根據(jù)使用?k?折交叉驗(yàn)證技術(shù)在新測(cè)試數(shù)據(jù)上計(jì)算出的預(yù)測(cè)誤差來選擇模型。
最后,我們發(fā)現(xiàn)有8個(gè)變量的模型是最好的,它具有較低的預(yù)測(cè)誤差。該模型的回歸系數(shù)可以提取如下:

數(shù)據(jù)獲取
在下面公眾號(hào)后臺(tái)回復(fù)“市場(chǎng)營(yíng)銷數(shù)據(jù)”,可獲取完整數(shù)據(jù)。
聲明
本文章中的所有信息(包括但不限于分析、預(yù)測(cè)、建議、數(shù)據(jù)、圖表等內(nèi)容)僅供參考,拓端數(shù)據(jù)(tecdat)不因文章的全部或部分內(nèi)容產(chǎn)生的或因本文章而引致的任何損失承擔(dān)任何責(zé)任。
點(diǎn)擊標(biāo)題查閱往期內(nèi)容
數(shù)據(jù)感知游客的森林公園游憩需求
數(shù)據(jù)盤點(diǎn)高校新生錄取情況
調(diào)查數(shù)據(jù)傾聽大學(xué)生外賣需求
數(shù)據(jù)挖掘:香水電商銷售策略分析
新零售消費(fèi)者特征的數(shù)據(jù)視野
數(shù)據(jù)聚焦護(hù)士職業(yè)滿意度
數(shù)據(jù)分析促進(jìn)白血病預(yù)測(cè)診斷
移動(dòng)廣告中基于點(diǎn)擊率的數(shù)據(jù)策略
bilibili視頻流量數(shù)據(jù)潛望鏡
數(shù)據(jù)觀察“雙十一”網(wǎng)購(gòu)新常態(tài)
數(shù)據(jù)解鎖職場(chǎng)女性潛力
數(shù)據(jù)視域下圖書館話題情感分析
數(shù)據(jù)類崗位需求的數(shù)據(jù)面
數(shù)據(jù)度量消費(fèi)貸款—消費(fèi)者的考慮因素
數(shù)據(jù)探析期刊文章研究熱點(diǎn)
疫情下的新聞數(shù)據(jù)觀察
已遷離北京外來人口的數(shù)據(jù)畫像
更多內(nèi)容,請(qǐng)點(diǎn)擊左下角“閱讀原文”查看報(bào)告全文