機器學習案例實戰(zhàn) | 購買者行為分析(一)
Python購買者行為分析(一)
本篇主要運用數(shù)據(jù)分析和數(shù)據(jù)挖掘技術,根據(jù)平臺業(yè)務需求,從流量指標分析、客戶購買情況分析、客戶行為轉化率分析(客戶行為漏斗分析)和客戶價值分析四個方面挖掘客戶購物行為,并使用RFM 模型對客戶群體分類,依據(jù)客戶群體特點,提供針對性的運營措施 為后續(xù)的發(fā)展提供有效建議。
背景與挖掘目標
Part.1
案例背景
隨著互聯(lián)網(wǎng)的發(fā)展,電子商務已成為世界經(jīng)濟重要的組成部分。人們在不同的電商平臺上瀏覽商品,然后直接下單購買,這一流程相比于傳統(tǒng)商業(yè)省去了很多環(huán)節(jié),在提高效率的同時還降低了交易雙方的成本。電商平臺為了對買賣雙方提供高效和體驗良好的交易服務,不斷地更新平臺功能,令客戶更高效地獲得感興趣或是有購買意愿的商品。
平臺業(yè)務功能的實現(xiàn)基于海量客戶行為數(shù)據(jù)的反饋分析結果,而購物優(yōu)惠活動、主題購物節(jié)和平臺功能效果實現(xiàn)等運營情況,也可以由購買者的行為數(shù)據(jù)衡量優(yōu)劣。
Part.2
案例目標
( 1 )流量指標分析:通過分析不同時間維度的 PV 和 UV 指標,探索這個月內平臺的客戶流量情況,并結合可視化分析結果進行總結;
( 2 )客戶購買情況分析:從客戶的成交率、付費率、購買數(shù)、復購率和購買商品情況等分析角度挖掘客戶在該平臺的購買情況、客戶購買力、客戶對該平臺的忠誠度和客戶長購商品等,并結合可視化分析結果進行總結;
( 3 )客戶行為漏斗分析:運用漏斗分析挖掘客戶行為轉變的轉化率,例如客戶“點擊”行為轉變?yōu)椤爸Ц丁毙袨榈霓D化率;
( 4 )客戶群體分類:使用 RFM 模型對客戶群體分類,并繪制雷達圖,結合分類結果分析客戶價值。同時依據(jù)客戶群體特點提供針對性的運營措施。
分析方法與過程
對購買行為數(shù)據(jù)預處理前,需要先對購買數(shù)據(jù)進行采集。本案例利用Python網(wǎng)絡爬蟲技術對購買數(shù)據(jù)進行采集。由于本案例的重點是對通過兩個緯度進行客戶流量分析,且網(wǎng)絡數(shù)據(jù)的爬取具有時效性,因此,本案例不再詳細介紹數(shù)據(jù)的采集過程。以下分析所使用的數(shù)據(jù)與分析結果,僅作為范例參考。
Part.1
購買行為數(shù)據(jù)預處理
為了更全面、多方位的對數(shù)據(jù)有一個更好的了解,找出數(shù)據(jù)中需要進行處理的缺失值、異常值、重復值和其他需要進行數(shù)據(jù)清洗的問題,現(xiàn)在對數(shù)據(jù)進行探索性分析。
先對數(shù)據(jù)進行數(shù)據(jù)類型換,修改列索引,再用.drop()函數(shù)刪除空值,.drop_duplicate()函數(shù)去除重復值之后,再用sort_values()排序函數(shù),對每一列數(shù)據(jù)進行排序,然后查看每一列的部分數(shù)據(jù)。購買行為數(shù)據(jù)預處理的代碼如代碼清單1所示。

通過以上運行結果的數(shù)據(jù)可以得出:有8列數(shù)據(jù),一共有12256906條購買記錄,對沒有價值的空值進行去除。
對去除后的數(shù)據(jù)進行探索性分析,可以得到該數(shù)據(jù)需要處理的地方即缺失值、異常值、重復值、多余值并對其進行相關操作。
Python購買者行為分析(二)請留意后續(xù)發(fā)布
【泰迪云課堂】是泰迪智能科技大數(shù)據(jù)學習平臺,有線上/線下大數(shù)據(jù)就業(yè)班、大數(shù)據(jù)課程、職業(yè)技能提升考證,更多相關信息可到【泰迪云課堂】獲取了解更多~