最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

泰迪智能科技數(shù)據(jù)分析可視案例丨大數(shù)據(jù)助力航空公司轉(zhuǎn)型(上)

2023-08-02 13:48 作者:泰迪科技  | 我要投稿

數(shù)據(jù)時(shí)代,各行各業(yè)在面向客戶制定運(yùn)營策略、營銷策略時(shí),都希望能夠針對不同的客戶推行不同的策略,實(shí)現(xiàn)精準(zhǔn)化運(yùn)營,以期獲取最大的轉(zhuǎn)化率??蛻絷P(guān)系管理是精準(zhǔn)化運(yùn)營的基礎(chǔ),而客戶關(guān)系管理的核心是客戶分類。通過客戶分類,對客戶群體進(jìn)行細(xì)分,區(qū)別出低價(jià)值客戶、高價(jià)值客戶,對不同的客戶群體開展不同的個(gè)性化服務(wù),將有限的資源合理地分配給不同價(jià)值的客戶,實(shí)現(xiàn)效益最大化。


航空公司的客戶運(yùn)營一直是客戶運(yùn)營標(biāo)桿,積分換里程,積分兌獎品,VIP候機(jī)室,積分兌優(yōu)質(zhì)乘機(jī)餐,會員優(yōu)先選座等一系列花式操作令乘客們目不暇接,然而在數(shù)據(jù)時(shí)代的今天,各行各業(yè)都玩起了用戶運(yùn)營,以互聯(lián)網(wǎng)公司為首,以各種手段吸引用戶關(guān)注,仿佛都成了用戶運(yùn)營專家,在會員泛濫的今天,航空公司如何通過精細(xì)化運(yùn)營提升用戶的貢獻(xiàn)量、活躍度和忠誠度,就是本文研究的課題,本文將使用航空公司客戶數(shù)據(jù),操作結(jié)合RFM模型,采用K-Means聚類算法,對客戶進(jìn)行分群,比較不同類別客戶的客戶價(jià)值,從而制定相應(yīng)的營銷策略。


01背景與挖掘目標(biāo)

信息時(shí)代的來臨使得企業(yè)營銷焦點(diǎn)從產(chǎn)品中心轉(zhuǎn)變?yōu)榭蛻糁行?,客戶關(guān)系管理成為企業(yè)的核心問題??蛻絷P(guān)系管理的關(guān)鍵問題是客戶分類,通過客戶分類,區(qū)分無價(jià)值客戶、高價(jià)值客戶,企業(yè)針對不同價(jià)值的客戶制定優(yōu)化的個(gè)性化服務(wù)方案,采取不同營銷策略,將有限營銷資源集中于高價(jià)值客戶,實(shí)現(xiàn)企業(yè)利潤最大化目標(biāo)。準(zhǔn)確的客戶分類結(jié)果是企業(yè)優(yōu)化營銷資源分配的重要依據(jù),客戶分類越來越成為客戶關(guān)系管理中亟待解決的關(guān)鍵問題之一。


面對激烈的市場競爭,各個(gè)航空公司都推出了更優(yōu)惠的營銷方式來吸引更多的客戶,國內(nèi)某航空公司面臨著常旅客流失、競爭力下降和航空資源未充分利用等經(jīng)營危機(jī)。通過建立合理的客戶價(jià)值評估模型,對客戶進(jìn)行分群,分析比較不同客戶群的客戶價(jià)值,并制定相應(yīng)的營銷策略,對不同的客戶群提供個(gè)性化的客戶服務(wù)是必須的和有效的。結(jié)合該航空公司已積累的大量的會員檔案信息和其乘坐航班記錄,實(shí)現(xiàn)以下目標(biāo)。

  1. 借助航空公司客戶數(shù)據(jù),對客戶進(jìn)行分類。

  2. 對不同的客戶類別進(jìn)行特征分析,比較不同類客戶的客戶價(jià)值。

  3. 對不同價(jià)值的客戶類別提供個(gè)性化服務(wù),制定相應(yīng)的營銷策略。


02分析方法與過程

全球經(jīng)濟(jì)環(huán)境和市場環(huán)境已經(jīng)悄然改變,企業(yè)的業(yè)務(wù)逐步從以產(chǎn)品為主導(dǎo)轉(zhuǎn)向以客戶需求為主導(dǎo)。一種全新的“以客戶為中心”的業(yè)務(wù)模式正在形成并被提升到前所未有的高度。然而與客戶保持關(guān)系需要花費(fèi)成本,企業(yè)所擁有的客戶中只有一部分能為企業(yè)帶來利潤。企業(yè)的資源也是有限的,忽視高潛力的客戶而對所有客戶都提供同樣的服務(wù),將使企業(yè)的資源無法發(fā)揮其最大效用去創(chuàng)造最大化的利潤。任何企業(yè)要想生存和發(fā)展,都必須獲得利潤,追求利潤最大化是企業(yè)生存和發(fā)展的宗旨之一。所以企業(yè)不可能也不應(yīng)該和所有的客戶都保持同樣的關(guān)系??蛻魻I銷戰(zhàn)略的倡導(dǎo)者Jay & Adam Curry從國外數(shù)百家公司進(jìn)行了客戶營銷實(shí)施的經(jīng)驗(yàn)中提煉了如下經(jīng)驗(yàn)。

? ?公司收入的80%來自頂端的20%的客戶。

? ?20%的客戶其利潤率100%。

? ?90%以上的收入來自現(xiàn)有客戶。

? 大部分的營銷預(yù)算經(jīng)常被用在非現(xiàn)有客戶上。

? 5%至30%的客戶在客戶金字塔中具有升級潛力。

?客戶金字塔中客戶升級2%,意味著銷售收入增加10%,利潤增加50%。

這些經(jīng)驗(yàn)也許并不完全準(zhǔn)確,但是它揭示了新時(shí)代客戶分化的趨勢,也說明了對客戶價(jià)值分析的迫切性和必要性。如果把客戶的營利性加以分析,就會發(fā)現(xiàn)客戶盈利結(jié)構(gòu)已發(fā)生了重大變化,只有特定的一部分客戶給企業(yè)帶來了利潤。企業(yè)如果想獲得長期發(fā)展,必須對這類客戶做到有效的識別和管理。如果用同樣的方法應(yīng)對所有與企業(yè)有業(yè)務(wù)往來的客戶,必然不會獲得成功。

眾多的企業(yè)管理者雖然知道客戶價(jià)值分析的重要性,但對如何進(jìn)行客戶價(jià)值分析卻知之甚少。如何全方位,多角度的考慮客戶價(jià)值因素,進(jìn)行有效的客戶價(jià)值分析,這是擺在所有企業(yè)面前需要認(rèn)真思索的一個(gè)問題。只有甄選出有價(jià)值的客戶并將精力集中在這些客戶身上,才能有效地提升企業(yè)的競爭力,使企業(yè)獲得更大的發(fā)展。

在客戶價(jià)值分析領(lǐng)域,最具影響力并得到實(shí)證檢驗(yàn)的理論與模型有:客戶終生價(jià)值理論,客戶價(jià)值金字塔模型,策略評估矩陣分析法和RFM客戶價(jià)值分析模型等。


03分析步驟與流程

航空客戶價(jià)值分析案例的總體流程如圖1所示。主要包括以下4個(gè)步驟。

  1. 抽取航空公司2012年4月1日至2014年3月31日的數(shù)據(jù)。

  2. 對抽取的數(shù)據(jù)進(jìn)行數(shù)據(jù)探索分析與預(yù)處理,包括數(shù)據(jù)缺失值與異常值的探索分析,數(shù)據(jù)清洗,特征構(gòu)建,標(biāo)準(zhǔn)化等操作。

  3. 基于RFM模型,使用K-Means算法進(jìn)行客戶分群。

  4. 針對模型結(jié)果得到不同價(jià)值的客戶,采用不同的營銷手段,提供定制化的服務(wù)。

圖?1? 航空客運(yùn)數(shù)據(jù)分析建??傮w流程


04數(shù)據(jù)探索分析

從航空公司系統(tǒng)內(nèi)的客戶基本信息、乘機(jī)信息以及積分信息等詳細(xì)數(shù)據(jù)中,根據(jù)末次飛行日期(LAST_FLIGHT_DATE),以2014年3月31日為結(jié)束時(shí)間,選取寬度為兩年的時(shí)間段作為分析觀測窗口,抽取觀測窗口2012年4月1日至2014年3月31日內(nèi)有乘機(jī)記錄的所有客戶的詳細(xì)數(shù)據(jù)形成歷史數(shù)據(jù),總共62988條記錄。其中包含了如會員卡號,入會時(shí)間,性別,年齡,會員卡級別,工作地城市,工作地所在省份,工作地所在國家,觀測窗口結(jié)束時(shí)間,觀測窗口乘機(jī)積分,飛行公里數(shù),飛行次數(shù),飛行時(shí)間,乘機(jī)時(shí)間間隔,平均折扣率等44個(gè)屬性,如表1所示。

表1航空公司數(shù)據(jù)屬性說明


1. 描述性統(tǒng)計(jì)分析?

通過對原始數(shù)據(jù)觀察發(fā)現(xiàn)數(shù)據(jù)中存在票價(jià)為空值的記錄,同時(shí)存在票價(jià)最小值為0、折扣率最小值為0但總飛行公里數(shù)大于0的記錄。票價(jià)為空值的數(shù)據(jù)可能是客戶不存在乘機(jī)記錄造成。其它的數(shù)據(jù)可能是客戶乘坐0折機(jī)票或者積分兌換造成。

查找每列屬性觀測值中空值個(gè)數(shù)、最大值、最小值,如代碼清單1所示。

# 對數(shù)據(jù)進(jìn)行基本的探索# 返回缺失值個(gè)數(shù)以及最大最小值import pandas as pddatafile= '../data/air_data.csv' ?# 航空原始數(shù)據(jù),第一行為屬性標(biāo)簽resultfile = '../tmp/explore.csv' ?# 數(shù)據(jù)探索結(jié)果表
# 讀取原始數(shù)據(jù),指定UTF-8編碼(需要用文本編輯器將數(shù)據(jù)裝換為UTF-8編碼)data = pd.read_csv(datafile, encoding = 'utf-8')
# 包括對數(shù)據(jù)的基本描述,percentiles參數(shù)是指定計(jì)算多少的分位數(shù)表(如1/4分位數(shù)、中位數(shù)等)explore = data.describe(percentiles = [], include = 'all').T
# describe()函數(shù)自動計(jì)算非空值數(shù),需要手動計(jì)算空值數(shù)explore['null'] = len(data)-explore['count']
explore = explore[['null', 'max', 'min']]explore.columns = [u'空值數(shù)', u'最大值', u'最小值'] ?# 表頭重命名'''這里只選取部分探索結(jié)describe()函數(shù)自動計(jì)算的字段有count(非空值數(shù))、unique(唯一值數(shù))、top(頻數(shù)最高者)、freq(最高頻數(shù))、mean(平均值)、std(方差)、min(最小值)、50%(中位數(shù))、max(最大值)'''
explore.to_csv(resultfile) ?# 導(dǎo)出結(jié)果


根據(jù)代碼清單 71得到的探索結(jié)果見表2。

表2數(shù)據(jù)探索分析結(jié)果表


2. 分布分析?

分別從客戶基本信息、乘機(jī)信息、積分信息3個(gè)角度進(jìn)行數(shù)據(jù)探索,尋找客戶的分布規(guī)律。

2.1 客戶基本信息分布分析

選取客戶基本信息中入會時(shí)間、性別、會員卡級別和年齡字段進(jìn)行探索分析,探索客戶的基本信息分布狀況,如代碼清單2所示。

# 客戶信息類別# 提取會員入會年份from datetime import datetimeffp = data['FFP_DATE'].apply(lambda x:datetime.strptime(x,'%Y/%m/%d'))ffp_year = ffp.map(lambda x : x.year)# 繪制各年份會員入會人數(shù)直方圖fig = plt.figure(figsize=(8 ,5)) ?# 設(shè)置畫布大小plt.rcParams['font.sans-serif'] = 'SimHei' ?# 設(shè)置中文顯示plt.rcParams['axes.unicode_minus'] = Falseplt.hist(ffp_year, bins='auto', color='#0504aa')plt.xlabel('年份')plt.ylabel('入會人數(shù)')plt.title('各年份會員入會人數(shù)')plt.show()plt.close# 提取會員不同性別人數(shù)male = pd.value_counts(data['GENDER'])['男']female = pd.value_counts(data['GENDER'])['女']
# 繪制會員性別比例餅圖fig = plt.figure(figsize=(7 ,4)) ?# 設(shè)置畫布大小plt.pie([ male, female], labels=['男','女'], colors=['lightskyblue', 'lightcoral'], ? ? ? autopct='%1.1f%%')plt.title('會員性別比例')plt.show()plt.close
# 提取不同級別會員的人數(shù)lv_four = pd.value_counts(data['FFP_TIER'])[4]lv_five = pd.value_counts(data['FFP_TIER'])[5]lv_six = pd.value_counts(data['FFP_TIER'])[6]# 繪制會員各級別人數(shù)條形圖fig = plt.figure(figsize=(8 ,5)) ?# 設(shè)置畫布大小plt.bar(left=range(3), height=[lv_four,lv_five,lv_six], width=0.4, alpha=0.8, color='skyblue')plt.xticks([index for index in range(3)], ['4','5','6'])plt.xlabel('會員等級')plt.ylabel('會員人數(shù)')plt.title('會員各級別人數(shù)')plt.show()plt.close()
# 提取會員年齡age = data['AGE'].dropna()age = age.astype('int64')# 繪制會員年齡分布箱型圖fig = plt.figure(figsize=(5 ,10))plt.boxplot(age, ? ? ? ? ? ?patch_artist=True, ? ? ? ? ? ?labels = ['會員年齡'], ?# 設(shè)置x軸標(biāo)題 ? ? ? ? ? ?boxprops = {'facecolor':'lightblue'}) ?# 設(shè)置填充顏色plt.title('會員年齡分布箱線圖')# 顯示y坐標(biāo)軸的底線plt.grid(axis='y')plt.show()plt.close

代碼清單2? 探索客戶的基本信息分布狀況


通過代碼清單2得到各年份會員入會人數(shù)直方圖,如圖2所示,入會人數(shù)隨年份增長而增加在2012年達(dá)到最高峰。

圖2? ?各年份會員入會人數(shù)


通過代碼清單2得到會員性別比例餅圖,如圖3所示,可以看出男性會員明顯比女性會員多。

圖3 會員性別比例


通過代碼清單2得到會員各級別人數(shù)條形圖,如圖4所示,可以看出絕大部分會員為4級會員,僅有少數(shù)會員為5級和6級會員。


圖4 會員各級別人數(shù)


得到會員年齡分布箱型圖,如圖 5所示,可以看出大部分會員年齡集中在30~50歲之間,極少量的會員年齡小于20歲或高于60歲,且存在一個(gè)超過100歲的異常數(shù)據(jù)。

圖5 ?會員年齡分布


2.2 客戶乘機(jī)信息分布分析

選取最后一次乘機(jī)至結(jié)束的時(shí)長、客戶乘機(jī)信息中飛行次數(shù)、總飛行公里數(shù)進(jìn)行探索分析,探索客戶的乘機(jī)信息分布狀況,如代碼清單3所示。

lte = data['LAST_TO_END']fc = data['FLIGHT_COUNT']sks = data['SEG_KM_SUM']
# 繪制最后乘機(jī)至結(jié)束時(shí)長箱線圖fig = plt.figure(figsize=(5 ,8))plt.boxplot(lte, ? ? ? ? ? ?patch_artist=True, ? ? ? ? ? ?labels = ['時(shí)長'], ?# 設(shè)置x軸標(biāo)題 ? ? ? ? ? ?boxprops = {'facecolor':'lightblue'}) ?# 設(shè)置填充顏色
plt.title('會員最后乘機(jī)至結(jié)束時(shí)長分布箱線圖')# 顯示y坐標(biāo)軸的底線plt.grid(axis='y')plt.show()plt.close
# 繪制客戶飛行次數(shù)箱線圖fig = plt.figure(figsize=(5 ,8))plt.boxplot(fc, ? ? ? ? ? ?patch_artist=True, ? ? ? ? ? ?labels = ['飛行次數(shù)'], ?# 設(shè)置x軸標(biāo)題 ? ? ? ? ? ?boxprops = {'facecolor':'lightblue'}) ?# 設(shè)置填充顏色plt.title('會員飛行次數(shù)分布箱線圖')# 顯示y坐標(biāo)軸的底線plt.grid(axis='y')plt.show()plt.close
# 繪制客戶總飛行公里數(shù)箱線圖fig = plt.figure(figsize=(5 ,10))plt.boxplot(sks, ? ? ? ? ? ?patch_artist=True, ? ? ? ? ? ?labels = ['總飛行公里數(shù)'], ?# 設(shè)置x軸標(biāo)題 ? ? ? ? ? ?boxprops = {'facecolor':'lightblue'}) ?# 設(shè)置填充顏色plt.title('客戶總飛行公里數(shù)箱線圖')# 顯示y坐標(biāo)軸的底線plt.grid(axis='y')plt.show()plt.close

代碼清單3探索客戶乘機(jī)信息分布狀況


通過代碼清單3得到客戶最后一次乘機(jī)至結(jié)束的時(shí)長、客戶乘機(jī)信息中飛行次數(shù)、總飛行公里數(shù)的箱線圖如圖 6、圖7所示。


圖6? 客戶最后一次乘機(jī)至結(jié)束的時(shí)長箱線圖

圖7 ?客戶飛行次數(shù)與

總飛行公里數(shù)的箱線圖


如圖 6所示,客戶的入會時(shí)長主要分布在50~300的區(qū)間內(nèi),另外有一部分客戶群體分布在600以上的區(qū)間,可分為兩個(gè)群體。如圖 7所示,客戶的飛行次數(shù)與總飛行公里數(shù)也明顯的分為兩個(gè)群體,大部分客戶集中在箱線圖的中的下方的箱體中,少數(shù)客戶分散分布在箱體上界的上方,這部分用戶很可能是高價(jià)值客戶,因?yàn)槠滹w行次數(shù)和總飛行公里數(shù)明顯超過在箱體內(nèi)的客戶。


2.3?客戶積分信息分布分析

選取積分兌換次數(shù)、總累計(jì)積分進(jìn)行探索分析,探索客戶的積分信息分布狀況,如代碼清單4所示。

# 積分信息類別# 提取會員積分兌換次數(shù)ec = data['EXCHANGE_COUNT']# 繪制會員兌換積分次數(shù)直方圖fig = plt.figure(figsize=(8 ,5)) ?# 設(shè)置畫布大小plt.hist(ec, bins=5, color='#0504aa')plt.xlabel('兌換次數(shù)')plt.ylabel('會員人數(shù)')plt.title('會員兌換積分次數(shù)分布直方圖')plt.show()plt.close
# 提取會員總累計(jì)積分ps = data['Points_Sum']# 繪制會員總累計(jì)積分箱線圖fig = plt.figure(figsize=(5 ,8))plt.boxplot(ps, ? ? ? ? ? ?patch_artist=True, ? ? ? ? ? ?labels = ['總累計(jì)積分'], ?# 設(shè)置x軸標(biāo)題 ? ? ? ? ? ?boxprops = {'facecolor':'lightblue'}) ?# 設(shè)置填充顏色plt.title('客戶總累計(jì)積分箱線圖')# 顯示y坐標(biāo)軸的底線plt.grid(axis='y')plt.show()plt.close

代碼清單4探索客戶積分信息分布狀況


通過代碼清單4得到客戶積分兌換次數(shù)直方圖和總累計(jì)積分分布箱線圖,分別如圖 8、圖9所示。


圖8 客戶積分兌換次數(shù)直方圖

圖9 客戶總累計(jì)積分


通過圖 8可以看出,絕大部分客戶的兌換次數(shù)在0~10的區(qū)間內(nèi),這表示大部分客戶都很少進(jìn)行積分兌換。通過圖 9可以看出,一部分客戶集中在箱體中,少部分客戶分散分布在箱體上方,這部分客戶的積分要明顯高于箱體內(nèi)的客戶。


3. 相關(guān)性分析

客戶信息的屬性間存在相關(guān)性,選取入會時(shí)間、會員卡級別、客戶年齡、飛行次數(shù)、總飛行公里數(shù)、最近一次乘機(jī)至結(jié)束時(shí)長、積分兌換次數(shù)、總累計(jì)積分屬性,通過相關(guān)系數(shù)矩陣與熱力圖分析各屬性間的相關(guān)性,如代碼清單5所示。



# 提取屬性并合并為新數(shù)據(jù)集data_corr = data[['FFP_TIER','FLIGHT_COUNT','LAST_TO_END', ? ? ? ? ? ? ? ? ?'SEG_KM_SUM','EXCHANGE_COUNT','Points_Sum']]age1 = data['AGE'].fillna(0)data_corr['AGE'] = age1.astype('int64')data_corr['ffp_year'] = ffp_year
# 計(jì)算相關(guān)性矩陣dt_corr = data_corr.corr(method='pearson')print('相關(guān)性矩陣為:\n',dt_corr) # 繪制熱力圖import seaborn as snsplt.subplots(figsize=(10, 10)) # 設(shè)置畫面大小sns.heatmap(dt_corr, annot=True, vmax=1, square=True, cmap='Blues')plt.show()plt.close

代碼清單?5相關(guān)系數(shù)矩陣與熱力圖


通過代碼清單5得到相關(guān)系數(shù)矩陣如表3所示,得到熱力圖如圖10所示,可以看出部分屬性間具有較強(qiáng)的相關(guān)性,如FLIGHT_COUNT(飛行次數(shù))屬性與SEG_KM_SUM(總公里數(shù))屬性;也有部分屬性與其他屬性的相關(guān)性都較弱,如AGE(年齡)屬性與EXCHANGE_COUNT(積分兌換次數(shù))屬性。


表?3?相關(guān)系數(shù)矩陣

圖10? 熱力圖


* RFM模型及K-Means聚類算法實(shí)操詳解,見下期:

《大數(shù)據(jù)助力航空公司轉(zhuǎn)型(下)》


配套在線課程內(nèi)容可到泰迪智能科技大數(shù)據(jù)培訓(xùn)學(xué)習(xí)平臺-泰迪云課堂獲取了解更多~


泰迪智能科技數(shù)據(jù)分析可視案例丨大數(shù)據(jù)助力航空公司轉(zhuǎn)型(上)的評論 (共 條)

分享到微博請遵守國家法律
湾仔区| 瑞安市| 交城县| 通渭县| 云林县| 太保市| 泾川县| 屏边| 嵊州市| 裕民县| 苗栗县| 常德市| 潮州市| 武宣县| 阳泉市| 安庆市| 定安县| 镇平县| 山丹县| 博客| 穆棱市| 图片| 松溪县| 鞍山市| 双鸭山市| 宣威市| 茶陵县| 左云县| 贵溪市| 方城县| 蓬溪县| 灵璧县| 越西县| 攀枝花市| 莎车县| 陈巴尔虎旗| 加查县| 威宁| 逊克县| 广安市| 崇州市|