【計(jì)算機(jī)開題報(bào)告】面向大數(shù)據(jù)的電信客戶細(xì)分研究與分析(保定學(xué)院開題報(bào)告模板)

一、選題的目的、意義、研究現(xiàn)狀,本選題研究的基本內(nèi)容、擬解決的主要問題
(一)(一)課題研究目的和意義
??客戶細(xì)分的目的是為了將有潛力的客戶與無潛力的客戶區(qū)分開,以此對不同客戶群進(jìn)行針對性營銷策略[1]。進(jìn)入5G時(shí)代以來,5G數(shù)據(jù)的快速增長使電信行業(yè)面臨著巨大的挑戰(zhàn)和機(jī)遇。電信運(yùn)營商主營業(yè)務(wù)由傳統(tǒng)的語音業(yè)務(wù)在向著移動(dòng)數(shù)據(jù)業(yè)務(wù)發(fā)展。作為大數(shù)據(jù)的生產(chǎn)事業(yè),電信行業(yè)擁有極有價(jià)值的客戶數(shù)據(jù),如何對這些客戶進(jìn)行細(xì)分與研究,成為決定運(yùn)營商發(fā)展的命脈。由于本人接觸到過電信運(yùn)營商客戶細(xì)分與研究方面內(nèi)容,所以希望通過一些相關(guān)技術(shù)方法對已有的手機(jī)用戶群體進(jìn)行細(xì)分,并從中找到最可能升級(jí)變更5G高端用戶的早期潛在客戶群。
正式的客戶細(xì)分理論由美國人史密斯-威德爾于1956年提出,企業(yè)不可能無限制的全面滿足所有客戶的需求,所以需要人們通過客戶細(xì)分理論和對客戶數(shù)據(jù)的研究來掌握不同客戶群體對服務(wù)的需求以及不同客戶群體所帶來的的價(jià)值。此項(xiàng)研究在幫助運(yùn)營商管理者更高效地配置資源,把相應(yīng)的資源用到產(chǎn)生相應(yīng)價(jià)值的客戶身上,從而提高資源的利用率,滿足大部分群體對電信運(yùn)營商的需求與好評(píng),帶動(dòng)運(yùn)營商經(jīng)濟(jì)等方面有著深遠(yuǎn)意義。
(二)研究現(xiàn)狀
自1956年史密斯首次提出客戶細(xì)分的概念以來,客戶細(xì)分方法經(jīng)歷了一系列的變化[2],傳統(tǒng)的統(tǒng)計(jì)法主要是以客戶基本屬性特征的簡單統(tǒng)計(jì)進(jìn)行細(xì)分,包括諸如年齡、性別、家庭、種族等客戶基本信息,但由于該方法不具備定量分析的的功能統(tǒng)計(jì)細(xì)分的結(jié)果往往具有較強(qiáng)的主觀性,不能真實(shí)反應(yīng)真正的客戶價(jià)值。經(jīng)過多年的研究和探索,營銷學(xué)者們提出了一種基于客戶價(jià)值的客戶方法由于不同客戶對企業(yè)的價(jià)值不同,通過分析客戶的盈利能力及公司的利潤貢獻(xiàn)率將客戶進(jìn)行細(xì)分,再針對不同價(jià)值的客戶群采取精準(zhǔn)營銷策略,從而實(shí)現(xiàn)企業(yè)利潤最大化。為了動(dòng)態(tài)的對客戶的行為進(jìn)行劃分,隨后提出了基于數(shù)據(jù)挖掘的客戶細(xì)分方法,也就是現(xiàn)在
電信企業(yè)實(shí)現(xiàn)客戶細(xì)分重點(diǎn)關(guān)注的研究領(lǐng)域[3]?;跀?shù)據(jù)挖掘的方法主要是運(yùn)用聚類算法對客戶進(jìn)行細(xì)分,通過客戶的歷史數(shù)據(jù)來分析未知的客戶行為特征,大致可分為兩類客戶細(xì)分方法:(1)多元統(tǒng)計(jì)分析,如K-means方法;(2)神經(jīng)網(wǎng)絡(luò)模型,如自組組織神經(jīng)網(wǎng)絡(luò)SOM算法。
目前,國內(nèi)外學(xué)術(shù)界比較關(guān)注的是提高客戶細(xì)分結(jié)果的準(zhǔn)確性和可靠性,而新興的5G時(shí)代使得又有一大批需要研究的客戶細(xì)分研究。最近薛龍等人發(fā)表的期刊[4]顯示已經(jīng)可以通過因子分析和K均值聚類算法進(jìn)行簡單的5G客戶的細(xì)分研究與分析;國外因?yàn)榭蛻魧?G網(wǎng)絡(luò)的抵觸,沒有達(dá)到相應(yīng)的效果,相關(guān)的客戶數(shù)據(jù)由于國家管制只能從零散資料中挖掘[5],所以對5G用戶的細(xì)分也進(jìn)行得較為緩慢。美國已經(jīng)為未來5年5G的發(fā)展奠定了基礎(chǔ),預(yù)計(jì)到2025年,美國會(huì)有將近65%的用戶使用上5G。
(三)研究的基本內(nèi)容
??本論文利用數(shù)據(jù)庫的知識(shí)原理將相應(yīng)的源數(shù)據(jù)從電信集團(tuán)的客戶數(shù)據(jù)庫中取出,然后進(jìn)行分析前的數(shù)據(jù)清洗,通過進(jìn)行有標(biāo)記的監(jiān)督學(xué)習(xí))或者半監(jiān)督學(xué)習(xí)實(shí)現(xiàn)電信客戶的細(xì)分,根據(jù)從電信運(yùn)營商獲取的計(jì)費(fèi),CRM的數(shù)據(jù),分析用戶特征和需求,實(shí)現(xiàn)對客戶細(xì)分研究與分析,已達(dá)到對客戶是否需要成為5G用戶的預(yù)測。主要分為以下四個(gè)模塊:
1、CRM、計(jì)費(fèi)數(shù)據(jù)的取用:通過對CRM、計(jì)費(fèi)數(shù)據(jù)庫的理解,開始根據(jù)自己的目標(biāo)數(shù)據(jù)從不同的庫中取出所需要的客戶數(shù)據(jù)。
2、數(shù)據(jù)清洗:將取到的數(shù)據(jù),通過分箱法、回歸法或聚類法將不需要的廢數(shù)據(jù)清洗掉,主要是清洗掉重復(fù)、不全、空值和格式內(nèi)容不同的數(shù)據(jù),以便于往下的分析步驟。
3、客戶數(shù)據(jù)分析:(1)客戶忠誠度算法設(shè)計(jì):用戶crm數(shù)據(jù)中,有一條“是否離網(wǎng)”的字段,通過已經(jīng)離網(wǎng)和未離網(wǎng)的用戶歷史數(shù)據(jù)分析現(xiàn)在仍然在網(wǎng)的用戶離網(wǎng)概率,結(jié)合忠誠公式:1i=1-Pi,計(jì)算出客戶忠誠度。上述公式中1i是第i個(gè)客戶離網(wǎng)概率,Pi是第i個(gè)客戶忠誠度。算法主要選擇決策樹或者svm算法,客戶忠誠度的細(xì)分問題其實(shí)屬于一種二分類問題,通過簡單的是否達(dá)到來區(qū)分忠誠度。需要的表內(nèi)字段主要有:1)手機(jī)號(hào)碼2)生、失效時(shí)間3)是否實(shí)名制4)每月出賬金額
(2)客戶價(jià)值算法設(shè)計(jì):客戶的價(jià)值是客戶給運(yùn)營商帶來的現(xiàn)有價(jià)值和潛在價(jià)值,由兩者共同決定。算法主要選擇AHP層次分析法,計(jì)算出每個(gè)指標(biāo)的權(quán)重,根據(jù)用戶價(jià)值計(jì)算公式計(jì)算出每個(gè)客戶的客戶價(jià)值。需要的表內(nèi)字段主要有:影響現(xiàn)有價(jià)值:1)本月出賬金額2)本月通話時(shí)長。影響潛在價(jià)值:1)忠誠度2)入網(wǎng)時(shí)間
(3)客戶上網(wǎng)偏好算法設(shè)計(jì):利用客戶的每月訂購上網(wǎng)流量包,和所需要的網(wǎng)速來對客戶進(jìn)行分析。算法主要選擇svm算法。主要需要的表內(nèi)數(shù)據(jù)是:1)客戶每月訂購流量包2)客戶每月網(wǎng)速限制
4、數(shù)據(jù)可視化設(shè)計(jì):通過對以上三類客戶細(xì)分的數(shù)據(jù)結(jié)果,對數(shù)據(jù)進(jìn)行可視化,以推測出預(yù)期想要達(dá)到的效果,找到客戶中有成為5G客戶的那一批潛在客戶。
(五)擬解決的主要問題
1.半監(jiān)督學(xué)習(xí)算法的選擇與調(diào)優(yōu)問題
2.可視化模塊設(shè)計(jì)問題
二、選題研究步驟、研究方法及措施:
(一)研究步驟
1.課題調(diào)研
對現(xiàn)狀需求進(jìn)行分析,調(diào)研該課題的背景、目的及意義。
2.確定方向
對目前已有電信客戶細(xì)分方法進(jìn)行觀察研究,找出不足,確定研究目標(biāo)與方向,
3.系統(tǒng)設(shè)計(jì)
根據(jù)需求分析的結(jié)果,按照功能進(jìn)行模塊的劃分,使用編程工具編寫各個(gè)功能塊。
4.程序編寫
根據(jù)忠誠度方面、價(jià)值方面、上網(wǎng)偏好方面進(jìn)行有關(guān)算法的程序編寫。
5.運(yùn)行調(diào)試
通過PyCharm、IDEA等工具進(jìn)行測試,調(diào)試改進(jìn)程序,使可視化界面更加完善。
6.撰寫論文
歸納總結(jié),完成論文。
(二)研究方法及措施
1.文獻(xiàn)研究法:通過查閱關(guān)于客戶細(xì)分,電信企業(yè)5G資源數(shù)據(jù)的相關(guān)文獻(xiàn),對其進(jìn)行研究與分析,為文本尋找理論支持,使用文獻(xiàn)研究法能了解有關(guān)問題的歷史與現(xiàn)狀,幫助完成研究課題。
2.描述分析法:就電信企業(yè)內(nèi)部控制5G客戶所具有的不同屬性的現(xiàn)狀和存在的可進(jìn)行客戶數(shù)據(jù)細(xì)分與研究問題進(jìn)行歸納剖析。
3.實(shí)驗(yàn)法
通過程序的編寫來完成整個(gè)可視化系統(tǒng),在實(shí)驗(yàn)中發(fā)現(xiàn)問題,解決問題。
4.研究措施
通過相關(guān)書籍,學(xué)習(xí)相應(yīng)的有關(guān)知識(shí),進(jìn)行網(wǎng)上搜索相關(guān)內(nèi)容,閱讀相關(guān)的項(xiàng)目報(bào)告,及時(shí)做筆錄,對該課題有幫助的部分進(jìn)行整理與分析,開拓思維,由此作為該課題的理論基礎(chǔ)。

四、主要參考文獻(xiàn):
[1]張曉敏、王小丫、左小雪,面向大數(shù)據(jù)的電信客戶細(xì)分模型研究與展望 [J]安徽財(cái)經(jīng)大學(xué) 2018.03.12
[2]楊茜,基于大數(shù)據(jù)的客戶細(xì)分模型及精確營銷策略研究 [D]南京郵電大學(xué) 2015
[3]陳志平、胡宇舟、顧學(xué)道,聚類算法在電信客戶細(xì)分中的應(yīng)用研究 [J] 計(jì)算機(jī)應(yīng)用,2007
[4]薛龍,基于因子分析和k均值聚類的5G客戶挖掘 [D] 對外經(jīng)濟(jì)貿(mào)易大學(xué),2021.04.12
[5]宋向東,王禹蓉 解析美國5G網(wǎng)絡(luò)現(xiàn)狀及發(fā)展動(dòng)向 [D] 通信世界全媒體 2021.08.30
[6]鄭美容.K-means聚類算法的分析研究 [J] 信息與電腦理論版 2012(7)
[7]顧芳,劉旭峰,左超.大數(shù)據(jù)背景下運(yùn)營商移動(dòng)互聯(lián)網(wǎng)發(fā)展策略研究[J].郵電設(shè)計(jì)技術(shù),2012(8)
[8]朱云鶴.國內(nèi)電信運(yùn)營商集團(tuán)客戶關(guān)系管理研究[D].北京郵電大學(xué),2014
[9]胡舉,賀治國,周鼎.電信運(yùn)營商大數(shù)據(jù)平臺(tái)建設(shè)方案與典型應(yīng)用探討[J].信息通訊.2017(10)