如何培養(yǎng)真正的數(shù)據(jù)分析思維?附實踐案例
這個問題要拆分成兩方面來說。因為不同場景,對于數(shù)據(jù)分析的需要程度是不同的,需要的能力各不相同。

第一種:
有一部分人只是需要在一些工作中,分析部分數(shù)據(jù),從而指導自己工作,為之后計劃做支撐,這種類型的數(shù)據(jù)分析,薅一些數(shù)據(jù)分析的皮毛即可。
一、夯實基礎常識——建立數(shù)據(jù)分析概念
在夯基礎階段,你需要學習統(tǒng)計學相關知識,這些知識點一般在一些入門書籍、學習網(wǎng)站就可以get到~
二、了解常用的方法論——形成數(shù)據(jù)分析的思維
什么是數(shù)據(jù)分析方法論?方法論是從宏觀角度出發(fā),從管理和業(yè)務的角度提出的分析框架,指導我們接下來具體分析的方向。
1、SWOT分析法
從優(yōu)勢(Strength)、劣勢(Weakness)、機遇(Opportunity)、威脅(Threat)四個方面分析內(nèi)外環(huán)境,適用于宏觀分析。運用這種方法,可以對研究對象所處的情景進行全面、系統(tǒng)、準確的研究,從而根據(jù)研究結果制定相應的發(fā)展戰(zhàn)略、計劃以及對策等。

2、PEST分析法
PEST 為一種企業(yè)所處宏觀環(huán)境分析模型,從政治(Politics)、經(jīng)濟(Economy)、社會(Society)、技術(Technology)四個方面分析內(nèi)外環(huán)境,適用于宏觀分析。PEST分析與外部總體環(huán)境的因素互相結合就可歸納出SWOT分析中的機會與威脅。PEST/PESTLE、SWOT 與 SLEPT 可以作為企業(yè)與環(huán)境分析的基礎工具。

3、AARRR海盜模型
一種以用戶為中心的著眼于轉化率的漏斗型的數(shù)據(jù)收集測量模型,從獲取(Acquisition)、激活(Activition)、留存(Retention)、收益(Revenue)和推薦(Referral)5個環(huán)節(jié)增長。

AARRR在應用推廣運營各個層次(各個階段)需要關注的一些指標。在整個AARRR模型中,這些量化指標都具有很重要的地位,而且很多指標的影響力是跨多個層次的。及時準確地獲取這些指標的具體數(shù)據(jù),對于應用的成功運營是必不可少的。
三、掌握常用的分析方法——培養(yǎng)數(shù)據(jù)分析習慣
1、趨勢分析
看數(shù)字、看趨勢是最基礎展示數(shù)據(jù)信息的方式。在數(shù)據(jù)分析中,我們可以通過直觀的數(shù)字或趨勢圖表,迅速了解例如市場的走勢、訂單的數(shù)量、業(yè)績完成的情況等等,從而直觀的吸收數(shù)據(jù)信息,有助于決策的準確性和實時性。
通常我們在數(shù)據(jù)分析產(chǎn)品中建立一張數(shù)據(jù)指標圖、線圖或者柱狀圖,然后持續(xù)觀察,重點關注異常值:

2、多維分解
多維分解是指從業(yè)務需求出發(fā),將指標從多個維度進行拆分。為什么需要進行多維拆解?有時候一個非?;\統(tǒng)或者最終的指標你是看不出什么問題來的,但是進行拆分之后,很多細節(jié)問題就會浮現(xiàn)出來。
比如,在分析物料不良率影響因素時,監(jiān)控各來源渠道的物料不良率:

比如,某品牌服裝門店將月度銷售數(shù)量按照不同類型、不同大小進行拆分統(tǒng)計,監(jiān)控不同款式的銷售效果:

3、漏斗分析
漏斗分析是一套流程式數(shù)據(jù)分析,絕大部分商業(yè)變現(xiàn)的流程,都可以歸納為漏斗。漏斗分析是我們最常見的數(shù)據(jù)分析手段之一,無論是注冊轉化漏斗,還是商品下單的漏斗。通過漏斗分析可以從先到后還原用戶轉化的路徑,分析每一個轉化節(jié)點的效率。
其中,我們往往關注三個要點:
第一,從開始到結尾,整體的轉化效率是多少?
第二,每一步的轉化率是多少?
第三,哪一步流失最多,原因在什么地方?流失的用戶符合哪些特征?
漏斗分析要注意的兩個要點:
第一,不但要看總體的轉化率,還要關注轉化過程每一步的轉化率;
第二,漏斗分析也需要進行多維度拆解,拆解之后可能會發(fā)現(xiàn)不同維度下的轉化率也有很大差異。
4、對比分析
多變量進行對比時,一般會用到對比分析。對比分析也有很多種:
靜態(tài)對比:同一時間條件下對不同總體指標進行比較,如不同部門、不同地區(qū)、不同國家的比較,也叫“橫比”。比如:OPPO(南京)跟蹤訂貨量,將訂貨量細分為城南、雨花區(qū)等各個區(qū)域進行對比監(jiān)控,以便后期銷售量復盤時,精細化分析數(shù)據(jù)支撐下一季度的布局。

動態(tài)對比:同一總體條件下對不同時期指標數(shù)據(jù)的比較,也叫“縱比”。

除此之外,在特定行業(yè),比如互聯(lián)網(wǎng)行業(yè),常用的數(shù)據(jù)分析方法還包括用戶分群、留存分析、用戶細查、A/B測試等等。
第二種:
專業(yè)的數(shù)據(jù)分析師能力從以下四個層次展開說:

一、需求層
需求層是最重要的,需求是數(shù)據(jù)分析的開始,也是你要分析的目標方向。
數(shù)據(jù)分析需求的來源往往有3種場景:
監(jiān)控到現(xiàn)有的指標出現(xiàn)了異常情況需要通過數(shù)據(jù)分析去找原因;
公司要對現(xiàn)有的運營模式或者某個產(chǎn)品進行評估確定是否需要進行調(diào)整或者優(yōu)化;
公司下達了戰(zhàn)略目標或短期目標需要通過分析看如何達成。
要確定需求就必須與需求方進行溝通,清楚的確認需求的內(nèi)容或者自己要分析前必須要清楚你想要的結果是什么方向。
舉個簡單的例子:年底將近,雙十一大促銷在即,數(shù)據(jù)分析師們又到了一年最辛苦,最悲催的時間段。然而,有多少無意義的加班,是因為業(yè)務部門不會提需求所導致的。需求提的不合理,業(yè)務部門看了不解決問題,就會反反復復的再提需求。導致數(shù)據(jù)分析師們辛苦加班還不落好,背上一個:“分析沒深度??!”的壞名聲。其實這不能怪需求方不會提需求,而是你作為數(shù)據(jù)分析人員要用你的經(jīng)驗,你的專業(yè)技能,你的溝通技巧去引導,去確定,去達成一致。
所以要做到清晰的確定需求,你需要自身具備:
對業(yè)務、產(chǎn)品、需求背景有比較深的了解。了解的足夠?qū)δ悴拍苋ヒ龑ヅ袛噙@個需求;
光了解需求方是還不夠的,你需要從獲得的需求快速的去結合你所掌握的技能組工具有個初步的分析思路;
綜合判斷后你再決定是否需要分析,應該怎么分析,與需求方溝通確定清楚兩方理解是否一致。
如果無法做到就會出現(xiàn)很多無法避免的問題。
理論上數(shù)據(jù)分析師所從事的工作是給出業(yè)務方相應的數(shù)據(jù)結果,而不是解決方案。雖然也有分析兩個字,但是如何設計解決方案是業(yè)務部門的事。運營部門就該做活動方案,產(chǎn)品經(jīng)理就該出產(chǎn)品方案,銷售部門就該想東西怎么賣。但是當下專業(yè)的數(shù)據(jù)分析師是需要比業(yè)務方更了解業(yè)務,你不了解業(yè)務下的結論領導或者需求方敢信任嗎?所以,一個業(yè)務技術雙精通的數(shù)據(jù)分析師,是可以替業(yè)務方搞定上邊所有問題的,不依賴業(yè)務方的判斷,因為他自己就是個業(yè)務高手,有豐富的實戰(zhàn)經(jīng)驗與業(yè)務能力。
但這種人是可遇不可求的。大部分數(shù)據(jù)分析師還是花70%時間處理數(shù)據(jù)的技術男。
在需求層我總結一下我們所需要具備的能力:
對業(yè)務、產(chǎn)品、需求背景有足夠的了解,如果不了解說明你在這塊應該先去充充電;
然后當你無法想到分析方法的時候說明你對現(xiàn)有的數(shù)據(jù)不夠了解。你同樣該去了解了解數(shù)據(jù)的來源,數(shù)據(jù)的流轉,數(shù)據(jù)的定義。
二、數(shù)據(jù)層
目標需求確定過后,現(xiàn)在的你就需要開始準備相關的數(shù)據(jù)了。數(shù)據(jù)層大致分為:數(shù)據(jù)獲取、數(shù)據(jù)清洗、數(shù)據(jù)整理。數(shù)據(jù)應該從哪來呢?數(shù)據(jù)來源取決于你分析需求,有通過各統(tǒng)計網(wǎng)站進行數(shù)據(jù)下載(有哪些好的數(shù)據(jù)來源或者大數(shù)據(jù)平臺?、有哪些「神奇」的數(shù)據(jù)獲取方式?),有通過爬蟲技術在互聯(lián)網(wǎng)進行數(shù)據(jù)抓取,也有通過企業(yè)已經(jīng)加工好的數(shù)據(jù)報表、有直接從企業(yè)數(shù)據(jù)庫通過SQL進行取數(shù)。
通過數(shù)據(jù)庫你能做到excel所無法做到的多樣性及細節(jié)化,你才能通過這些詳細的數(shù)據(jù)找出數(shù)據(jù)背后存在的問題。
現(xiàn)在的數(shù)據(jù)庫主要分為關系類型數(shù)據(jù),分布式數(shù)據(jù)庫。關系類型數(shù)據(jù)代表產(chǎn)品為mysql(免費開源的),分布式數(shù)據(jù)庫代表hadoop。兩種都是實用sql語言進行數(shù)據(jù)提取,在數(shù)據(jù)分析中你將提取出來與分析相關的數(shù)據(jù)這步就是數(shù)據(jù)獲取。這里你需要具備基礎的sql語言能力,要從海量的數(shù)據(jù)中找到你想要的部分。這個環(huán)節(jié)你也能對數(shù)據(jù)進行初步的清理,這里取決于數(shù)據(jù)庫中的數(shù)據(jù)存儲是否完整規(guī)范。
當你數(shù)據(jù)清理好也整理好后就可以開始進行數(shù)據(jù)分析了。
三、分析層
分析的工具有很多,平民版的分析工具有excel、非專業(yè)的專業(yè)分析工具有spss、專業(yè)資深的分析工作有sas/R/python。
分析的思路一般來說都是“由淺到深”,分為幾個步驟:描述分析——鎖定方向——建模分析——模型測試——迭代優(yōu)化——模型加載——洞察結論。
描述分析是最基本的分析統(tǒng)計方法,在實際工作中也是應用最廣的分析方法。分為兩大部分:數(shù)據(jù)描述和指標統(tǒng)計。數(shù)據(jù)描述:用來對數(shù)據(jù)進行基本情況的刻畫,包括:數(shù)據(jù)總數(shù)、時間跨度、時間粒度、空間范圍、空間粒度、數(shù)據(jù)來源等。如果是建模,那么還要看數(shù)據(jù)的極值、分布、離散度等內(nèi)容。 指標統(tǒng)計:用來作報告,分析實際情況的數(shù)據(jù)指標,可粗略分為四大類:變化、分布、對比、預測。說了太多了,就不展開了。
洞察結論這一步是數(shù)據(jù)報告的核心,也是最能看出數(shù)據(jù)分析師水平的部分。一個年輕的分析師和一個年邁的分析師拿到同樣的圖表,完全有可能解讀出不同的內(nèi)容。
舉個例子:

年輕的分析師:2013年1月銷售額同比上升60%,迎來開門紅。2月銷售額有所下降,3月大幅回升,4月持續(xù)增長。
年邁的分析師:2013年1月、2月銷售額去除春節(jié)因素后,1月實際同比上升20%,2月實際同比上升14%,3月、4月銷售額持續(xù)增長。
看到兩者的區(qū)別了嗎?2013年春節(jié)在2月,2012年則在1月,因此需要各去除一周的銷售額,再進行比較。如果不考慮這一因素,那么后續(xù)得出的所有結論都是錯的。挖掘數(shù)字變化背后的真正影響因素,才是洞察的目標。
四、輸出層
都到這一步了,相信各位對數(shù)據(jù)報告也不再陌生了。這一步中,需要保證的是數(shù)據(jù)報告內(nèi)容的完整性。一個完整的數(shù)據(jù)報告,應至少包含以下六塊內(nèi)容:報告背景、報告目的、數(shù)據(jù)來源、數(shù)量等基本情況、分頁圖表內(nèi)容及本頁結論、各部分小結及最終總結、下一步策略或?qū)厔莸念A測;
其中,背景和目的決定了你的報告邏輯(解決什么問題);數(shù)據(jù)基本情況告訴對方你用了什么樣的數(shù)據(jù),可信度如何;分頁內(nèi)容需要按照一定的邏輯來構建,目標仍然是解決報告目的中的問題;小結及總結必不可少;下一步策略或?qū)厔莸念A測能為你的報告加分。
注:文中數(shù)據(jù)圖表皆通過簡道云儀表盤制作。