最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

3000字總結(jié)數(shù)據(jù)分析SOP,超全面!

2022-02-11 12:37 作者:愛數(shù)據(jù)分析社區(qū)  | 我要投稿

來(lái)? 源:溜溜筆記說(shuō)/作? 者:Janie Liu

文末領(lǐng)取《20套行業(yè)數(shù)據(jù)分析可視化報(bào)告》

(金融/餐飲/零售/疫情...)


數(shù)據(jù)分析這個(gè)崗位涉及很多知識(shí)點(diǎn),各個(gè)網(wǎng)站也都能搜到,但很少有一種系統(tǒng)化的流程來(lái)參考,也有讀者后臺(tái)留言問到數(shù)據(jù)分析的流程,所以我認(rèn)認(rèn)真真的整理出一套方法論,將數(shù)據(jù)分析從0-1的流程都串聯(lián)了起來(lái)。


對(duì)于分析人員來(lái)說(shuō),過程很重要,是一個(gè)發(fā)現(xiàn)業(yè)務(wù)價(jià)值并探索業(yè)務(wù)價(jià)值的過程;但對(duì)于領(lǐng)導(dǎo)來(lái)說(shuō),結(jié)果才最重要,只有可落地實(shí)施可帶來(lái)實(shí)際效益的結(jié)果才是數(shù)據(jù)分析價(jià)值的體現(xiàn)。


所以,流程中的每一步鋪墊與探索都是為了最終的業(yè)務(wù)價(jià)值的實(shí)現(xiàn)。


01?數(shù)據(jù)分析SOP流程


數(shù)據(jù)分析共包括四大階段:

  • 需求處理階段:考驗(yàn)溝通理解能力

  • 數(shù)據(jù)處理階段:考驗(yàn)數(shù)據(jù)清洗及SQL、Python等工具使用能力

  • 數(shù)據(jù)分析與展現(xiàn)階段:考驗(yàn)分析應(yīng)用與可視化展現(xiàn)能力

  • 復(fù)盤跟蹤階段:考驗(yàn)反省優(yōu)化能力


根據(jù)數(shù)據(jù)分析的SOP流程,將其中的數(shù)據(jù)分析與展現(xiàn)階段整理了一份思維導(dǎo)圖,方便大家快速理解,可以先看一下。

其實(shí)數(shù)據(jù)分析一句話總結(jié)就是:將一堆無(wú)序的海量數(shù)據(jù)經(jīng)過一系列清洗、處理、規(guī)整、加工展現(xiàn),提煉出痛點(diǎn)及機(jī)會(huì),從而驅(qū)動(dòng)業(yè)務(wù)增長(zhǎng)、輔助業(yè)務(wù)決策。


02?展開講講數(shù)據(jù)分析各階段


一、發(fā)現(xiàn)問題

問題千千萬(wàn),需從中找出有效問題。有效問題就是有價(jià)值的問題:這個(gè)問題涉及了什么業(yè)務(wù)?與什么指標(biāo)相關(guān)?有多大的影響?能解決什么難題?受宏觀影響還是微觀影響?無(wú)法避免還是本可避免?等等!


發(fā)現(xiàn)問題,可以從以下幾個(gè)方面著手:

  • 與歷史對(duì)比

  • 與總體對(duì)比

  • 與競(jìng)品對(duì)比

  • 與目標(biāo)對(duì)比

  • 與經(jīng)驗(yàn)對(duì)比

  • ......

二、需求處理階段

需求分兩塊:他人驅(qū)動(dòng)與自我驅(qū)動(dòng)


?他人驅(qū)動(dòng)

通常由業(yè)務(wù)方、上級(jí)領(lǐng)導(dǎo)等需求方發(fā)現(xiàn)問題,提出需求。可能會(huì)存在需求不明確的問題,既增加溝通成本,又耗費(fèi)時(shí)間成本,分析師將需求完成之后,需求方才發(fā)現(xiàn)自己需要的并不是這樣的,成了無(wú)意義的工作、低成本的分析。


所以需要清晰get到需求方的點(diǎn),了解清楚需求背景、需求目的、指標(biāo)口徑、數(shù)據(jù)需求范圍、數(shù)據(jù)需求維度、需求的期望排期等。


另外還需明確一點(diǎn),數(shù)據(jù)展示聚合還是明細(xì)。如果展示聚合,需要按照什么維度聚合,按照什么方式聚合;如果需要展示明細(xì),搞清楚為什么需要的是明細(xì)數(shù)據(jù),因?yàn)槊骷?xì)數(shù)據(jù)量會(huì)比較大,既涉及數(shù)據(jù)安全,也給調(diào)取數(shù)據(jù)帶來(lái)壓力。


有時(shí)候需求方要求明細(xì)數(shù)據(jù),他們拿到明細(xì)數(shù)據(jù)之后還要再用Excel去聚合去做數(shù)據(jù)處理,其實(shí)這一步驟分析師完全可以直接用SQL或者BI產(chǎn)品解決。也就是說(shuō)這個(gè)明細(xì)數(shù)據(jù)并不能一步到位讓需求方看到他想看到的數(shù)據(jù),所以需要引導(dǎo)需求方了解下他們需求的真正目的。


做到拆解需求,將抽象的需求具體化,復(fù)雜的需求簡(jiǎn)單化。


?自我驅(qū)動(dòng)

即分析師本人發(fā)現(xiàn)問題,探索解決問題的方案。比如某個(gè)指標(biāo)波動(dòng)異常,先于業(yè)務(wù)方發(fā)現(xiàn)并解決問題;再比如專門負(fù)責(zé)某一個(gè)項(xiàng)目,主動(dòng)通過數(shù)據(jù)探索項(xiàng)目?jī)?yōu)化方案。


三、數(shù)據(jù)采集

數(shù)據(jù)采集的目的是為了在分析中使用,多數(shù)情況下用到的是聚合數(shù)據(jù)。數(shù)據(jù)采集分為內(nèi)部數(shù)據(jù)、外部數(shù)據(jù)兩大塊。


?內(nèi)部數(shù)據(jù)

(1)需要梳理清楚這個(gè)需求需要什么數(shù)據(jù)


(2)需要判別需要的數(shù)據(jù)是否能從現(xiàn)有數(shù)據(jù)庫(kù)中獲取。如果可以,應(yīng)該從哪個(gè)庫(kù)中的哪個(gè)表獲取?這個(gè)表中字段的口徑和需求所需的字段口徑是否一致?


(3)如果現(xiàn)有數(shù)據(jù)庫(kù)中沒有現(xiàn)成的數(shù)據(jù)可以滿足需求,就需要梳理好口徑請(qǐng)數(shù)倉(cāng)同學(xué)重新落表。


(4)如果現(xiàn)有數(shù)據(jù)庫(kù)中有表可以滿足,但是需要通過SQL層層關(guān)聯(lián)才能從數(shù)據(jù)庫(kù)中獲取聚合數(shù)據(jù),最好的方式請(qǐng)數(shù)倉(cāng)同學(xué)將你所需的聚合數(shù)據(jù)落成數(shù)據(jù)庫(kù)表,這樣一方面你使用起來(lái)較為簡(jiǎn)單,另一方面也減少了數(shù)據(jù)展現(xiàn)層的BI端連接數(shù)據(jù)的壓力。


?外部數(shù)據(jù)

行業(yè)報(bào)告數(shù)據(jù):比如艾瑞網(wǎng)、極光大數(shù)據(jù)、阿里研究所、199IT互聯(lián)網(wǎng)數(shù)據(jù)中心等都會(huì)時(shí)不時(shí)的發(fā)一些行業(yè)分析報(bào)告。整個(gè)行業(yè)的數(shù)據(jù)公司內(nèi)部是無(wú)法獲取的,所以可以從一些行業(yè)分析報(bào)告入手。


問卷采集:比如我們需要獲取用戶的一些①主觀想法:喜歡我們產(chǎn)品的原因是?我們產(chǎn)品最吸引您的點(diǎn)是?您覺得我們產(chǎn)品最應(yīng)該改進(jìn)的點(diǎn)是?②對(duì)競(jìng)品的行為:您在xx場(chǎng)景下更愿意使用A產(chǎn)品、B產(chǎn)品還是C產(chǎn)品③用戶習(xí)慣的場(chǎng)景:您在什么場(chǎng)景下更愿意使用xx產(chǎn)品?通過問卷數(shù)據(jù)獲取一些產(chǎn)品中無(wú)法獲得的數(shù)據(jù),輔助分析。


宏觀數(shù)據(jù):比如我們分析的某個(gè)指標(biāo)有時(shí)候也會(huì)受到宏觀政策的影響。比如在xx日出具了xx政策,本公司產(chǎn)品在該政策之前與之后變化多大。


確保能獲取核心的關(guān)鍵性數(shù)據(jù),為下一步做準(zhǔn)備。


四、數(shù)據(jù)處理

對(duì)分析師而言,這步需要分析師將數(shù)據(jù)根據(jù)腦中的分析框架處理成所需要的數(shù)據(jù)。會(huì)涉及數(shù)據(jù)異常值處理、缺失值處理、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)聚合、數(shù)據(jù)分組歸類以及數(shù)據(jù)準(zhǔn)確性的校驗(yàn),為下一步的數(shù)據(jù)分析奠定好基礎(chǔ)。井井有條的數(shù)據(jù)更有利于分析。


五、數(shù)據(jù)分析

硬實(shí)力:

①數(shù)據(jù)調(diào)取:MySQL、SparkSQL、Hive、impala、Oracle、PostgreSQL等

②數(shù)據(jù)清洗或建模:Python、SPSS等

③數(shù)據(jù)可視化:Tableau、Fine BI、Quick BI、PowerBI等

④數(shù)據(jù)分析報(bào)告:PPT、Excel、Word


以上硬實(shí)力并不是說(shuō)全部都需要,針對(duì)不同的崗位性質(zhì)需要不同的技能。比如有的分析只需要會(huì)SQL、可視化工具、寫分析報(bào)告就可以了,有的分析額外還需要會(huì)Python建模等。


軟實(shí)力:

①統(tǒng)計(jì)知識(shí):描述性統(tǒng)計(jì)、邏輯回歸、假設(shè)檢驗(yàn)等

②排查問題的能力

③溝通能力:與業(yè)務(wù)方、數(shù)倉(cāng)、上級(jí)領(lǐng)導(dǎo)溝通

④歸納總結(jié)能力:從一系列分析中歸納出最重要的點(diǎn)

⑤數(shù)據(jù)敏感度


軟實(shí)力更重要,工具大家認(rèn)真學(xué)都能學(xué)會(huì),軟實(shí)力卻是自己實(shí)打?qū)嵉膫€(gè)人特色與魅力。


六、數(shù)據(jù)展現(xiàn)


以上準(zhǔn)備都做好之后,就到了數(shù)據(jù)應(yīng)用層:數(shù)據(jù)展現(xiàn)。數(shù)據(jù)展現(xiàn)普遍來(lái)說(shuō),有兩種形式:數(shù)據(jù)分析報(bào)告&可視化報(bào)表。


(1)數(shù)據(jù)分析報(bào)告

數(shù)據(jù)分析報(bào)告要素:數(shù)據(jù)調(diào)取時(shí)間、報(bào)告出具時(shí)間、報(bào)告負(fù)責(zé)人、數(shù)據(jù)維度、分析背景、分析目的、結(jié)論要點(diǎn)、附表等。


注意:

  • 最好將要點(diǎn)總結(jié)放在上面,這樣看報(bào)告的人可以第一時(shí)間get到要點(diǎn),然后再針對(duì)性去看每個(gè)要點(diǎn)的分析。

  • 結(jié)論要點(diǎn)總結(jié),求精不求多。

  • 一張圖盡量表明一個(gè)觀點(diǎn),而非一張圖涉及很多種指標(biāo),傳達(dá)很多種觀點(diǎn),容易造成干擾。


一份有價(jià)值的分析報(bào)告才是成果的展現(xiàn)。


(2)BI報(bào)表

不管是采取外購(gòu)的BI產(chǎn)品還是自研,都需要有一種敏捷BI來(lái)為數(shù)據(jù)應(yīng)用提供一種入口。

數(shù)據(jù)可視化旨在將復(fù)雜數(shù)據(jù)圖片化,幫助人更好地分析數(shù)據(jù)??梢暬⒉皇菃渭兊恼故鞠聰?shù)據(jù),而是使分析結(jié)果可視化,注意“分析結(jié)果”這4個(gè)字。借助于圖形,清晰有效的傳達(dá)與溝通問題。舉個(gè)例子,可視化相較于數(shù)據(jù),好比照片相較于文字。一張好的照片可以讓人瞬間發(fā)現(xiàn)其中的亮點(diǎn),而無(wú)需在大量文字中去提取;一份優(yōu)秀的可視化可以讓人瞬間發(fā)現(xiàn)數(shù)據(jù)要傳達(dá)的含義。重在直觀的展示,而非簡(jiǎn)單的好看。?


數(shù)據(jù)是思想,可視化是表達(dá)方式。想象一下,倘若公司沒有可視化,員工基本會(huì)在數(shù)據(jù)處理上耗費(fèi)大量的時(shí)間,于員工?而言,耗時(shí)耗力;于企業(yè)而言,員工因數(shù)據(jù)處理而導(dǎo)致的加班增加了開支成本,且管理層無(wú)法第一時(shí)間迅速獲得有效信息。


7、持續(xù)跟蹤

一份分析報(bào)告的完成以及一份BI報(bào)表的上線,并不是分析的終點(diǎn)。分析,需要可持續(xù)化的復(fù)盤跟蹤。


比如:

①跟蹤分析方案有沒有為公司帶來(lái)實(shí)質(zhì)性的價(jià)值。該方案執(zhí)行一段時(shí)間后,需要進(jìn)行執(zhí)行后VS執(zhí)行前的對(duì)比分析,跟蹤分析方案有沒有為公司帶來(lái)實(shí)質(zhì)性的價(jià)值。


②跟蹤分析數(shù)據(jù)指標(biāo)異動(dòng)的原因。上線了新的報(bào)表之后,需要跟蹤下報(bào)表上指標(biāo)的變化,及時(shí)感知數(shù)據(jù)是否出現(xiàn)異動(dòng)以及探索異動(dòng)的原因。


③跟蹤分析數(shù)據(jù)實(shí)際表現(xiàn)與目標(biāo)的差距。通過對(duì)歷史數(shù)據(jù)的歸納總結(jié),聚焦實(shí)際表現(xiàn)與目標(biāo)的主要差距,量化分析優(yōu)勢(shì)與不足。


持續(xù)化的復(fù)盤跟蹤,有助于我們查漏補(bǔ)缺,完善方案。更有助于探索數(shù)據(jù)深層次的含義以及及時(shí)感知數(shù)據(jù)的異常波動(dòng),提升自我價(jià)值與業(yè)務(wù)價(jià)值。



03?結(jié)語(yǔ)

分析其實(shí)就是要摸清楚需求對(duì)象是誰(shuí)?關(guān)注點(diǎn)是什么?需要解決什么問題?過程服務(wù)于業(yè)務(wù)。分析師不是一線,但與一線人員息息相關(guān)。


-END-


愛數(shù)據(jù)今日福利

《20套行業(yè)數(shù)據(jù)分析可視化報(bào)告》

包含金融、餐飲、零售等行業(yè)

掃描/識(shí)別下方二維碼后

回復(fù)?1104?即可領(lǐng)取



3000字總結(jié)數(shù)據(jù)分析SOP,超全面!的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
林芝县| 麟游县| 乡宁县| 和龙市| 任丘市| 黔西| 鹤山市| 昭苏县| 信丰县| 大荔县| 仪陇县| 浦县| 宁强县| 华蓥市| 哈尔滨市| 马龙县| 临沭县| 韶山市| 黄大仙区| 无锡市| 龙海市| 渝中区| 多伦县| 云林县| 定西市| 东城区| 攀枝花市| 阿尔山市| 五华县| 焦作市| 来宾市| 高淳县| 富宁县| 台南县| 龙井市| 华宁县| 宝清县| 澄城县| 康平县| 崇文区| 循化|