關于數(shù)據(jù)分析知識的干貨分享
數(shù)據(jù)分析的出現(xiàn)是因為人類難以理解海量數(shù)據(jù)所呈現(xiàn)出來的信息,不能從中找到相應的規(guī)律來對現(xiàn)實中的事物進行對應,我們都知道數(shù)據(jù)有很高的價值,但不能利用的價值,沒有任何意義。
為了解決這一問題,數(shù)據(jù)分析在長期的數(shù)據(jù)利用過程中不斷完善,簡單來說,數(shù)據(jù)分析就是通過統(tǒng)計分析方法對采集儲存的大量數(shù)據(jù)進行分析,對其進行匯總、歸納、理解和消化,以實現(xiàn)數(shù)據(jù)的利用價值,發(fā)揮數(shù)據(jù)的作用。
下面我們圍繞基礎和技術來說一下,要想做好數(shù)據(jù)分析,都需要掌握哪些知識。
一、數(shù)據(jù)分析基礎知識
1、統(tǒng)計學知識儲備
統(tǒng)計學是一種利用數(shù)學理論來進行數(shù)據(jù)分析的技術,通過統(tǒng)計學我們可以用更富有信息驅動力和針對性的方式對數(shù)據(jù)進行操作。
在數(shù)據(jù)分析工作中,利用統(tǒng)計學,我們可以更深入、更細致地觀察數(shù)據(jù)是如何進行精確組織的,并且基于這種組織結構確定數(shù)據(jù)分析的方法,來獲取更多的信息。
?

這里我們需要從基礎的統(tǒng)計理論(描述性統(tǒng)計、區(qū)間估計、假設檢驗等)出發(fā),到基本的統(tǒng)計分析(T 檢驗、方差分析等),最后到商業(yè)常用的模型(回歸分析、方差分析等),學習數(shù)據(jù)分析背后的邏輯,掌握實用統(tǒng)計學的概念和會利用統(tǒng)計的思維去思考問題。
?
2、分析語言和工具
Python
python作為目前最火的編程軟件之一,確實在數(shù)據(jù)分析、數(shù)據(jù)挖掘上有著獨特優(yōu)勢。是否具備編程能力,也是初級數(shù)據(jù)分析和高級數(shù)據(jù)分析的分水嶺。
SQL
SQL作為數(shù)據(jù)分析人員,要想獲取數(shù)據(jù),肯定就要和數(shù)據(jù)庫打交道,因此SQL肯定是要掌握的,在招聘要求中,SQL也是很多數(shù)據(jù)分析崗位的能力要求之一。
?

二、ETL和數(shù)據(jù)倉庫
ETL
ETL就是抽取、轉換、加載這三個單詞的縮寫,顧名思義其主要的工作就是把數(shù)據(jù)從一個地方提取過來,然后進行一個清洗、加工,最后再存到另一個地方。ETL在大數(shù)據(jù)的整個項目流程中處于中前期的位置,但是它會貫穿到整個項目周期里,因為ETL會涉及到調優(yōu)這樣一直持續(xù)的工作。
數(shù)據(jù)倉庫
數(shù)據(jù)倉庫是一個面向主題的、集成的、隨時間變化但信息本身相對穩(wěn)定的數(shù)據(jù)集合,用于支持管理決策過程。其本質就是完成從面向業(yè)務過程數(shù)據(jù)的組織管理到面向業(yè)務分析數(shù)據(jù)的組織和管理的轉變過程,也是商業(yè)智能BI中數(shù)據(jù)倉庫的主要作用。
?

三、數(shù)據(jù)分析思路
數(shù)據(jù)分析思維強的數(shù)據(jù)分析師擁有很強的規(guī)律總結能力、能夠通過舉一反三整理分析思路、通過對行業(yè)業(yè)務的了解建立一整套思維體系。
1、梳理數(shù)據(jù)分析需求
數(shù)據(jù)分析師可以通過對行業(yè)業(yè)務的了解對數(shù)據(jù)分析需求進行梳理,確認數(shù)據(jù)分析涉及的業(yè)務、行業(yè),需要用到的分析方法,會調取哪些數(shù)據(jù)指標的數(shù)據(jù),需不需要業(yè)務人員的參與等等。

舉個簡單的例子,企業(yè)銷售部門需要對區(qū)域銷售情況進行分析,判斷區(qū)域銷售的發(fā)展趨勢,這時數(shù)據(jù)分析師可以通過數(shù)據(jù)分析思維想到相關的銷售收入、銷售訂單、銷售額、銷售拜訪等和銷售活動直接相關的數(shù)據(jù)分析,這就是利用數(shù)據(jù)分析思維形成的總結能力,快速對需求進行反應。
2、明確數(shù)據(jù)分析目標
在對數(shù)據(jù)分析需求進行梳理之后,數(shù)據(jù)分析師就可以確定為數(shù)據(jù)分析任務所需劃定一個基礎的范圍,然后再根據(jù)數(shù)據(jù)分析任務以及和業(yè)務人員的溝通交流確定數(shù)據(jù)分析的目標?;蛘邠Q種說法就是業(yè)務人員需要數(shù)據(jù)分析師給出什么樣的結論,是找出銷售趨勢下降的原因,還是給出區(qū)域銷售效果提升的分析方案。

不管怎樣,數(shù)據(jù)分析師可以根據(jù)數(shù)據(jù)分析目標,通過數(shù)據(jù)分析思維來找到完成銷售任務的分析方法。只需要明確業(yè)務人員的目標,就可以根據(jù)數(shù)據(jù)、業(yè)務和分析思維,找到問題出現(xiàn)的原因,并分析出問題解決的方案有哪些。
3、完善數(shù)據(jù)分析體系
很多時候我們會發(fā)現(xiàn),其實很多數(shù)據(jù)分析并不需要太多的復雜思路,這主要有兩個原因。一個是因為很多數(shù)據(jù)分析需求其實都很簡單,更多是對數(shù)據(jù)進行一個簡單的分析羅列,主要是用來展現(xiàn)業(yè)務發(fā)展變化或是當前情況;另一個則是因為數(shù)據(jù)分析師擁有較強的數(shù)據(jù)分析思維,形成了一套數(shù)據(jù)分析方法論,之后就可以根據(jù)總結的規(guī)律經(jīng)驗對需求進行數(shù)據(jù)分析,讓數(shù)據(jù)分析看起來很簡單。

實際上同樣的數(shù)據(jù)分析需求交給不同人來做效果就是有很大差異,給出的結論有時也不盡相同。當然這并不是說有些數(shù)據(jù)分析有錯誤,只是掌握了數(shù)據(jù)分析思維的數(shù)據(jù)分析師能夠給出更有效的數(shù)據(jù)分析結論,具有解決問題的能力,可以給出一定的方案、見解,給人看起來的感覺很舒服,更令人信服。
?