數(shù)據(jù)分析兩個重要的概念:指標和維度

人們總認為與大數(shù)據(jù)分析沾點邊的技術都要花大價錢才能得到。但事實上,大數(shù)據(jù)分析的思想才是最貴的,技術可以實現(xiàn)數(shù)據(jù)批量清洗,處理,呈現(xiàn)地更快、更美。
指標與維度是數(shù)據(jù)分析中最常用到的術語,它們是非?;A的,但是又很重要,經常有朋友沒有搞清楚它們之間的關系,只有掌握理解了,我們的數(shù)據(jù)分析工作開展就就容易多了?,F(xiàn)在就來說說指標與維度的那些事。
01 指標
指標,用于衡量事物發(fā)展程度的單位或方法,它還有個IT上常用的名字,也就是度量。例如:人口數(shù)、GDP、收入、用戶數(shù)、利潤率、留存率、覆蓋率等。很多公司都有自己的KPI指標體系,就是通過幾個關鍵指標來衡量公司業(yè)務運營情況的好壞。
指標需要經過加和、平均等匯總計算方式得到,并且是需要在一定的前提條件進行匯總計算,如時間、地點、范圍,也就是我們常說的統(tǒng)計口徑與范圍。指標可以分為絕對數(shù)指標和相對數(shù)指標,絕對數(shù)指標反映的是規(guī)模大小的指標,如人口數(shù)、GDP、收入、用戶數(shù),而相對數(shù)指標主要用來反映質量好壞的指標,如利潤率、留存率、覆蓋率等。
我們分析一個事物發(fā)展程度就可以從數(shù)量跟質量兩個角度入手分析,以全面衡量事物發(fā)展程度。剛才說過,指標用于衡量事物發(fā)展程度,那這個程度是好還是壞,這就需要通過不同維度來對比,才能知道是好還是壞。
02 維度
維度:是事物或現(xiàn)象的某種特征,如性別、地區(qū)、時間等都是維度。其中時間是一種常用、特殊的維度,通過時間前后的對比,就可以知道事物的發(fā)展是好了還是壞了,如用戶數(shù)環(huán)比上月增長10%、同比去年同期增長20%,這就是時間上的對比,也稱為縱比;另一個比較就是橫比,如不同國家人口數(shù)、GDP的比較,不同省份收入、用戶數(shù)的比較、不同公司、不同部門之間的比較,這些都是同級單位之間的比較,簡稱橫比;
維度可以分為定性維度跟定量維度,也就是根據(jù)數(shù)據(jù)類型來劃分,數(shù)據(jù)類型為字符型(文本型)數(shù)據(jù),就是定性維度,如地區(qū)、性別都是定性維度;數(shù)據(jù)類型 為數(shù)值型數(shù)據(jù)的,就為定量維度,如收入、年齡、消費等,一般我們對定量維度需要做數(shù)值分組處理,也就是數(shù)值型數(shù)據(jù)離散化,這樣做的目的是為了使規(guī)律更加明 顯,因為分組越細,規(guī)律就越不明顯,最后細到成最原始的流水數(shù)據(jù),那就無規(guī)律可循。最后強調一點,只有通過事物發(fā)展的數(shù)量、質量兩大方面,從橫比、縱比角度進行全方位的比較,我們才能夠全面的了解事物發(fā)展的好壞。
進一步拓展思考,我理解為指標拆分和維度對比。 其實在實際產品數(shù)據(jù)分析的過程中也可參照以上思想。 通過大量的數(shù)據(jù)分析軟件工具應用可以發(fā)現(xiàn),主要包括以下內容:?
整體情況的分析和匯總:全局數(shù)據(jù)的概況、變化趨勢、占比等
多個維度的分析:如果是日志數(shù)據(jù),已經存在多個數(shù)據(jù)項,以某一個數(shù)據(jù)項作為主關鍵詞匯總分析,同比、環(huán)比變化,占總數(shù)的變化。如果沒有日志數(shù)據(jù),則需要想清楚解決這個問題原因是什么?需要采集哪些數(shù)據(jù)項?
重要場景問題的分析:根據(jù)分析的重要問題、用戶關心的問題進行分析
軟硬件性能管理、告警管理、報表管理、基礎參數(shù)配置和用戶管理等等
在多維度分析、告警、報表,數(shù)據(jù)圖表可視化設計呈現(xiàn)方面也存在許多共性,總結如下:?
數(shù)據(jù)的呈現(xiàn)方式是表格還是圖表?若是時間范圍,時間統(tǒng)計粒度是多少?
表格需要呈現(xiàn)哪些數(shù)據(jù)?數(shù)據(jù)的單位?保留幾位小數(shù)?數(shù)據(jù)計算的方法?排序依據(jù)?
圖表采用哪一種?呈現(xiàn)的范圍是多少?
常見的數(shù)據(jù)項操作:新增、刪除、修改、查詢
新增哪些是必填數(shù)據(jù)項?校驗重復性和有效性?
刪除是否需要提醒?是否具有權限刪除?
修改可修改的數(shù)據(jù)項有哪些?修改后是否要進行校驗有效性和重復項?是否有修改的權限?
查詢是精準查詢還是模糊查詢?是單一查詢還是支持批量查詢?批量查詢輸入方式的講究?查詢的內容輸入什么是否支持大小寫 空格等?數(shù)據(jù)區(qū)間的查詢是自定義還是給出范圍劃分?
人們總認為與大數(shù)據(jù)分析沾點邊的技術都要花大價錢才能得到。但事實上,大數(shù)據(jù)分析的思想才是最貴的,技術可以實現(xiàn)數(shù)據(jù)批量清洗,處理,呈現(xiàn)地更快、更美。但卻不知道要哪些數(shù)據(jù)算有效,哪些數(shù)據(jù)才是重點需要分析得出有價值的信息。
End.
作者:張小森
來源:知乎
想加入iDATA數(shù)據(jù)分析社群的小伙伴 添加微信:lovedata19 備注「社群」即可