數(shù)據(jù)分析方法(1)——異常分析
? ? ? ?異常分析是數(shù)據(jù)分析過程中,最常見也最基本的工作內(nèi)容之一,是指對不正常的數(shù)據(jù)進行分析并試圖尋找可能發(fā)生的原因。
一、分析流程圖

二、數(shù)據(jù)異常判斷
1、判斷數(shù)據(jù)是否異常?
? ? ?自己取一遍數(shù)看看是否與給到的數(shù)據(jù)結(jié)果相似,判斷是否有取數(shù)的錯誤或統(tǒng)計口徑的區(qū)別,明確分析對象。
2、判斷數(shù)據(jù)異常程度?
? ? 與歷史數(shù)據(jù)對比,拉長周期,分析其變化情況是否在歷史上是一個周期發(fā)生的異常,如果不是這次異動的程度如何,是否非常嚴重?
3、判斷數(shù)據(jù)異動的頻率?
? ? 一般給到的指標都是一個綜合性大指標,所以可以看一下在一定的周期內(nèi)(7天/一個月等),是否是某一天內(nèi)的突變導(dǎo)致還是一個周期內(nèi)的累計導(dǎo)致,主要考察異常發(fā)生的頻率情況。
三、拆解指標
? ? ? ?一般給到的指標都是綜合性大指標,根據(jù)其計算公式進行拆解,再對每一個值進行考察。(如果不能拆成計算公式,直接跳過進行維度拆解)
舉例:
商業(yè)類:收益:? ? ? ? ? profit=revenu-cost
? ? ? ? ? ? ??投資回報率:ROI=年利潤/ 投資總金額?
泛互聯(lián)網(wǎng):成交總額:GMV=訂單數(shù)量*金額=用戶*轉(zhuǎn)化率*售價
? ? ? ? ? ? ? ? ? 日活躍用戶:DAU
? ? ? ? ? ? ? ? ? N日留存:第N日的留存用戶/第1天的用戶數(shù)
? ? ? ? ? ? ? ? ? 人均貢獻:ARPU=總收入(GMV)/總用戶數(shù)
四、拆解維度
? ? ? ? 對拆解下來的指標進行維度上的分析,這里拆解的維度首要與業(yè)務(wù)方進行確認,看業(yè)務(wù)方是否能給出建議或有想法,畢竟分析結(jié)果也是要給到業(yè)務(wù)方進行執(zhí)行的。
? ? ? ? 最泛用的拆解:外因(競爭、行業(yè))+內(nèi)因(人、貨、場)
粗略舉例:
電商:人:新老用戶、性別、年齡等
? ? ? ? ? ?貨:品類(如男裝、女裝)、發(fā)貨地點、價格促銷等
? ? ? ? ? ?場:門店、渠道(如京東、淘寶)等
? ? ? ? ? ?外因:競品活動或新品(競爭因素)、政策扶持(行業(yè)因素)等
平臺:人:新老用戶、性別、年齡等
? ? ? ? ? ?貨:視頻類型、內(nèi)容等
? ? ? ? ? ?場:運營活動、渠道類型(安卓、蘋果)等
? ? ? ? ? ?外因:競品活動或新品(競爭因素)、政策扶持(行業(yè)因素)等
五、影響因素
1、單一影響因素:that's the aha time,根據(jù)這個這個影響因素提出分析建議即可。
2、復(fù)合影響因素,但可以用公式描述(如銷量漲售價跌的情況):判斷誰取主導(dǎo)作用,根據(jù)復(fù)合函數(shù)(以二維函數(shù)為例)的泰勒展開,取一階導(dǎo)數(shù):
? ? ? 其中的和
即影響函數(shù)對x,y兩個維度上的偏導(dǎo)即為影響程度值,進行判斷即可。
3、復(fù)合影響因素,缺乏數(shù)據(jù)或較難直接通過公式表述:(1)搭建復(fù)雜模型(時序分析,多元線性回歸等),(2)協(xié)方差和相關(guān)性系數(shù):比較值在這兩個維度上的相關(guān)性程度,(3)改變單因素:進行AB測試或因果推斷等方法確定是否為主因,(4)給出能夠同時影響二者的建議
六、一個簡單的應(yīng)用
咨詢上常用的收支分析:profit=revenu-cost
????????????????????????????????????????revenu=volume*price
????????????????????????????????????????cost=fixed cost+variable cost