數(shù)據(jù)分析,你逃不掉的幾大“坑”

數(shù)據(jù)分析?,我一直覺(jué)得這屬于很多人不知道Ta有多重要、一部分人知道Ta重要但并不重視,只有極少數(shù)人真正在工作中重視Ta并且運(yùn)用Ta。
說(shuō)一個(gè)東西重要,肯定要講為什么,不然絕對(duì)是要被拿著刀追幾條街的。
那么,數(shù)據(jù)分析為什么重要呢?至少有以下好處:
相比“似乎”、“好像”,能夠更加客觀的呈現(xiàn)真實(shí)現(xiàn)狀;
相比“我以為”、“我覺(jué)得”,數(shù)據(jù)的改變是對(duì)產(chǎn)品”改變”做出的最直觀、最無(wú)聲的投票,數(shù)據(jù)可以佐證“改變”是否正確、恰當(dāng)以及效果如何;
相比所謂的“經(jīng)驗(yàn)”、“年紀(jì)”、“職位”,數(shù)據(jù)能夠排除掉這些太不可控的“主觀”的影響/壓力,作為另一個(gè)相對(duì)客觀的決策依據(jù);
說(shuō)的更加大白話一些的,那就是:
你剛接手個(gè)新業(yè)務(wù),搞不清現(xiàn)狀,小伙伴也東一嘴西一嘴的講的碎碎的,你可以看數(shù)據(jù);
如果你想做某個(gè)需求,人家不給你做,你可以甩數(shù)據(jù)給他看,證明需求的必要性;
如果你不想做某個(gè)需求,但人家硬要你做,你還是可以甩數(shù)據(jù),證明需求無(wú)意義或者效果不理想;
如果你做了需求不知道要不要繼續(xù)迭代下去,你還是可以看數(shù)據(jù),去看用戶的無(wú)聲投票如何;
數(shù)據(jù)是產(chǎn)品、運(yùn)營(yíng)、技術(shù)日常裝備中必不可少的矛和盾。至于什么時(shí)候是矛,什么時(shí)候是盾,那就看不同場(chǎng)合不同情況了。
// 補(bǔ)充:數(shù)據(jù)分析輔助決策,但并不是決策的唯一要素。我并不鼓吹數(shù)據(jù)分析天下第一,請(qǐng)注意,合理使用才是王道。
數(shù)據(jù)的最大天坑
數(shù)據(jù)分析,字面意思,數(shù)據(jù)分析由兩個(gè)部分組成:一是數(shù)據(jù),二是分析。
看起來(lái)跟廢話一樣,但卻也是絕大多數(shù)人都忽略的。
大多數(shù)人在講到數(shù)據(jù)分析的時(shí)候,更加注重的是分析,而并不是數(shù)據(jù)本身,這就造成了數(shù)據(jù)分析最大的誤區(qū):不關(guān)心數(shù)據(jù)怎么來(lái),使勁兒做無(wú)用功。
舉個(gè)簡(jiǎn)單的例子唄?
在App的新版本上,產(chǎn)品經(jīng)理新加了個(gè)子頻道。版本上了一段時(shí)間數(shù)據(jù)穩(wěn)定后,產(chǎn)品經(jīng)理從數(shù)據(jù)發(fā)現(xiàn),哎喲,這個(gè)子頻道很吊炸天啊,點(diǎn)擊率、登錄比等數(shù)據(jù)同比甩其他子頻道N條街啊,恩,說(shuō)明這個(gè)子頻道用戶很需要呀,以后要接著往這個(gè)方向上做。
看似,產(chǎn)品經(jīng)理好像做了正確決策吧?
然而,oh,no,不幸的消息來(lái)了!
程序員在數(shù)據(jù)埋點(diǎn)的時(shí)候不小心埋錯(cuò)了,他把另一個(gè)熱門子頻道的數(shù)據(jù)和這個(gè)新頻道埋在了一起,數(shù)據(jù)計(jì)算的是這兩個(gè)頻道的總和!
(抱歉,程序員又一次實(shí)力背鍋,之后會(huì)為你們正名)
因?yàn)殄e(cuò)誤的數(shù)據(jù),得出了錯(cuò)誤的分析結(jié)果,并且還做了后續(xù)錯(cuò)誤方向的工作,這在日常中其實(shí)并不少見(jiàn),雖然真的很蠢。
有效數(shù)據(jù)分析的前提,是對(duì)正確的數(shù)據(jù)做分析。
分析的最大天坑
數(shù)據(jù)怎么來(lái)的,是基礎(chǔ)。得來(lái)的數(shù)據(jù)怎么分析,是進(jìn)階。光有數(shù)據(jù)不分析,假把式,還糟蹋了人家的SQL。
這就引來(lái)了一個(gè)重要問(wèn)題:為什么要分析?
用基本的分析去了解現(xiàn)狀以及趨勢(shì);
用針對(duì)的分析去驗(yàn)證或者踢翻自己的想法;
看似很簡(jiǎn)單,實(shí)際做起來(lái)卻一點(diǎn)兒都不簡(jiǎn)單。又要舉個(gè)常見(jiàn)例子唄:
新版本發(fā)布了一段時(shí)間,數(shù)據(jù)也穩(wěn)定了,產(chǎn)品經(jīng)理讓實(shí)習(xí)生A、B、C分別做一份用戶對(duì)新版本各項(xiàng)修改內(nèi)容的數(shù)據(jù)分析反饋報(bào)告。
實(shí)習(xí)生A:這個(gè)簡(jiǎn)單啊,數(shù)據(jù)組的同學(xué)一定有數(shù)據(jù),拿過(guò)來(lái)就是了。
最后他把各種原始數(shù)據(jù)表發(fā)給了產(chǎn)品經(jīng)理;
產(chǎn)品經(jīng)理內(nèi)心獨(dú)白:X,我要你有個(gè)啥用?
實(shí)習(xí)生B:這個(gè)工作,數(shù)據(jù)同學(xué)說(shuō)不定已經(jīng)做了,直接找他問(wèn)就好了嘛。
最后他把數(shù)據(jù)挖掘童鞋的口述內(nèi)容寫(xiě)成了報(bào)告發(fā)給了產(chǎn)品經(jīng)理;
產(chǎn)品經(jīng)理內(nèi)心獨(dú)白:雖然比之前的那個(gè)好,但依舊X,你自己的腦子呢?
實(shí)習(xí)生C:這個(gè)報(bào)告不是那么好寫(xiě)的,至少得:
看下新增、優(yōu)化、影響了哪些地方做重點(diǎn)觀察;
圍繞著這些地方,分別列好目標(biāo)和可能的猜想;
找數(shù)據(jù)挖掘童鞋聊并且記錄根據(jù)他的角度數(shù)據(jù)處于什么樣的情況,還得記得拿原始數(shù)據(jù);
自己再做一次針對(duì)性的數(shù)據(jù)分析工作;
得出一些結(jié)論,保留一些疑惑等;
最后他把根據(jù)以上步驟得出的觀點(diǎn)做成了報(bào)告發(fā)給了產(chǎn)品經(jīng)理,同時(shí)附帶了原始數(shù)據(jù)的各種變形計(jì)算;
產(chǎn)品經(jīng)理內(nèi)心獨(dú)白:這個(gè)上道,可以的可以的。
實(shí)習(xí)生A、B其實(shí)都屬于沒(méi)有搞清楚為什么要分析,分析的目的到底是什么。沒(méi)有想清楚這一環(huán)節(jié),自然給到的分析結(jié)果也沒(méi)什么用了。
分析目的是指南針,只有方向?qū)α?,后續(xù)的各種分析方法以及分析結(jié)果才有意義。
上文舉的例子,其實(shí)一部分說(shuō)明了數(shù)據(jù)分析過(guò)程中除了以上兩大坑之外的一些其他小坑坑,下面也來(lái)簡(jiǎn)單列一列:
1. 小團(tuán)隊(duì)的數(shù)據(jù)正確性很難被保證
這個(gè)就是上文舉例的時(shí)候我說(shuō)會(huì)為開(kāi)發(fā)同學(xué)正名的部分。大公司暫且不說(shuō),畢竟,光是數(shù)據(jù)支持團(tuán)隊(duì)就比人家小公司一整個(gè)團(tuán)隊(duì)的人還要多了。
小公司往往沒(méi)有資源去組建自己的數(shù)據(jù)團(tuán)隊(duì),這個(gè)時(shí)候就要使用各種第三方的統(tǒng)計(jì)軟件來(lái)做數(shù)據(jù)埋點(diǎn)。
代碼埋點(diǎn)會(huì)產(chǎn)生很多問(wèn)題,例如:
可能因?yàn)椴煌绦騿T的頁(yè)面代碼寫(xiě)法不同,計(jì)算結(jié)果不同;
可能因?yàn)槁顸c(diǎn)過(guò)程中沒(méi)有溝通好,出現(xiàn)理解偏差,計(jì)算結(jié)果不同;
可能因?yàn)殚_(kāi)發(fā)不小心埋錯(cuò)點(diǎn),計(jì)算結(jié)果不同;
可能因?yàn)榘姹镜薷牧四硞€(gè)地方,導(dǎo)致計(jì)算結(jié)果不同;
非常多可能性,導(dǎo)致埋點(diǎn)錯(cuò)誤,從而導(dǎo)致數(shù)據(jù)錯(cuò)誤。每次看移動(dòng)端數(shù)據(jù),都要ios和android端一起對(duì)著看,誰(shuí)能懂?特么的跟偵探一樣樣的。
2. 存在已久并不代表一定正確
這個(gè)存在已有,不僅是指數(shù)據(jù),同樣也指分析結(jié)果。
某個(gè)數(shù)據(jù)存在已有,所有人都對(duì)Ta沒(méi)有質(zhì)疑,這就能說(shuō)明這個(gè)數(shù)據(jù)沒(méi)錯(cuò)了么?
其實(shí)不一定哦,也許這個(gè)數(shù)據(jù)從未被人注意過(guò),也有可能大家都把質(zhì)疑數(shù)據(jù)的正確性這個(gè)前提給忽略掉了。
所以,如果在分析的過(guò)程中發(fā)現(xiàn),數(shù)據(jù)的橫向?qū)Ρ然蛘呖v向?qū)Ρ?,結(jié)果存在一定的違背,那么這個(gè)時(shí)候就要注意了。
至于分析結(jié)果的存在已久嘛,沒(méi)啥好說(shuō)的,產(chǎn)品功能、產(chǎn)品運(yùn)營(yíng)手法都有可能導(dǎo)致數(shù)據(jù)的大變動(dòng),分析時(shí)段自然要比較新鮮才有用。
3. 數(shù)據(jù)條件很重要
數(shù)據(jù)條件是什么意思?說(shuō)白了就是放在數(shù)據(jù)這兩字前的定語(yǔ),即:什么樣的數(shù)據(jù)(這是定語(yǔ)還是形容詞,傻傻搞不清)?
舉個(gè)例子:
極度活躍用戶、一般活躍用戶、不活躍用戶、沉默用戶、流失用戶。在用戶之前的字就是數(shù)據(jù)條件。
為啥說(shuō)數(shù)據(jù)條件很重要呢?
原因在于:不同條件的數(shù)據(jù)在各項(xiàng)指標(biāo)上可能都會(huì)差異非常大,而無(wú)法用簡(jiǎn)單的均值來(lái)做概括。例如極度活躍用戶在活躍天數(shù)、活躍時(shí)長(zhǎng)、日活躍次數(shù)、留存率等上都會(huì)甩掉其他用戶好幾個(gè)級(jí)別。
當(dāng)然,更為日常的情況是,在和數(shù)據(jù)同學(xué)溝通的時(shí)候,一定要先確保大家的溝通前提處在同一條件下,不然很可能出現(xiàn)的情況是:拿到的數(shù)據(jù)是正確的,但是條件是偏差的。
4. 第一手分析很重要
很多小伙伴喜歡偷懶,覺(jué)得有數(shù)據(jù)挖掘同學(xué)分析數(shù)據(jù)就可以了,但其實(shí)并不是這樣的。
其一:除了數(shù)據(jù)本身是客觀的之外,對(duì)數(shù)據(jù)做的任何處理都是主觀的,不管是用模型還是各種數(shù)據(jù)之間的變形計(jì)算,都是主觀的,差別在于主觀的程度多少而已,每個(gè)人都會(huì)站在自己的背景知識(shí)去處理數(shù)據(jù),如何保證別人的和自己相同呢?
其二:在分析數(shù)據(jù)的過(guò)程中,一般來(lái)說(shuō),各種橫縱向?qū)Ρ?,是可以發(fā)現(xiàn)一些自己之前沒(méi)有注意過(guò)的結(jié)論的。而這點(diǎn),別人幫你分析的過(guò)程中,一般這些信息無(wú)形中就不見(jiàn)了。
5. 分析具有聯(lián)動(dòng)性
絕大多數(shù)情況下,單獨(dú)看某一個(gè)數(shù)據(jù),一般意義不那么大,或者說(shuō)達(dá)不到更好的效率。
舉些例子:
評(píng)價(jià)某模塊做的好不好,只看絕對(duì)uv,而不同時(shí)看模塊登錄比,介是耍流氓;
評(píng)價(jià)內(nèi)容做的好不好,只看生產(chǎn)的絕對(duì)量,而不同時(shí)看不同類型內(nèi)容的分別用戶uv占比/生產(chǎn)量,介也是耍流氓;
聯(lián)動(dòng)的看數(shù)據(jù),才能更加綜合的去判斷。
作者:Killifer
end
小伙伴課程咨詢 添加微信:lovedata19 備注「B站」即可
