最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

數(shù)據(jù)分析的三個階段

2020-02-12 21:38 作者:愛數(shù)據(jù)分析社區(qū)  | 我要投稿

從大學到現(xiàn)在,我已經(jīng)花了10年的時間在數(shù)據(jù)分析的學習和工作上,也幾乎見證了大數(shù)據(jù)行業(yè)從興起到普及的過程。10年之前,數(shù)據(jù)還是一種稀缺的資源,我做助研的時候甚至還花了很多時間手抄數(shù)據(jù)。到了現(xiàn)在,每個人方方面面的行為都可以被數(shù)據(jù)刻畫了,這的確是非常巨大的變化。

但在這個過程中,我也經(jīng)歷了所謂的大數(shù)據(jù)行業(yè)從眾星捧月到監(jiān)管收緊的過程。就像任何新興的行業(yè)一樣,大數(shù)據(jù)從業(yè)人員也魚龍混雜,很多人忙著掙快錢,但是沒有足夠多的人愿意在技術(shù)和思考上花足夠的時間,這是一件令人遺憾的事。

從我個人的體會來說,數(shù)據(jù)分析至少存在三個階段。第一個階段是熟練計算階段,也就是能從數(shù)據(jù)中正確計算出結(jié)論。這一階段需要的是編程能力和基礎的邏輯分析。在過去幾年中,我明顯看到行業(yè)內(nèi)的編程水平有顯著提升。10年前,相當多的分析師都在使用Excel進行分析,但到了今天,大多數(shù)分析師都能熟練使用至少一種統(tǒng)計編程語言了。這的確是巨大的進步。

然而達到熟練計算只是一個起點,我很快發(fā)現(xiàn)計算本身并不能得出結(jié)論。就像經(jīng)濟學常舉的例子一樣:冰淇淋銷量越高,游泳溺水的人越多,這兩者并不具有因果關系。它們共同的影響因素是氣溫,只有當溫度高的時候,冰淇淋才會銷量好,游泳的人才會更多。那么如果單純看數(shù)據(jù),不加以分析,顯然是無法得出正確的結(jié)論的。

遺憾的是,有很多人將數(shù)據(jù)分析簡化成了一種計算器一樣的工作,只要每周算出一個填滿了數(shù)字的報表就覺得滿意了。事實上并非如此。我們可能會看到“7天學會Python”的課程廣告,但是7天不能學會數(shù)據(jù)分析。我在上大學的時候經(jīng)常做出一些p-value<0.5的顯著結(jié)論。拿給導師看,導師經(jīng)常會問我:你覺得這是不是巧合?我也不知道這是不是巧合。這就是第一個階段的狀態(tài),我通過計算能得出數(shù)字,但并沒有觀點。

第二個階段是熟練分析階段,這時不僅能計算出數(shù)字,還能得出相對正確的分析。每當拿到一份分析報告,我經(jīng)常會問寫報告的同事:“你的觀點是什么?”但很多時候作者并沒有觀點。我覺得這是不夠的。分析是一個不斷練習的過程,剛開始分析肯定會產(chǎn)生錯誤的觀點,甚至熟練之后依然會產(chǎn)生錯誤的觀點。但如果進行足夠的多的分析,最后是可以提高分析的準確性的,從而能夠詮釋一些復雜的問題。

曾經(jīng)聽過前同事的一個演講,非常有趣。他們幫助一款APP做用戶留存分析,發(fā)現(xiàn)該APP的次日留存率、7日留存率和第2個月留存率都非常高,但是用戶量就是無法增長。這真是令人百思不得其解。認真思考后,才發(fā)現(xiàn)原來因為這是一款陌生人交友APP,當持續(xù)活躍的用戶在2-3個月的時間里找到了合適的朋友之后,就會和固定的伙伴轉(zhuǎn)入微信溝通,不再使用該APP了。所以這個APP在2個月之后的留存下降很快。我覺得這就是一個很有趣的分析,這就是熟練的分析師應該掌握的能力。

第三個階段是熟練預測階段,事實上,當對一個問題理解足夠深刻之后,數(shù)字應該變成驗證猜想的證據(jù),而不是分析的主要信息來源。有一個故事是說某學生負責幫導師更新報表,報表上有幾百個數(shù)字。導師一看,就指著一個數(shù)字說:“這個數(shù)字算錯了?!睂W生非常驚訝,問:“您為什么能看出這一個數(shù)字算錯了呢?”導師說:“因為我知道對的數(shù)字應該是什么?!?/p>

我剛工作的時候,大家依賴于經(jīng)驗進行判斷,而對數(shù)據(jù)分析出來的結(jié)果并不信賴。到了現(xiàn)在,我也傾向于依據(jù)經(jīng)驗進行分析。雖然如此,但我覺得數(shù)據(jù)分析和經(jīng)驗判斷是一個相輔相成的關系。一個足夠有經(jīng)驗的人,應該能提出合理的假設,并且用最少的數(shù)據(jù)進行驗證,從而更高效地得出結(jié)論。但如果只依賴數(shù)據(jù),又會容易得出隨著樹越長越高,我國的GDP會越來越高這種荒謬的結(jié)論。所以數(shù)據(jù)分析要建立在經(jīng)驗的基礎上,才能發(fā)揮重要的決策作用。

我選擇數(shù)據(jù)分析作為工作時曾經(jīng)有一點擔心:雖然我上學時對數(shù)據(jù)分析很感興趣,但當興趣變成工作之后,我是否還能保持同樣的熱情呢。幸運的是,在工作的過程中,我逐漸發(fā)現(xiàn)數(shù)據(jù)分析并不是一個技能導向的工作,而是一個思考導向的工作。技術(shù)很快就能掌握,但是對問題的理解是無法速成的。

很多人會覺得數(shù)據(jù)分析的核心是編程、模型和技術(shù)能力,從而在工作中很快失望。因為工作中大多數(shù)時候不需要那么復雜的算法,讓人覺得自己掌握的算法等等不過是屠龍之技。然而解決問題的核心是清晰的思路。一個看透本質(zhì)的分析師用Excel就能做出足夠好的分析。各種技術(shù)都是工具,只有善于運用這些工具才能最快最好地解決問題。

我經(jīng)常會想起一些前瞻性的成果,包括經(jīng)濟學上的創(chuàng)新性論文、包括iPhone這樣超越時代的設計、包括十年磨一劍的企業(yè)云服務等等。我覺得這些都體現(xiàn)了對行業(yè)的前瞻性的理解。數(shù)據(jù)分析也是一樣,我們不能被數(shù)據(jù)所束縛,而是要利用數(shù)據(jù)摸索尚未成形的方向。我覺得這就是數(shù)據(jù)分析更高的目標。

end.

作者:DW.

想了解更多數(shù)據(jù)分析內(nèi)容請掃描下方二維碼


數(shù)據(jù)分析的三個階段的評論 (共 條)

分享到微博請遵守國家法律
兴宁市| 天等县| 方正县| 噶尔县| 阿图什市| 开远市| 尼勒克县| 乳源| 乃东县| 河源市| 兴仁县| 巴林右旗| 肥城市| 英吉沙县| 慈利县| 大名县| 交城县| 石河子市| 嵩明县| 德化县| 翁牛特旗| 株洲县| 肇源县| 石嘴山市| 阳山县| 宁夏| 若尔盖县| 旬阳县| 陵川县| 仁布县| 景德镇市| 江口县| 聊城市| 通道| 陕西省| 东乡族自治县| 林周县| 方正县| 南宫市| 丹棱县| 金华市|