數(shù)據(jù)分析第1篇|概念掃盲:三個(gè)簡(jiǎn)單故事,輕松理解數(shù)據(jù)分析

1 契機(jī):為什么要做這個(gè)專題?
從今天起,打算做一個(gè)關(guān)于數(shù)據(jù)分析的專題,分享給大家。
首先聲明,這不是廣告,也不是賣課,放心閱讀。
我研究生畢業(yè)后的第一份工作就是「數(shù)據(jù)分析師」,一路走來(lái),從數(shù)據(jù)分析師,再到數(shù)據(jù)產(chǎn)品經(jīng)理,如今已是第 7 個(gè)年頭。
因?yàn)橐恢笔桥d趣驅(qū)動(dòng),而且天性愛(ài)折騰,所以這 7 個(gè)年頭里自認(rèn)為沒(méi)有一天是安于現(xiàn)狀,對(duì)我來(lái)說(shuō)工作就是生活,生活就是工作,從來(lái)沒(méi)有分開過(guò)。
再加上工作之余又熱愛(ài)編程,經(jīng)常在「人文幫」公眾號(hào)分享一些我原創(chuàng)的數(shù)據(jù)分析與數(shù)據(jù)處理工具,所以對(duì)數(shù)據(jù)還是有較深的認(rèn)知和理解。
最近在對(duì)自己在數(shù)據(jù)這塊的認(rèn)知和經(jīng)驗(yàn)進(jìn)行梳理沉淀,分享給大家,既是對(duì)自己職業(yè)生涯的一個(gè)復(fù)盤,也希望通過(guò)這個(gè)過(guò)程,進(jìn)一步提升自己的專業(yè)能力。
還有一個(gè)虛榮心的因素,我想讓錦一在長(zhǎng)大后,可以看到她爸爸過(guò)往寫過(guò)的文字,做過(guò)的工作,可以對(duì)別人說(shuō):看,這是我爸爸寫的,厲害吧!
2 關(guān)于數(shù)據(jù)分析的三個(gè)故事
言歸正傳,什么是數(shù)據(jù)分析?先來(lái)看下維基百科的定義:
數(shù)據(jù)分析是一種統(tǒng)計(jì)學(xué)[1]常用方法,其主要特點(diǎn)是多維性和描述性。有些幾何方法有助于揭示不同的數(shù)據(jù)之間存在的關(guān)系,并繪制出統(tǒng)計(jì)信息圖,以更簡(jiǎn)潔的解釋這些數(shù)據(jù)中包含的主要信息。
有點(diǎn)晦澀,簡(jiǎn)單來(lái)說(shuō),數(shù)據(jù)分析就是從數(shù)據(jù)中提取有價(jià)值的信息的過(guò)程,進(jìn)而用于決策。
我講三個(gè)故事,來(lái)幫助你理解一下這個(gè)概念。
故事 1
有一次,帶錦一去一家兒童游樂(lè)場(chǎng)去玩,到吃午飯時(shí)間了,帶著錦一去吃飯。
負(fù)一樓是個(gè)美食廣場(chǎng),那么多吃的,去哪一家呢?正打算打開美團(tuán)看看評(píng)分,錦一大喊:我要去那家!我要去那家!
原來(lái)那是一家主打兒童套餐的餐廳,我問(wèn)錦一,為什么去選擇這個(gè)呢?
錦一說(shuō):你看嘛!這里有那么多小朋友都在這里吃飯呢。所以我也想去這里吃。
故事 2:
我最近想要買一個(gè)顯示器。我的預(yù)算 2000 元內(nèi),要求分辨率在 2k 以上,那我要買哪一款呢?
很快,我就在京東上鎖定了幾款顯示器,為避免打廣告的嫌疑,就不放截圖了。
我大致看了下每個(gè)顯示器的評(píng)價(jià),評(píng)分,最終下單買了其中一款。
故事 3:
這個(gè)故事相信你肯定也經(jīng)歷過(guò)或者即將經(jīng)歷,那就是寫畢業(yè)論文,而且要求是有實(shí)證分析的畢業(yè)論文。
研究生畢業(yè)時(shí),我的論文主題是「我國(guó)上市公司財(cái)務(wù)重述與終極控制股東性質(zhì)的相關(guān)性」。
所謂的財(cái)務(wù)重述,你可以簡(jiǎn)單理解為「發(fā)了財(cái)務(wù)報(bào)告后」發(fā)現(xiàn)不對(duì),又發(fā)布補(bǔ)充或者修正公告。
這個(gè)過(guò)程很煎熬。
那個(gè)時(shí)候我還不會(huì)使用 Python,要去收集近 7 年每家上市公司是否發(fā)布過(guò)修正公告,要逐個(gè)去確認(rèn)。
最后再根據(jù)收集的這個(gè)數(shù)據(jù)進(jìn)行邏輯回歸分析,最終得出財(cái)務(wù)重述與上市公司控制股東性質(zhì)的結(jié)論。
以上三個(gè)故事,其實(shí),每個(gè)故事都是一個(gè)數(shù)據(jù)分析的過(guò)程。
在第一個(gè)故事里,錦一雖然只有 4 歲,但是她靠餐廳中其他小朋友的數(shù)量決定了要去哪里吃飯。
在第二個(gè)故事里,我通過(guò)京東提供的價(jià)格數(shù)據(jù)和評(píng)價(jià)數(shù)據(jù)進(jìn)行分析,最終決定了我要買哪一款。
第三個(gè)故事里,我通過(guò)邏輯回歸等分析方法分析數(shù)據(jù),最終得出結(jié)論,完成論文。
相信通過(guò)以上三個(gè)故事,你已經(jīng)理解什么是數(shù)據(jù)分析了。
其實(shí),數(shù)據(jù)分析并不是數(shù)據(jù)分析師的專屬,人人都是數(shù)據(jù)分析師。
比如說(shuō)中午去哪里吃飯,周末去哪里玩,你要和誰(shuí)約會(huì),去哪里約會(huì)……
這些生活日常,你如果深究下來(lái),你會(huì)發(fā)現(xiàn),背后都有數(shù)據(jù)的影子,只是你沒(méi)有注意到罷了。
參考資料
https://www.yuque.com/soaringsoul/data_analysis