Excel做數(shù)據(jù)分析?是真的很強(qiáng)!
:
知乎:Jackpop,粉絲10萬(wàn)+,每日更新精品內(nèi)容!
做數(shù)據(jù)分析可能會(huì)用到很多工具,Python、R、Java等等。
但是,無(wú)論如何都無(wú)法繞開Excel。雖然涉及到生產(chǎn)的項(xiàng)目都會(huì)用編程語(yǔ)言或者SQL開發(fā),但是日常的一些探查和分析都會(huì)用到Excel。
如何用Excel進(jìn)行數(shù)據(jù)分析,我認(rèn)為可以拆成2個(gè)方面來(lái)看,一個(gè)是從Excel角度,一個(gè)是從數(shù)據(jù)分析角度。
因此,我把Excel分析拆解為兩步:
掌握Excel
數(shù)據(jù)分析
下面,就來(lái)從這兩個(gè)方面來(lái)逐步介紹如何利用Excel進(jìn)行數(shù)據(jù)分析。
一、 掌握Excel
我認(rèn)為,學(xué)習(xí)一樣知識(shí)不應(yīng)該馬上一頭扎進(jìn)去學(xué)習(xí),而是要理清學(xué)習(xí)計(jì)劃,循序漸進(jìn),條例清晰。
針對(duì)Excel學(xué)習(xí),我把它分為4個(gè)層級(jí):
新手
中級(jí)
高級(jí)
專家
下面就逐級(jí)介紹一下要學(xué)習(xí)的內(nèi)容。
新手
其實(shí)絕大多數(shù)自認(rèn)為會(huì)Excel的同學(xué)都處于新手階段。
對(duì)于新手階段,我認(rèn)為重點(diǎn)應(yīng)該是學(xué)會(huì)Excel的基本操作,例如,最基本的新建、輸入、保存、插入、新建sheet,以及一些簡(jiǎn)單的函數(shù),例如,SUM、IF、AVERAGE、COUNT、ROUND.
中級(jí)
針對(duì)文本、日期、數(shù)學(xué)運(yùn)算能夠輕松構(gòu)建公式,此外,需要了解一些深入的功能,例如,數(shù)據(jù)透視表、vlookup知道什么是插件以及如何安裝插件,了解并且可以使用自動(dòng)篩選功能,可以錄制宏并使用,可以成功編輯/修改簡(jiǎn)單錄制的宏。
中級(jí)公式:SUMIF、COUNTIF、VLOOKUP、CHOOSE、MID
高級(jí)
在高級(jí)階段,需要重點(diǎn)把精力放在如下方面:
知道什么是數(shù)組公式以及如何使用
可以使用或禁用宏記錄器創(chuàng)建和修改宏
知道如何構(gòu)建可由事件觸發(fā)的宏
熟悉 Excel 中的大多數(shù)函數(shù)
使用 Excel 進(jìn)行簡(jiǎn)單的教學(xué),能夠有成體系的Excel知識(shí)
高級(jí)公式:SUMPRODUCT、INDIRECT、INDEX、MATCH、OFFSET
專家
對(duì)于Excel專家層面,可以通過(guò)Excel構(gòu)建用于分發(fā)和廣泛使用的加載項(xiàng),而且,在這個(gè)層面,就不僅僅是會(huì)用Excel公式,而是能夠清晰的認(rèn)知到每個(gè)公式的優(yōu)缺點(diǎn),能夠在使用中選擇恰到好處的用法。
如何提升Excel水平?
我認(rèn)為很多同學(xué)在學(xué)習(xí)Excel過(guò)程中都是需求推動(dòng)學(xué)習(xí),簡(jiǎn)單來(lái)說(shuō),就是遇到問(wèn)題了,然后去單點(diǎn)的學(xué)習(xí)一下。
我個(gè)人認(rèn)為,如果希望在某個(gè)方面深入學(xué)習(xí),這并不是一個(gè)好的學(xué)習(xí)方法,時(shí)間花費(fèi)的也不少,但是學(xué)的東西零零散散、不成體系。
我把學(xué)習(xí)Excel分為2個(gè)階段:
基本知識(shí)學(xué)習(xí)
日常積累
基本知識(shí)學(xué)習(xí)
在基本知識(shí)學(xué)習(xí)階段,我建議要系統(tǒng)、成體系的的學(xué)習(xí)Excel、了解Excel,知識(shí)它擁有哪些功能,以及每項(xiàng)功能是干什么用的。
這樣,當(dāng)我們遇到問(wèn)題時(shí),至少知道Excel是可以完成這項(xiàng)工作的,然后可以再回頭去加深理解和印象。
在基礎(chǔ)知識(shí)學(xué)習(xí)階段,可以選擇跟隨書本或者一些在線教程學(xué)習(xí)。
不過(guò),我個(gè)人更加推薦選擇一本好的書籍,因?yàn)橐槐镜暮玫臅R(shí)更加詳細(xì)、全面。
這里給大家推薦5本我認(rèn)為還不錯(cuò)的書籍,感興趣的可以選擇適合自己的看一下:
《你早該這么玩excel》
《Excel應(yīng)用大全》
《別怕,Excel函數(shù)其實(shí)很簡(jiǎn)單》
《Excel函數(shù)與公式應(yīng)用技巧》
《Excel VBA 其實(shí)很簡(jiǎn)單》
日常積累
就如同前面所說(shuō),書本知識(shí)讓我們能夠?qū)xcel的基本知識(shí)有一個(gè)框架性的認(rèn)識(shí),如過(guò)真的想成長(zhǎng)為Excel領(lǐng)域的專家,還是需要日常不斷地加深和鞏固。
針對(duì)加深和鞏固,一方面是需要多用,把已掌握知識(shí)從會(huì)用變更熟練。二是不斷汲取新知識(shí),這個(gè)可以通過(guò)多留意一些論壇或者學(xué)習(xí)平臺(tái),“三人行,必有我?guī)煛?,從與人交流中,能夠看到很多自己并不了解的Excel用法。
這里,給大家推薦2個(gè)不錯(cuò)的論壇,不推薦太多,貪多嚼不爛。

Excelhome是一個(gè)知名老牌的Excel論壇,現(xiàn)在已經(jīng)有500萬(wàn)左右用戶,近千萬(wàn)帖子,從Excel基礎(chǔ)知識(shí),到函數(shù)公式、VBA、圖標(biāo)應(yīng)有盡有,不僅資源豐富,而且大牛云集,有非常多優(yōu)質(zhì)原創(chuàng)的內(nèi)容。

和Excelhome一樣,Excel精英論壇也是一個(gè)專業(yè)的Excel交流與分享論壇,技巧、公式、VBA應(yīng)有盡有。論壇中有大量的帖子,羅列了Excel使用中的各種各樣問(wèn)題,里面也有很多Excel大牛回答。
從這些問(wèn)題和解答中,我們可以接觸并學(xué)習(xí)到很多在日常工作中用不到的場(chǎng)景,能夠大大開闊有關(guān)Excel的知識(shí)面。
二、數(shù)據(jù)分析
作為最流行的數(shù)據(jù)分析工具之一,Excel配置了很多圍繞數(shù)據(jù)分析相關(guān)的功能,例如,數(shù)據(jù)透視表,就是一項(xiàng)非常受歡迎的分析工具。
下面,就來(lái)給大家介紹一下如何通過(guò)Excel導(dǎo)入、探索、清理、分析、可視化數(shù)據(jù),深入討論Excel中各種數(shù)據(jù)分析方法。
1. 排序
對(duì)數(shù)據(jù)進(jìn)行排序是數(shù)據(jù)分析中非常關(guān)鍵和重要的部分,可以按多列或者單列對(duì) Excel 數(shù)據(jù)進(jìn)行排序。
排序動(dòng)作主要分為按升序或降序進(jìn)行排序。
單列排序
考慮以下數(shù)據(jù):

讓我們根據(jù)C列T.Bills對(duì)數(shù)據(jù)進(jìn)行排序,要進(jìn)行數(shù)據(jù)排序,需要進(jìn)行如下操作:
單擊要排序的列中的任何單元格。
選擇“開始->排序和篩選”,對(duì)相關(guān)列進(jìn)行排序
排序后的結(jié)果如下:

多列排序
單列排序比較常用也比較基礎(chǔ),下面就介紹稍微復(fù)雜一些的多列排序。
框選多列數(shù)據(jù),點(diǎn)擊“開始->排序和篩選”,選擇“自定義排序”,可以添加多個(gè)排序列,針對(duì)每一列也可以選擇升序或者降序,以及排序的主要依據(jù)、次要依據(jù):

這樣,當(dāng)主要依據(jù)相同的情況下,會(huì)按照次要依據(jù)進(jìn)行排序。
2. 篩選
當(dāng)我們想要獲取與特定條件匹配的數(shù)據(jù)時(shí),我們就需要使用s篩選功能。
單擊數(shù)據(jù)中的任何單個(gè)單元格。
轉(zhuǎn)到數(shù)據(jù)選項(xiàng)卡 > 排序和篩選 > 篩選,這時(shí)候會(huì)發(fā)現(xiàn)每一列前面出現(xiàn)一個(gè)下拉小箭頭,點(diǎn)擊箭頭即可進(jìn)行篩選:

3. COUNTIF
COUNTIF 是一個(gè)非常常用的 Excel 函數(shù),用于對(duì)滿足單個(gè)條件的區(qū)域中的單元格進(jìn)行計(jì)數(shù)。
句法:
=COUNTIF(范圍,條件)
舉個(gè)例子:
讓我們統(tǒng)計(jì)Stock是小于10%的數(shù)量:

這里就可以用到COUNTIF,2個(gè)參數(shù)分別是統(tǒng)計(jì)數(shù)據(jù)的范圍,以及判斷條件。
這只是一個(gè)簡(jiǎn)單的例子,大家可以舉一反三,條件語(yǔ)句在編程語(yǔ)言中就會(huì)經(jīng)常用到,在數(shù)據(jù)統(tǒng)計(jì)中使用同樣非常頻繁。
4. SUMIF
Excel SUMIF函數(shù)返回滿足單個(gè)條件的單元格的總和,用法和COUNTIF類似,都是統(tǒng)計(jì)分析中經(jīng)常會(huì)用到的操作。
句法:
=SUMIF(范圍,標(biāo)準(zhǔn),[sum_range])
5. 數(shù)據(jù)透視表
數(shù)據(jù)透視表是 Excel 中比較強(qiáng)大且用處非常廣泛的一項(xiàng)功能了,我們可以使用它們來(lái)匯總存儲(chǔ)在表中的數(shù)據(jù)。
通過(guò)數(shù)據(jù)透視表,可以組織和重新排列統(tǒng)計(jì)數(shù)據(jù),進(jìn)而可以更清晰的把精力投入到關(guān)鍵和有價(jià)值的信息上面。
假設(shè),我們要對(duì)下面數(shù)據(jù)按照不同世紀(jì)(Cent)進(jìn)行統(tǒng)計(jì)分析。

我們可以點(diǎn)擊“插入->數(shù)據(jù)透視表”,創(chuàng)建一個(gè)透視表,然后選擇自己關(guān)注的維度進(jìn)行分析:

具體效果如下:

是不是看起來(lái)清晰多了?
當(dāng)然,我們可以自由組織篩選器、行、列、統(tǒng)計(jì)值,以滿足我們個(gè)性化的分析需求。
6. 使用求解器進(jìn)行假設(shè)分析
假設(shè)分析是更改值以嘗試公式的不同值(場(chǎng)景)的過(guò)程,你可以在一個(gè)或多個(gè)公式中使用幾組不同的值來(lái)探索所有不同的結(jié)果。
求解器是一個(gè) Microsoft Excel 插件程序,在假設(shè)分析中能夠提供許多層面幫助。
我們可以使用此功能在一個(gè)單元格(稱為目標(biāo)單元格)中找到公式的最佳(最大值或最小值)值。 這受到工作表上其他公式單元格值的一些約束或限制。
求解器使用一組單元格,稱為決策變量或簡(jiǎn)稱為變量單元格,用于計(jì)算目標(biāo)和約束單元格中的公式。 求解器還會(huì)調(diào)整決策變量單元格的值以處理約束單元格的限制。
因此,這有助于為目標(biāo)單元產(chǎn)生所需的結(jié)果。
激活求解器插件
在文件選項(xiàng)卡上,單擊選項(xiàng),轉(zhuǎn)到加載項(xiàng),選擇 Solver Add-in,然后單擊 Go 按鈕。

檢查求解器插件,并單擊 OK:

在數(shù)據(jù)選項(xiàng)卡的分析組中,可以看到添加了求解器選項(xiàng)。

如何在 Excel 中使用求解器?
在這個(gè)例子中,我們將嘗試找到一個(gè)簡(jiǎn)單優(yōu)化問(wèn)題的解決方案。
問(wèn)題:假設(shè)你是一家企業(yè)的所有者,并且希望你的收入為 3000 美元。
目標(biāo):計(jì)算要銷售的單位和單位價(jià)格以實(shí)現(xiàn)目標(biāo)。
例如,我們創(chuàng)建了以下模型:

在數(shù)據(jù)選項(xiàng)卡的分析組中,單擊求解器按鈕
在設(shè)定的目標(biāo)中,選擇收入單元格并將其值設(shè)置為 3000 美元
要更改變量單元格,請(qǐng)選擇 C3、C4 和 C8 單元格

點(diǎn)擊求解
會(huì)發(fā)現(xiàn)模型會(huì)發(fā)生一些變化:

看似非常簡(jiǎn)單的幾步操作,其實(shí)它背后涉及負(fù)載的數(shù)學(xué)計(jì)算和優(yōu)化問(wèn)題。
而通過(guò)Excel求解器只需要簡(jiǎn)單的幾步就可以完成,在這方面來(lái)說(shuō),Excel在數(shù)據(jù)分析方面的確很強(qiáng)大。
7. 數(shù)據(jù)分析工具包
單擊文件選項(xiàng)卡,單擊選項(xiàng),然后單擊加載項(xiàng)類別
選擇 Analysis ToolPak 并單擊 Go 按鈕
檢查分析工具庫(kù)并單擊確定

在“數(shù)據(jù)”選項(xiàng)卡的“分析”組中,您現(xiàn)在可以單擊“數(shù)據(jù)分析”:

添加圖片注釋,不超過(guò) 140 字(可選)
在數(shù)據(jù)分析工具包中,Excel提供了非常多類似于求解器一樣的大大解決數(shù)據(jù)分析難度的功能和設(shè)計(jì)。
8. 描述性統(tǒng)計(jì)
顧名思義,只需要給它簡(jiǎn)單的描述,它就可以根據(jù)需求進(jìn)行分析數(shù)據(jù),例如:
平均值、中位數(shù)、眾數(shù)和范圍
方差和標(biāo)準(zhǔn)差
假設(shè),我們有一個(gè)擊球手最近 10 場(chǎng)比賽的得分,要生成描述性分析,請(qǐng)按照以下步驟操作。
轉(zhuǎn)到數(shù)據(jù)選項(xiàng)卡 > 分析組 > 數(shù)據(jù)分析
選擇描述性統(tǒng)計(jì)并單擊確定

選擇輸入的范圍
選擇要顯示輸出的范圍
檢查匯總統(tǒng)計(jì)信息
到此為止,描述性分析結(jié)果就出來(lái)了:
9. 方差分析
Excel中的ANOVA(方差分析)是一種統(tǒng)計(jì)方法,用于測(cè)試兩個(gè)或多個(gè)平均值之間的差異,無(wú)論是用Excel還是Python或者R,方差分析都是數(shù)據(jù)分析中常用的方法。
給出一份數(shù)據(jù),下面是三名擊球手最近 8 場(chǎng)比賽的得分:

要進(jìn)行單因子方差分析,需要按照以下步驟操作:
轉(zhuǎn)到數(shù)據(jù)選項(xiàng)卡 > 分析組 > 數(shù)據(jù)分析
選擇 Anova: Single Factor 并單擊 OK
選擇輸入和輸出,然后點(diǎn)擊確定
這樣方差分析結(jié)果就好了:
10. 回歸分析
在 Excel 中,我們使用回歸分析來(lái)估計(jì)兩個(gè)或多個(gè)變量之間的關(guān)系。
考慮以下數(shù)據(jù),其中我們?cè)谔囟ㄔ路蒌N售了幾個(gè) COVID 病例和口罩。
轉(zhuǎn)到數(shù)據(jù)選項(xiàng)卡 > 分析組 > 數(shù)據(jù)分析
選擇回歸并單擊確定
它UI打開如下參數(shù)窗口:
選擇輸入 Y 范圍作為銷售的口罩?jǐn)?shù)量,輸入 X 范圍作為 COVID 病例,檢查殘差并單擊確定,我們會(huì)獲得如下信息:
Multiple R是衡量?jī)蓚€(gè)變量之間線性關(guān)系強(qiáng)度的相關(guān)系數(shù)。
R Square 表示確定系數(shù),用作擬合優(yōu)度的指標(biāo)。 在 R Square 的幫助下,可以跟蹤有多少點(diǎn)落在回歸線上。
Standard Error是另一種擬合優(yōu)度度量,它顯示了回歸分析的精度。
通過(guò)這篇內(nèi)容,我先介紹了如何學(xué)習(xí)和進(jìn)階Excel,然后圍繞Excel數(shù)據(jù)分析,從淺入深,其中有比較簡(jiǎn)單的排序、篩選,也有較復(fù)雜的求解器、方差分析、回歸分析,這些都是數(shù)據(jù)分析工作中經(jīng)常會(huì)用到的。在以往,我們需要通過(guò)編程語(yǔ)言實(shí)現(xiàn)復(fù)雜的算法,或者安裝調(diào)用第三方工具包,其實(shí)通過(guò)Excel也能夠輕松應(yīng)對(duì),而且更節(jié)省時(shí)間。因此,作為一款強(qiáng)大的數(shù)據(jù)分析工具,Excel不僅能夠處理一些常規(guī)的數(shù)據(jù)處理,還可以處理很多復(fù)雜的數(shù)據(jù)分析需求。