Tableau簡介與數(shù)據(jù)分析出路|Tableau基本功
從事數(shù)據(jù)分析工作的同學一般離不開工具三件套:Excel+SQL+一款可視化工具。
Excel是日常高頻、處理小數(shù)據(jù)量的通用的最佳工具,SQL是數(shù)據(jù)庫取數(shù)的常見工具,而數(shù)據(jù)可視化工具則是將規(guī)范的標準的數(shù)據(jù)加工成美觀的圖表的手段,一般意義上指的是PowerBI、Tableau。如果有進一步崗位需求,比如大數(shù)據(jù)處理、高級建?;蛘邫C器學習,Python、R等也是需要掌握的。
這些工具的使用確實能大大提高工作產(chǎn)出效率,但學習曲線和學習成本卻有所差異。就我而言,三件套已經(jīng)能滿足日常所需,而Tableau是近幾年數(shù)據(jù)分析工具學習中ROI比較高的一款。
我最早接觸Tableau大概不晚于2018年,因為我之前也遇到了很多同學類似的問題,想找一款既能敏捷地做數(shù)據(jù)分析、圖表顏值又在線的工具。在檢索的過程中注意到了PowerBI和Tableau,并且隨后這兩款工具都深入學習過。但Tableau真正用起來還是在2019年以后,在斷斷續(xù)續(xù)學了幾個視頻教程、實際制作了幾份可視化作品之后,我切實感受到Tableau帶來的靈便和創(chuàng)造力,于是我決定將Tableau進階提升作為年度主攻計劃之一。
本著輸出倒逼輸入的思想,接下來我將結(jié)合自己過往和未來學習和使用Tableau的經(jīng)驗、心得開設“Tableau基本功”專題,希望記錄自己學習和探索使用Tableau開展數(shù)據(jù)分析和可視化的過程,同時給那些對Tableau感興趣的同學一些參考和指引,歡迎關(guān)注、點贊、收藏、轉(zhuǎn)發(fā)。
今天是Tableau基本功專題的第一篇,主要介紹Tableau的歷史、產(chǎn)品以及產(chǎn)品特點。
Tableau是什么
Tableau是當今數(shù)據(jù)科學和商業(yè)智能(BI)專業(yè)人士使用率較高的數(shù)據(jù)可視化工具之一。
根據(jù)權(quán)威評級Gartner魔力象限(Gartner? Magic Quadrant? for Analytics and Business Intelligence Platforms),Tableau自2013年連續(xù)位居魔力象限分析和商業(yè)智能平臺的領(lǐng)導者位置,同處在領(lǐng)導者區(qū)間的還有微軟的PowerBI以及追趕者Qlik。

所謂商業(yè)智能(BI),根據(jù)Tableau官網(wǎng)的介紹:
Business intelligence combines business analytics, data mining, data visualization, data tools and infrastructure, and best practices to help organizations make more data-driven decisions
商業(yè)智能結(jié)合商業(yè)分析、數(shù)據(jù)挖掘、數(shù)據(jù)可視化、數(shù)據(jù)工具和設施以及最佳實踐幫助企業(yè)產(chǎn)出更多數(shù)據(jù)驅(qū)動的決策
而根據(jù)維基百科的定義:
Business intelligence (BI) comprises the strategies and technologies used by enterprises for the data analysis and management of business information.
商業(yè)智能是企業(yè)為了數(shù)據(jù)分析和商業(yè)信息管理所使用的策略和技術(shù)
而我認為更加直觀和準確的定義來自于博主Josh Fruhlinger:
Business intelligence (BI) leverages software and services to transform data into actionable insights that inform an organization’s strategic and tactical business decisions
商業(yè)智能借助于軟件和服務將數(shù)據(jù)轉(zhuǎn)化為可執(zhí)行的洞見以輔助企業(yè)制定戰(zhàn)略和策略性的商業(yè)決策。
Tableau作為一款商業(yè)智能軟件整合了數(shù)據(jù)管理、數(shù)據(jù)清洗、數(shù)據(jù)分析、數(shù)據(jù)可視化、數(shù)據(jù)預測等等數(shù)據(jù)分析過程,通過自助式和敏捷的手段高效傳遞數(shù)據(jù)信息、輔導商業(yè)決策。
因為其簡單的拖拉拽的輕便操作、高顏值的圖表視覺以及靈活的交互,Tableau受到來自世界各國數(shù)據(jù)愛好者的喜愛,目前是國外企業(yè)首選的、與PowerBI并列的數(shù)據(jù)和處理分析工具。
Tableau簡史

Tableau最初來自斯坦福大學教授Pat Hanrahan指導的在讀博士( PhD candidate)Chris Stolte,Chris Stolte的博士答辯作品原型(prototype PhD system)(大概就是Chris Stolte和導師Pat Hanrahan在2000年還合著的一篇論文《Polaris: A System for Query, Analysis and Visualization of Multi-dimensional Relational Databases》所提及的Polaris系統(tǒng))就是后來的Tableau雛形,其核心創(chuàng)新是發(fā)明了一個叫做 VizQL 的領(lǐng)域特定語言(domain-specific language ),它將數(shù)據(jù)的查詢和數(shù)據(jù)可視化編碼結(jié)合起來,這也是后來的Tableau成功的基礎(chǔ)和后續(xù)創(chuàng)新的主要來源。
Chris Stolte 在加拿大西蒙菲莎大學(Simon Fraser University,又名西蒙弗雷澤大學,簡稱SFU)取得本科學位,畢業(yè)后做過數(shù)據(jù)庫的軟件工程師,直到成為Pat Hanrahan教授的博士生。
Pat Hanrahan是斯坦福大學計算機圖形領(lǐng)域的全職教授,他曾經(jīng)是動畫公司皮克斯的早期員工,因圖形渲染方面的貢獻獲得奧斯卡獎。
Christian Chabot在斯坦福大學獲得工商管理碩士學位,早些時候與Chris Stolte合伙創(chuàng)業(yè)做自動生成地圖幫助人們導航,他在2003年參加了 Chris 的論文答辯。
2003年,三位來自斯坦福大學的數(shù)據(jù)庫和圖形處理方面的愛好者和專家正式創(chuàng)立了Tableau。
2004年,Tableau 獲得了A輪融資,還與數(shù)據(jù)庫公司 Hyperion 簽訂了首份 OEM 合同;
2005年4月,Tableau V1.0版本發(fā)布;
2007年11月,發(fā)布企業(yè)數(shù)據(jù)共享和管理平臺Tableau Server;
2008年,第一屆Tableau Conference大會召開;
2010年,創(chuàng)始人曾認真地考慮以2.5億美元賣掉Tableau公司;
2010年2月,免費產(chǎn)品Tableau Public問世,它允許學生、博主、數(shù)據(jù)新聞記者在網(wǎng)頁上分享數(shù)據(jù)可視化作品,Tableau Public社區(qū)以及之前的Tableau Conference大會大大地推動了Tableau社區(qū)的增長。
2013年3月發(fā)布云產(chǎn)品Tableau Online;
2013年5月Tableau公司在紐交所IPO上市,股票代碼DATA;
2018年6月,Tableau公司收購Empirical Systems,這是一家來自麻省理工學院概率計算實驗室(Probabilistic Computing Project)的人工智能初創(chuàng)公司,其自動化統(tǒng)計分析技術(shù)可被集成到 Tableau 平臺;
2019年6月,Tableau公司被全球SaaS行業(yè)巨頭、美國客戶關(guān)系管理(CRM)軟件服務商Salesforce 以 157 億美元收購,三位創(chuàng)始人退出;
2021年3月,發(fā)布Einstein Discovery功能,加速在機器學習方面的探索;
Tableau產(chǎn)品線

基于網(wǎng)絡資料,Tableau目前主要的產(chǎn)品如上圖所示。
其中,我們個人用戶使用的主要是桌面版Tableau Desktop以及Tableau可視化分享社區(qū)Tableau Public。企業(yè)用戶會用到數(shù)據(jù)清洗工具Tableau Prep以及數(shù)據(jù)管理平臺Tableau Server等。
如果不是特別說明,以后提到Tableau主要指的是桌面端Tableau Desktop。
好在無論是在在Windows系統(tǒng)還是Mac系統(tǒng),Tableau都可以使用。在這一點上,PowerBI就不行了,PowerBI因為是微軟家的,只能在Windows電腦使用。
Tableau產(chǎn)品特點
根據(jù)我個人使用Tableau的一些經(jīng)驗,Tableau在我們?nèi)粘氖聰?shù)據(jù)分析工作主要有以下特點或優(yōu)點:
????????? 入門容易。Tableau新人完全可以不到一小時就能掌握Tableau基本操作,如果能良好的SQL知識,那就更能加快對Tableau的理解。使用久了你會發(fā)現(xiàn),Tableau與SQL底層是那么像;
????????? 操作簡單,鼠標拖拉拽就能輕松完成,所見即所得。你不必像Excel一樣復制粘貼或者寫很復雜的編程語言,鼠標拖拉拽就能做出美觀的基本圖表;
????????? 貫穿數(shù)據(jù)全流程。Tableau Desktop可以實現(xiàn)數(shù)據(jù)連接、數(shù)據(jù)簡單清洗、數(shù)據(jù)計算、數(shù)據(jù)分析、數(shù)據(jù)可視化、數(shù)據(jù)報告(數(shù)據(jù)看板dashboard、數(shù)據(jù)演示story)以及數(shù)據(jù)分享集于一端,這大大便利了日常的數(shù)據(jù)分析工作;
????????? 圖表顏值高,吊打市面上一眾數(shù)據(jù)分析和可視化工具。這一點也是很多人選擇Tableau的原因之一,其符合商務和傳播場景的圖表讓人賞心悅目;
????????? 激發(fā)無限創(chuàng)意創(chuàng)作能力。Tableau基本圖表已經(jīng)滿足了日常所需,但那些富有想象力和創(chuàng)作激情的藝術(shù)家可以借助Tableau創(chuàng)作出美輪美奐的可視化作品,這大大豐富了Tableau的表現(xiàn)場景,不信你去Tableau Public社區(qū)逛一逛;
以上特點正是得益于Tableau最初的數(shù)據(jù)庫和數(shù)據(jù)視覺編碼基因,而且,Tableau也在加碼AI,相信這在以后的Tableau更新中會體現(xiàn)出來。
當然,就像任何一款工具都有其適用場景,Tableau也不是全能的。概括而言,Tableau具有以下不足和局限:
????????? Tableau入門容易,精通難。新人可以很容易掌握Tableau基礎(chǔ),但要想將其發(fā)揮到游刃有余就不是容易的事,正如喜樂君所言,表計算和LOD表達式對很多新人來說就是攔路虎,另外高級互動也是一個難點。
????????? Tableau不擅長數(shù)據(jù)清洗。對于不用Tableau Prep的個人用戶,Tableau無法實現(xiàn)各種臟數(shù)據(jù)的清洗和不規(guī)范數(shù)據(jù)的整理,因此我們使用Tableau之前拿到手的得是干凈和規(guī)范的數(shù)據(jù)文件。這一點上PowerBI要強很多,Power Query和M函數(shù)就是專門處理這種問題;
????????? Tableau無法處理高級建模。盡管Tableau內(nèi)置了簡單的聚類、回歸分析和預測模型,但我們?nèi)粘K枰膹碗s建模Tableau無法實現(xiàn)。同樣,在這一點上PowerBI也是強項,DAX函數(shù)特別強大。當然,高級數(shù)據(jù)建模最好是借助于Python和R等專門編程工具;
盡管如上所述,Tableau依然是一款對新人很友好、學習成本低、學習ROI高的數(shù)據(jù)分析和可視化軟件,不然不會長期在Gartner魔力象限領(lǐng)導者區(qū)間,并被全世界科技和互聯(lián)網(wǎng)公司以及教學機構(gòu)和非盈利組織采用。
Tableau前置介紹就到此為止,我已經(jīng)搭建并不斷在豐富選題庫,后續(xù)我將不定期更新Tableau計算、基本圖表、高級圖表的分享,歡迎持續(xù)關(guān)注。

數(shù)據(jù)分析崗位的現(xiàn)狀與機會
最后談一談很多人關(guān)心的數(shù)據(jù)分析崗位的現(xiàn)狀和前途,一點愚見,僅供參考。
如果你刷知乎互聯(lián)網(wǎng)和數(shù)據(jù)分析相關(guān)的帖子,大概總能看到這樣的問題:
????????? 數(shù)據(jù)分析師真實的工作是怎樣的?
????????? 想做數(shù)據(jù)分析師都要學什么?
????????? 如何自學數(shù)據(jù)分析?
????????? 如何快速成為數(shù)據(jù)分析師?
????????? 產(chǎn)品經(jīng)理如何做數(shù)據(jù)分析?
????????? 數(shù)據(jù)分析行業(yè)對學歷的要求很高嗎?
????????? 只做報表的數(shù)據(jù)分析有前途么?
????????? 只會Excel、SQL、Tableau可以做數(shù)據(jù)分析師嗎?
????????? 數(shù)據(jù)分析人員需要掌握Excel/SQL/Tableau/Python到什么程度?
這類問題一看就是新手常見的困惑,而且這是前些年特別高頻出現(xiàn)的問題。但是最近這兩年,你往往會看到如下的問題:
????????? 為啥數(shù)據(jù)分析找工作這么難?
????????? 數(shù)據(jù)分析師是不是被炒作起來的?
????????? 你為什么離開數(shù)據(jù)科學(Data Science)行業(yè)?
這當然是因為近三年大環(huán)境不好導致數(shù)據(jù)分析行業(yè)供需失調(diào)的緣故,經(jīng)濟的困頓、企業(yè)降本增效壓制了相關(guān)的headcount。不過,數(shù)據(jù)分析行業(yè)的嚴峻還來自于其他原因。
????????? 前些年數(shù)據(jù)分析崗位虛火,各類培訓機構(gòu)推波助瀾下“人人都是數(shù)據(jù)分析師”的風潮導致大量的人在學習數(shù)據(jù)分析,有限的崗位需求迎來各種背景的求職者(不管是產(chǎn)品還是運營,不管是統(tǒng)計學相關(guān)專業(yè)還是新聞傳播專業(yè)),于是從業(yè)門檻逐漸提升,從Python等工具的熟練度、算法和機器學習的掌握程度到比拼學歷,行業(yè)內(nèi)卷化日趨嚴峻。
????????? 多年的基礎(chǔ)設施建設和人才培養(yǎng)也讓一二線大廠具備了足夠支撐業(yè)務發(fā)展的數(shù)據(jù)體系,許多公司和部門出現(xiàn)數(shù)據(jù)分析師冗余,這一定程度導致表哥表姐的出現(xiàn),這些人也相應缺乏職業(yè)成就感,對數(shù)據(jù)分析崗位去魅。
????????? 各種輕巧的低門檻的數(shù)據(jù)分析工具、無代碼產(chǎn)品、智能化產(chǎn)品、SaaS工具、私有化部署數(shù)據(jù)平臺等的出現(xiàn),開展數(shù)據(jù)分析變得簡單。這些工具的出現(xiàn)推動了數(shù)據(jù)分析的普及,也解放了部分人員的雙手,而且這將是大趨勢。
于是我們就看到了“青十五”在《策略產(chǎn)品經(jīng)理:模型與方法論》中提到的,目前數(shù)據(jù)分析師行業(yè)存在“職場積壓”現(xiàn)象——在工作過程中部分工作內(nèi)容被上游或下游職位替代的現(xiàn)象。“青十五”還指出,數(shù)據(jù)分析師面臨的則是雙向的職能積壓。對此,他給出的建議是——數(shù)據(jù)分析師一方面需要向上游延伸,比如學習數(shù)據(jù)庫等底層的數(shù)據(jù)源方面的知識,一方面也可以向下游數(shù)據(jù)應用方面發(fā)展,或者結(jié)合各種業(yè)務場景深入業(yè)務底層中去。比如,我們看到類似經(jīng)營分析、商業(yè)分析、供應鏈分析、數(shù)據(jù)產(chǎn)品等崗位在求職市場需求的增加,數(shù)據(jù)分析師如果不往上游深研,那么在下游數(shù)據(jù)分析與具體業(yè)務和業(yè)務場景的結(jié)合會相當大的機會。

此外,我個人的看法是,數(shù)據(jù)驅(qū)動和數(shù)據(jù)素養(yǎng)在國內(nèi)企業(yè)實踐中還不夠,尤其是在大量的中小企業(yè),喊了多年的數(shù)字化轉(zhuǎn)型往往還在低水平階段。數(shù)據(jù)文化和數(shù)據(jù)能力的代差顯著存在,從一線城市到其他城市、從互聯(lián)網(wǎng)公司到其他實體企業(yè)還存在溢出紅利,時光機理論還能發(fā)揮效力。搭建數(shù)據(jù)驅(qū)動體系和設施、建設數(shù)據(jù)文化還需要相關(guān)的人才,這就是結(jié)構(gòu)化的機會。但這種機會也預示著數(shù)據(jù)分析的場景、流程、地位、部門協(xié)作等與往日大廠不大一樣,想往這一塊發(fā)展的數(shù)據(jù)分析師應該有相應的預期和心理準備。
