《利用Python進(jìn)行數(shù)據(jù)分析·第2版》第9章 繪圖和可視化

信息可視化(也叫繪圖)是數(shù)據(jù)分析中最重要的工作之一。它可能是探索過(guò)程的一部分,例如,幫助我們找出異常值、必要的數(shù)據(jù)轉(zhuǎn)換、得出有關(guān)模型的idea等。另外,做一個(gè)可交互的數(shù)據(jù)可視化也許是工作的最終目標(biāo)。Python有許多庫(kù)進(jìn)行靜態(tài)或動(dòng)態(tài)的數(shù)據(jù)可視化,但我這里重要關(guān)注于matplotlib(http://matplotlib.org/)和基于它的庫(kù)。
matplotlib是一個(gè)用于創(chuàng)建出版質(zhì)量圖表的桌面繪圖包(主要是2D方面)。該項(xiàng)目是由John Hunter于2002年啟動(dòng)的,其目的是為Python構(gòu)建一個(gè)MATLAB式的繪圖接口。matplotlib和IPython社區(qū)進(jìn)行合作,簡(jiǎn)化了從IPython shell(包括現(xiàn)在的Jupyter notebook)進(jìn)行交互式繪圖。matplotlib支持各種操作系統(tǒng)上許多不同的GUI后端,而且還能將圖片導(dǎo)出為各種常見(jiàn)的矢量(vector)和光柵(raster)圖:PDF、SVG、JPG、PNG、BMP、GIF等。除了幾張,本書(shū)中的大部分圖都是用它生成的。
隨著時(shí)間的發(fā)展,matplotlib衍生出了多個(gè)數(shù)據(jù)可視化的工具集,它們使用matplotlib作為底層。其中之一是seaborn(http://seaborn.pydata.org/),本章后面會(huì)學(xué)習(xí)它。
學(xué)習(xí)本章代碼案例的最簡(jiǎn)單方法是在Jupyter notebook進(jìn)行交互式繪圖。在Jupyter notebook中執(zhí)行下面的語(yǔ)句:
%matplotlib notebook
閱讀全文:http://t.cn/Ru3C8Fa