《利用Python進(jìn)行數(shù)據(jù)分析·第2版》第5章 pandas入門

pandas是本書后續(xù)內(nèi)容的首選庫。它含有使數(shù)據(jù)清洗和分析工作變得更快更簡單的數(shù)據(jù)結(jié)構(gòu)和操作工具。pandas經(jīng)常和其它工具一同使用,如數(shù)值計(jì)算工具NumPy和SciPy,分析庫statsmodels和scikit-learn,和數(shù)據(jù)可視化庫matplotlib。pandas是基于NumPy數(shù)組構(gòu)建的,特別是基于數(shù)組的函數(shù)和不使用for循環(huán)的數(shù)據(jù)處理。
雖然pandas采用了大量的NumPy編碼風(fēng)格,但二者最大的不同是pandas是專門為處理表格和混雜數(shù)據(jù)設(shè)計(jì)的。而NumPy更適合處理統(tǒng)一的數(shù)值數(shù)組數(shù)據(jù)。
自從2010年pandas開源以來,pandas逐漸成長為一個(gè)非常大的庫,應(yīng)用于許多真實(shí)案例。開發(fā)者社區(qū)已經(jīng)有了800個(gè)獨(dú)立的貢獻(xiàn)者,他們?cè)诮鉀Q日常數(shù)據(jù)問題的同時(shí)為這個(gè)項(xiàng)目提供貢獻(xiàn)。
在本書后續(xù)部分中,我將使用下面這樣的pandas引入約定:
In [1]: import pandas as pd
因此,只要你在代碼中看到pd.,就得想到這是pandas。因?yàn)镾eries和DataFrame用的次數(shù)非常多,所以將其引入本地命名空間中會(huì)更方便:
In [2]: from pandas import Series, DataFrame
閱讀全文:http://t.cn/RunXUa1