Python數(shù)據(jù)分析入門(三):Pandas介紹
為什么要學(xué)習(xí)pandas?
那么問題來了:
numpy已經(jīng)能夠幫助我們處理數(shù)據(jù),能夠結(jié)合matplotlib解決我們數(shù)據(jù)分析的問題,那么pandas學(xué)習(xí)的目的在什么地方呢?
numpy能夠幫我們處理處理數(shù)值型數(shù)據(jù),但是這還不夠, 很多時候,我們的數(shù)據(jù)除了數(shù)值之外,還有字符串,還有時間序列等
比如:我們通過爬蟲獲取到了存儲在數(shù)據(jù)庫中的數(shù)據(jù)
所以,pandas出現(xiàn)了。
什么是Pandas?
Pandas的名稱來自于面板數(shù)據(jù)(panel data)
Pandas是一個強(qiáng)大的分析結(jié)構(gòu)化數(shù)據(jù)的工具集,基于NumPy構(gòu)建,提供了高級數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)操作工具,它是使Python成為強(qiáng)大而高效的數(shù)據(jù)分析環(huán)境的重要因素之一。
一個強(qiáng)大的分析和操作大型結(jié)構(gòu)化數(shù)據(jù)集所需的工具集
基礎(chǔ)是NumPy,提供了高性能矩陣的運(yùn)算
提供了大量能夠快速便捷地處理數(shù)據(jù)的函數(shù)和方法
應(yīng)用于數(shù)據(jù)挖掘,數(shù)據(jù)分析
提供數(shù)據(jù)清洗功能
官網(wǎng):
http://pandas.pydata.org/
標(biāo)簽: