《利用Python進行數(shù)據(jù)分析·第2版》第2章 Python語法基礎(chǔ)

當我在2011年和2012年寫作本書的第一版時,可用的學習Python數(shù)據(jù)分析的資源很少。這部分上是一個雞和蛋的問題:我們現(xiàn)在使用的庫,比如pandas、scikit-learn和statsmodels,那時相對來說并不成熟。2017年,數(shù)據(jù)科學、數(shù)據(jù)分析和機器學習的資源已經(jīng)很多,原來通用的科學計算拓展到了計算機科學家、物理學家和其它研究領(lǐng)域的工作人員。學習Python和成為軟件工程師的優(yōu)秀書籍也有了。
因為這本書是專注于Python數(shù)據(jù)處理的,對于一些Python的數(shù)據(jù)結(jié)構(gòu)和庫的特性難免不足。因此,本章和第3章的內(nèi)容只夠你能學習本書后面的內(nèi)容。
在我來看,沒有必要為了數(shù)據(jù)分析而去精通Python。我鼓勵你使用IPython shell和Jupyter試驗示例代碼,并學習不同類型、函數(shù)和方法的文檔。雖然我已盡力讓本書內(nèi)容循序漸進,但讀者偶爾仍會碰到?jīng)]有之前介紹過的內(nèi)容。
本書大部分內(nèi)容關(guān)注的是基于表格的分析和處理大規(guī)模數(shù)據(jù)集的數(shù)據(jù)準備工具。為了使用這些工具,必須首先將混亂的數(shù)據(jù)規(guī)整為整潔的表格(或結(jié)構(gòu)化)形式。幸好,Python是一個理想的語言,可以快速整理數(shù)據(jù)。使用Python越熟練,越容易準備新的數(shù)據(jù)集以進行分析。
本書中使用的工具最好在IPython和Jupyter中親自嘗試。當你學會了如何啟用Ipython和Jupyter,我建議你跟隨示例代碼進行練習。與任何鍵盤驅(qū)動的操作環(huán)境一樣,記住常見的命令也是學習曲線的一部分。
筆記:本章沒有介紹Python的某些概念,如類和面向?qū)ο缶幊蹋憧赡軙l(fā)現(xiàn)它們在Python數(shù)據(jù)分析中很有用。
為了加強Python知識,我建議你學習官方Python教程,https://docs.python.org/3/,或是通用的Python教程書籍,比如:
Python Cookbook,第3版,David Beazley和Brian K. Jones著(O’Reilly)
流暢的Python,Luciano Ramalho著 (O’Reilly)
高效的Python,Brett Slatkin著 (Pearson)
閱讀全文:http://t.cn/Run6HHo