如何用Python進行數(shù)據(jù)分析?除了動物書外,這二十張表也能幫到你
前言:
在選擇數(shù)據(jù)分析入門的經(jīng)典書籍時,有這么幾本書不能不說,在國內(nèi)也有非常好的口碑。
他們分別是《用Python進行數(shù)據(jù)分析第一版》:

《用Python進行數(shù)據(jù)分析第二版》

(至于我為什么要把兩個版次的同一本書都提及,這里給大家提個醒,有些無良廠家喜歡把兩本捆綁起來賣,但是所講述的內(nèi)容大差不差,屬實沒必要,大家買紙質書時要格外注意。)
耗子書的作者 Wes McKinney 就是 pandas 庫的主要作者,但這本書的結構并不是圍繞著 pandas 庫而展開的——不然就直接去看 pandas 文檔好了。
這本書的結構超越了某個庫或者某個語言,最核心的部分是以數(shù)據(jù)分析的工作流展開的,從數(shù)據(jù)載入、數(shù)據(jù)清洗、數(shù)據(jù)規(guī)整到數(shù)據(jù)可視化、數(shù)據(jù)建模。這種結構對于不熟悉數(shù)據(jù)分析工作流的讀者是非常有幫助的。
《Python數(shù)據(jù)科學手冊》

《Python數(shù)據(jù)科學手冊》這本書的結構非常扁平,就 5 章。第 1 章著重介紹了作者偏愛的 IPython 的各種用法,然后 NumPy, pandas, matplotlib 各一章,第 5 章是機器學習。整體是以知識邏輯去組織的。
配套資源
而在看完以上的書籍后,面對Python基礎、導入數(shù)據(jù)、Jupyter Notebook、Numpy基礎、Matplotlib繪圖、Pandas基礎和進階、Scikit-Learn、Keras等具體操作的知識時,經(jīng)常很容易忘記。
在學習函數(shù)時,也總是會有很多函數(shù)學得很快,遺忘得也很快。但其實在學習中,我們并不需要很深層次的理解,只需要知道相關參數(shù),加以調整就夠了。
這里分享一份由DataCamp大佬整理的Python科學速查表,就可以幫你解決以上的問題。當你在練習的時候,能夠讓你迅速地找到對應的函數(shù),很方便的掌握Python。
(中文版由“呆鳥的Python數(shù)據(jù)分析”翻譯,感謝大佬)
一、python基礎、數(shù)據(jù)的導入

二、數(shù)據(jù)科學計算
Numpy是Python數(shù)據(jù)科學計算的核心庫,提供了高性能的多維數(shù)組對象及處理數(shù)組的工具。

Matplotlib是Python的二維繪圖庫

Pandas是基于Numpy創(chuàng)建的Python庫

三、機器學習和深度學習方面
Scikit-learn通過統(tǒng)一的界面實現(xiàn)機器學習、預處理、交叉驗證及可視化算法。

Keras是強大、易用的深度學習庫,基于Theano和TensorFlow提供了高階神經(jīng)網(wǎng)絡API,用于開發(fā)和評估深度學習模型。

根據(jù)文件的不同,我把它們分成了兩個版本:
英文版
中文翻譯版:

一共二十余份的內(nèi)容再加一份Python的語法速查表,足以讓你的學習生涯變得輕松幾分。
以上的文檔已經(jīng)準備好了,領取方式如下:
