人工智能入門必讀的16本數(shù)據(jù)科學書籍

文末抽200元當當購書券!??!
數(shù)據(jù)科學(data science)是一門利用數(shù)據(jù)學習知識的學科,其目標是通過從數(shù)據(jù)中提取出有價值的部分來生產(chǎn)數(shù)據(jù)產(chǎn)品。它結(jié)合了諸多領(lǐng)域中的理論和技術(shù),包括應用數(shù)學、統(tǒng)計、模式識別、機器學習、數(shù)據(jù)可視化、數(shù)據(jù)倉庫以及高性能計算。AI的范圍很大,數(shù)據(jù)科學的幾乎所有知識點都包含在里邊。
如今,對于大多數(shù)(不是全部)企業(yè)來說,數(shù)據(jù)科學應用已成為必然。因此,人才們也選擇往這方面發(fā)展,也有很多其他相關(guān)專業(yè)的人想要提高數(shù)據(jù)科學的相關(guān)知識。
學姐在想要學習一個新的知識的時候首先就是會去找書,但是要挑選出數(shù)據(jù)科學領(lǐng)域最著名的書籍,非常耗時耗力。所以學姐就整理了16本數(shù)據(jù)科學領(lǐng)域的著名書籍給大家,不用大家再費時間去篩選了。
PS:下面文章中推薦的書籍中英文書名都有寫出來,大家可以根據(jù)自己的需求去搜索,部分書的封面圖學姐沒有中文版所以放的是原版封面。
01 Practical Statistics for Data Scientists
作者:Peter Bruce, Andrew Bruce, Peter Gedeck
《面向數(shù)據(jù)科學家的實用統(tǒng)計學》

這本書是絕對初學者的理想讀物,它涵蓋了所有必要概念的基本概述,以深入到數(shù)據(jù)科學領(lǐng)域。
本書包含了學習探索性數(shù)據(jù)分析的概念,隨機抽樣,回歸分析,分類技術(shù),統(tǒng)計機器學習方法等知識。除了理論概念外,它還包括R和Python編程語言中的代碼示例。這本書只是讓你熟悉數(shù)據(jù)科學,而不是深入鉆研。
除此之外,您還可以找到其他資源,這些資源將引導您理解數(shù)據(jù)科學中的一些更高級的主題??傊瑢τ跀?shù)據(jù)科學初學者來說,這是一個很好的資源。
豆瓣評價

02 Introduction to Machine Learning with Python
作者:Andreas C. Muller, Sarah Guido
《Python機器學習入門》

對于想要開始數(shù)據(jù)科學學習的人來說,這本書是一個理想的選擇。本書種的說明性的例子,清晰地解釋了數(shù)據(jù)科學和機器學習的基本概念。這本書最好的地方在于,讀者不需要任何數(shù)據(jù)科學、機器學習和Python的先驗知識。
本書包含機器學習的基本概念和應用,模型評估的高級技術(shù),數(shù)據(jù)的表示,管道的概念,提高你的數(shù)據(jù)科學和機器學習技能的建議,以及更多的東西。適合初學者哦!
豆瓣評價

03 Business Data Science
作者:Matt Taddy
《商業(yè)數(shù)據(jù)科學》

這本書的作者是亞馬遜科學(Amazon Science)的博士馬特·塔迪(Matt Taddy),這本書中他關(guān)注的是數(shù)據(jù)科學的商業(yè)視角。
本書涵蓋了影響真實業(yè)務環(huán)境的主題,包含理論和適當?shù)木幋a練習,幫助讀者從它獲得有用的見解。在業(yè)務領(lǐng)域應用我們的知識可能是具有挑戰(zhàn)性的,因為模型在理論上會做出不同類型的假設(shè),當它們應用于實踐時,有時我們會看到比在紙上展示的結(jié)果更令人驚訝的結(jié)果。
有人說這本書太淺了,可是這本來就是給初學者入門學者看得淺顯易懂的書呀!
04 Introduction to Probability
作者:Joseph K. Blitzstein, Jessica Hwang
《概率論導論》

《概率論》從著名的哈佛統(tǒng)計學講座發(fā)展而來,為理解統(tǒng)計、隨機性和不確定性提供了必要的語言和工具,這本書或許是學習概率的最佳書籍。
這本書適合初學者因為它從基本概念開始,并通過它的方式通過概率的核心概念,將幫助讀者在數(shù)據(jù)科學領(lǐng)域建立堅實的基礎(chǔ)。
這本書中有直觀的解釋,例子,圖表和實踐問題。本書的每一章都以R編程語言的相關(guān)代碼示例結(jié)束。在新版本中,他們包括了在線補充,包括交互式可視化和動畫。50年來,這本書一直是最受歡迎的書之一,這也是為什么它一定要放在你的書架上的另一個原因。
豆瓣評價

05 Data Science from Scratch
作者:Joel Grus
《數(shù)據(jù)科學入門》

讀了這本書之后大家能夠了解到有多少最基本的數(shù)據(jù)科學工具和算法是通過從頭開始實現(xiàn)它們來工作的。
如果你有很強的數(shù)學天賦和一些必要的編程技能,這本書會幫助你快速的進入數(shù)據(jù)科學的核心。網(wǎng)上也有許多書籍,但是你想從零開始學習數(shù)據(jù)科學,并提高你在這個領(lǐng)域的知識,那么這本書是必讀的。
這本書的主題是統(tǒng)計的基礎(chǔ)知識,清理和操作數(shù)據(jù),深入到機器學習算法的基礎(chǔ)知識,機器學習算法的實現(xiàn),探索自然語言處理,推薦系統(tǒng),網(wǎng)絡(luò)分析,以及更多。如果你數(shù)據(jù)科學學起來比較艱難,那么這本書很適合你。
豆瓣評價

06 Naked Statistics
作者:Charles Wheelan
《赤裸裸的統(tǒng)計學》

這本書寫了很多關(guān)于統(tǒng)計概念如何在現(xiàn)實世界中應用的真實例子。語氣詼諧,作者用不深入的理論但是又很有說服力的例子來幫助你理解一些復雜的統(tǒng)計概念。
這本書從統(tǒng)計學的基本概念開始,如正態(tài)分布,中心極限定理,然后繼續(xù)到復雜的現(xiàn)實世界問題,相關(guān)的數(shù)據(jù)分析和機器學習。值得一提的是這本書會讓你在理解統(tǒng)計概念時開懷大笑。
豆瓣評價

07 Python for Data Analysis
作者:Wes McKinney
《利用Python進行數(shù)據(jù)分析》

如果你有一些數(shù)據(jù)科學概念的基礎(chǔ)知識,這本書是另一本很好的讀物。本書涵蓋了幾乎所有的數(shù)據(jù)分析方法以及python編程語言的基礎(chǔ)知識。
本書涵蓋使用Ipython shell和jupyter notebook進行探索性數(shù)據(jù)分析、NumPy 的基本和高級功能、使用 Pandas 進行數(shù)據(jù)分析、如何獲得干凈的數(shù)據(jù)、使用 matplotlib 進行可視化、使用 Pandas 匯總數(shù)據(jù)、時間序列分析等等。
簡而言之,我們可以說作者讓您完全了解作為數(shù)據(jù)科學家的工作應該做什么??傮w來說這本書內(nèi)容全面,易于閱讀。
豆瓣評價

08 Hands-on Machine Learning with Scikit-Learn and TensorFlow
作者:Aurélien Géron
《機器學習實戰(zhàn)》

這本書可能是數(shù)據(jù)科學和機器學習領(lǐng)域里最好的書之一,書中又非常豐富的知識。不論是初學者還是已經(jīng)工作多年的人都能從利用這本書對這個領(lǐng)域有更深入的了解。
這本書的理論都有強大的例子來支撐,本書的主要內(nèi)容包括:神經(jīng)網(wǎng)絡(luò),機器學習項目的scikit-learn,機器學習的訓練模型,構(gòu)建和訓練神經(jīng)網(wǎng)絡(luò)的TensorFlow等等。
讀完這本書后,你將能夠更深入地學習深度學習并解決工作中學習中遇到的問題。
豆瓣評價

09 Head First Statistics
作者:Dawn Griffiths
《深入淺出統(tǒng)計學》

就像headfirst的其他書一樣,這本書是對話的方式,所以不會讀幾頁就感到無聊。這本書通過提供引人入勝和發(fā)人深省的材料,還有現(xiàn)實生活的例子,把典型的枯燥的案例變的生動。
這本書從描述性統(tǒng)計的主題開始——平均、中位數(shù)、模態(tài)、標準偏差、方差——然后轉(zhuǎn)移到推論統(tǒng)計,如相關(guān)性、回歸等。它還包括一個完整的解釋正態(tài)分布,二項分布,泊松分布,幾何概率分布。
這本書里面有大量的圖片和圖形,使內(nèi)容便于理解。
豆瓣評價

10 Pattern Recognition and Machine Learning
作者:Christopher M. Bishop
《模式識別與機器學習》

如果你已經(jīng)讀過一些關(guān)于數(shù)據(jù)科學的書,并且熟悉許多機器學習算法,并且你想進一步提高你在這個領(lǐng)域的技能,那么這本書就是為你準備的。
這本書深入探討了機器學習算法和數(shù)學。這本書包括熟悉線性和多元微積分,概率分布,和強大的編程語言基礎(chǔ)。如果你已經(jīng)熟悉機器學習和數(shù)據(jù)科學,這可能是最好的一本書。
豆瓣評價

11 Inflection Point
作者:Scott Stawski
《拐點》

本書副標題為 “How the Convergence of Cloud, Mobility, Apps and Data Will Shape the Future of Business(云、移動性、應用程序和數(shù)據(jù)的融合如何影響行業(yè)的未來)
如果你想了解數(shù)據(jù)科學在現(xiàn)實生活中的實際應用,那么這本書非常適合。本書從數(shù)據(jù)科學的技術(shù)角度出發(fā),重點關(guān)注數(shù)據(jù)科學的業(yè)務角度。
如果你真的想更深入地進入數(shù)據(jù)科學領(lǐng)域并想知道所有這些東西是如何結(jié)合在一起的,這本書是必讀的,因為它包含了作者的經(jīng)驗,展示了數(shù)據(jù)科學在現(xiàn)實生活中的實際運作方式。
12 The Art of Statistics:How to Learn from Data
作者:David Spiegelhalter
《統(tǒng)計的藝術(shù):如何從數(shù)據(jù)中學習》

《統(tǒng)計的藝術(shù):如何從數(shù)據(jù)中學習》由大衛(wèi)·斯皮格爾哈爾特 (David Spiegelhalter) 撰寫,被許多人稱為“統(tǒng)計思維的權(quán)威指南”。
在這本書中,Spiegelhalter深入研究并展示了如何使用原始數(shù)據(jù)解決現(xiàn)實世界的問題,重點放在數(shù)學概念和聯(lián)系上。這本書是數(shù)據(jù)科學之旅的一個極好的補充,這本書教我們?nèi)绾蜗窠y(tǒng)計學家一樣思考,并使用我們從數(shù)據(jù)中得到的答案來解決現(xiàn)實世界的問題。
豆瓣評價

外網(wǎng)免費電子版書籍
01 Think Bayes
作者:Allen B. Downey

貝葉斯是用計算方法介紹貝葉斯統(tǒng)計的。如果你已經(jīng)回了Python編程,并對概率也有所了解,那就可以開始學習貝葉斯統(tǒng)計了。
通過這本書,可以學習到如何用Python代碼而不是數(shù)學符號來解決統(tǒng)計問題,并使用離散概率分布而不是連續(xù)數(shù)學。
當你解決了數(shù)學問題,貝葉斯基礎(chǔ)將變得更加透明,就可以用書中的技術(shù)去解決工作中的問題。
豆瓣評價

免費閱讀鏈接:
https://greenteapress.com/wp/think-bayes/
02 Python for Data Science Handbook
作者:Jake VanderPlas
《Python 數(shù)據(jù)科學手冊》

如果你熟悉數(shù)據(jù)科學概念的基礎(chǔ)知識,這本書能將你的數(shù)據(jù)科學技能提升到一個新臺階。本書中對數(shù)據(jù)分析的Python庫以及代碼示例有詳盡解釋。總之看這本書你會學到很多關(guān)于python庫的知識。
豆瓣評價

免費閱讀鏈接:
https://github.com/jakevdp/PythonDataScienceHandbook
03 The Elements of Statistical Learning
作者:Trevor Hastie, Robert Tibshirani, and Jerome Friedman
《統(tǒng)計學習的要素》

Elements of Statistical Learning這本書涵蓋了大量關(guān)于數(shù)據(jù)挖掘、推理和預測的高質(zhì)量教育信息。
這本書由著名的斯坦福大學教授 Trevor Hastie、Robert Tibshirani 和 Jerome Friedman 撰寫,講述了數(shù)據(jù)科學在過去十年中如何成為包括醫(yī)學、生物學、金融、營銷等不同領(lǐng)域的需求。
雖然有點廣泛,但能教大家許多技術(shù),從監(jiān)督學習到無監(jiān)督學習,幫助大家理解數(shù)據(jù)科學處理實際用例。
豆瓣評價:

免費閱讀鏈接:
https://web.stanford.edu/~hastie/ElemStatLearn/
04 An Introduction to Statistical Learning
作者:Gareth James, Daniela Witten, Trevor Hastie, and Robert Tibshirani
《統(tǒng)計學習導論》

統(tǒng)計學習導論對于沒有強大數(shù)學背景的人來說是一個極好的選擇。它展示了對R統(tǒng)計學習方法的介紹,對于數(shù)據(jù)科學家來說是非常寶貴的資源。
本書對于希望使用尖端技術(shù)解決復雜數(shù)據(jù)問題的統(tǒng)計和非統(tǒng)計從業(yè)人員提供全面且可訪問的資源。你只需掌握線性回歸就能充分利用這本書的知識。
豆瓣評價

免費閱讀鏈接:
http://faculty.marshall.usc.edu/gareth-james/ISL/
??????學姐發(fā)福利了??????
驚喜1:關(guān)注公眾號,回復“抽獎”即可參與

獎品如下

驚喜2:部分書籍的PDF版公眾號回復“驚喜2”即可獲取到!