pandas數(shù)據(jù)處理與分析
鏈接:https://pan.baidu.com/s/1Nw4SMnuL85nsaDSTqwU1ig?pwd=b8fq?
提取碼:b8fq

編輯推薦
1.梳理pandas中常用的函數(shù),將函數(shù)之間的邏輯關(guān)系總結(jié)為“基礎(chǔ)知識+4類操作+4類數(shù)據(jù)”的模塊結(jié)構(gòu)
2.展示了數(shù)據(jù)處理的宏觀體系,并針對數(shù)據(jù)分析中“怎么分析”“怎么處理”“怎么加速”3個核心問題給出解決方案。
3.結(jié)合大量代碼講解理論知識,并通過“練一練”和章末的“習題”等形式提供高質(zhì)量的練習,幫助讀者理解、強化和拓展所學知識。
4.不需要讀者掌握數(shù)據(jù)科學或數(shù)據(jù)分析的先驗知識,適合具有一定Python編程基礎(chǔ)、想要使用pandas進行數(shù)據(jù)處理與分析的數(shù)據(jù)科學領(lǐng)域的從業(yè)者或研究人員閱讀。
內(nèi)容簡介
本書以Python中的pandas庫為主線,介紹各類數(shù)據(jù)處理與分析方法。
本書共包含13章,第一部分介紹NumPy和pandas的基本內(nèi)容;第二部分介紹pandas庫中的4類操作,包括索引、分組、變形和連接;第三部分介紹基于pandas庫的4類數(shù)據(jù),包括缺失數(shù)據(jù)、文本數(shù)據(jù)、分類數(shù)據(jù)和時間序列數(shù)據(jù),并介紹這4類數(shù)據(jù)的處理方法;第四部分介紹數(shù)據(jù)觀測、特征工程和性能優(yōu)化的相關(guān)內(nèi)容。本書以豐富的練習為特色,每章的最后一節(jié)為習題,同時每章包含許多即時性的練習(練一練)。讀者可通過這些練習將對數(shù)據(jù)科學的宏觀認識運用到實踐中。
作者簡介
耿遠昊
威斯康星大學麥迪遜分校統(tǒng)計學碩士在讀,Datawhale成員,“Joyful Pandas”開源項目作者。pandas貢獻者,活躍于pandas開源社區(qū),主要貢獻涉及漏洞修復、功能實現(xiàn)與性能優(yōu)化等方面,對pandas在數(shù)據(jù)處理與分析中的應(yīng)用有豐富經(jīng)驗。
精彩書評
pandas是Python數(shù)據(jù)科學生態(tài)中一個核心的第三方庫。使用pandas,我們能夠快捷解決現(xiàn)實中各類與數(shù)據(jù)相關(guān)的問題。本書講解了基于pandas的數(shù)據(jù)處理與分析技術(shù),理論與實踐相結(jié)合,是學習pandas很好的教程。
——張日權(quán) 華東師范大學經(jīng)濟與管理學部統(tǒng)計學院院長,教授、博士生導師
Python作為數(shù)字經(jīng)濟時代的編程語言之一,正成為廣大有志于投身數(shù)據(jù)科學領(lǐng)域的青年學子學習的技術(shù)?!癑oyful Pandas”是Datawhale社區(qū)的開源項目,也是pandas官方目前推薦的中文教程,本書在該教程的基礎(chǔ)上進一步完善,強化理論與實踐的結(jié)合,對Python初學者和進階者均有裨益。
——陳海強 廈門大學王亞南經(jīng)濟研究院教授、博士生導師
數(shù)據(jù)分析能力正逐步成為數(shù)字化發(fā)展浪潮中學習者應(yīng)具備的基本技能。本書分為“基礎(chǔ)知識”“4類操作”“4類數(shù)據(jù)”和“進階實戰(zhàn)”四大部分,結(jié)合簡潔易懂的代碼示例,涵蓋pandas的所有核心操作與特性,非常適合數(shù)據(jù)分析人員自學。
——黃鸝強 浙江大學數(shù)據(jù)科學系教授、博士生導師
這是一本非常有針對性的教程,內(nèi)容豐富且結(jié)構(gòu)完整,還提供了詳細的示例,既可以作為進行系統(tǒng)學習的入門指南,也可以作為即查即用的參考手冊。與傳統(tǒng)的純講授式的教程不同,本書除了講解代碼,還附有許多有趣的問題與練習,啟發(fā)式地引導讀者自主探索編程的細節(jié)。相信本書會幫助讀者從零上手并愛上編程。
——鐘威 廈門大學王亞南經(jīng)濟研究院和經(jīng)濟學院統(tǒng)計學與數(shù)據(jù)科學系教授、博士生導師
“Joyful Pandas”教程涵蓋了NumPy和pandas的基本操作、4類主要的數(shù)據(jù)操作方法(包括索引、分組、變形和連接)和4種主要的數(shù)據(jù)類型(包括缺失數(shù)據(jù)、文本數(shù)據(jù)、分類數(shù)據(jù)和時間序列數(shù)據(jù))。每章的末尾會給出相應(yīng)的習題。所有數(shù)據(jù)集和相關(guān)資料可以在GitHub的datawhalechina/joyful-pandas倉庫中找到。
——pandas官方網(wǎng)站
目錄
第 一部分 基礎(chǔ)知識
第 1章 預備知識 2
1.1 Python基礎(chǔ) 2
1.1.1 推導式 2
1.1.2 匿名函數(shù) 4
1.1.3 打包函數(shù) 5
1.2 NumPy基礎(chǔ) 7
1.2.1 NumPy數(shù)組的構(gòu)造 7
1.2.2 NumPy數(shù)組的變形 11
1.2.3 NumPy數(shù)組的切片 15
1.2.4 廣播機制 17
1.2.5 常用函數(shù) 19
1.3 習題 24