最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊

Python機(jī)器學(xué)習(xí)基礎(chǔ)教程

2023-06-29 23:20 作者:你認(rèn)識(shí)張大衛(wèi)嗎  | 我要投稿

鏈接:pan.baidu.com/s/1eEh-XTiZlNLWWlTzVgC6sA?pwd=9gil?

提取碼:9gil

機(jī)器學(xué)習(xí)已成為許多商業(yè)應(yīng)用和研究項(xiàng)目不可或缺的一部分,海量數(shù)據(jù)使得機(jī)器學(xué)習(xí)的應(yīng)用范圍遠(yuǎn)超人們想象。本書將向所有對機(jī)器學(xué)習(xí)技術(shù)感興趣的初學(xué)者展示,自己動(dòng)手構(gòu)建機(jī)器學(xué)習(xí)解決方案并非難事!
書中重點(diǎn)討論機(jī)器學(xué)習(xí)算法的實(shí)踐而不是背后的數(shù)學(xué),全面涵蓋在實(shí)踐中實(shí)現(xiàn)機(jī)器學(xué)習(xí)算法的所有重要內(nèi)容,幫助讀者使用Python和scikit-learn庫一步一步構(gòu)建一個(gè)有效的機(jī)器學(xué)習(xí)應(yīng)用。
* 機(jī)器學(xué)習(xí)的基本概念及其應(yīng)用
* 常用機(jī)器學(xué)習(xí)算法的優(yōu)缺點(diǎn)
* 機(jī)器學(xué)習(xí)所處理的數(shù)據(jù)的表示方法,包括重點(diǎn)關(guān)注數(shù)據(jù)的哪些方面
* 模型評估和調(diào)參的方法
* 管道的概念
* 處理文本數(shù)據(jù)的方法,包括文本特有的處理方法
* 進(jìn)一步提高機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)技能的建議

內(nèi)容簡介

本書是機(jī)器學(xué)習(xí)入門書,以Python語言介紹。主要內(nèi)容包括:機(jī)器學(xué)習(xí)的基本概念及其應(yīng)用;實(shí)踐中常用的機(jī)器學(xué)習(xí)算法以及這些算法的優(yōu)缺點(diǎn);在機(jī)器學(xué)習(xí)中待處理數(shù)據(jù)的呈現(xiàn)方式的重要性,以及應(yīng)重點(diǎn)關(guān)注數(shù)據(jù)的哪些方面;模型評估和調(diào)參的方法,重點(diǎn)講解交叉驗(yàn)證和網(wǎng)格搜索;管道的概念;如何將前面各章的方法應(yīng)用到文本數(shù)據(jù)上,還介紹了一些文本特有的處理方法。
本書適合機(jī)器學(xué)習(xí)從業(yè)者或有志成為機(jī)器學(xué)習(xí)從業(yè)者的人閱讀。

作者簡介

Andreas C.Müller,scikit-learn庫維護(hù)者和核心貢獻(xiàn)者?,F(xiàn)任哥倫比亞大學(xué)數(shù)據(jù)科學(xué)研究院講師,曾任紐約大學(xué)數(shù)據(jù)科學(xué)中心助理研究員、***公司計(jì)算機(jī)視覺應(yīng)用的機(jī)器學(xué)習(xí)研究員。在波恩大學(xué)獲得機(jī)器學(xué)習(xí)博士學(xué)位。

Sarah Guido,Mashable公司數(shù)據(jù)科學(xué)家,曾擔(dān)任Bitly公司數(shù)據(jù)科學(xué)家。

目錄

前言 ix
第 1 章 引言 1
1.1 為何選擇機(jī)器學(xué)習(xí) 1
1.1.1 機(jī)器學(xué)習(xí)能夠解決的問題 2
1.1.2 熟悉任務(wù)和數(shù)據(jù) 4
1.2 為何選擇Python 4
1.3 scikit-learn 4
1.4 必要的庫和工具 5
1.4.1 Jupyter Notebook 6
1.4.2 NumPy 6
1.4.3 SciPy 6
1.4.4 matplotlib 7
1.4.5 pandas 8
1.4.6 mglearn 9
1.5 Python 2 與Python 3 的對比 9
1.6 本書用到的版本 10
1.7 第 一個(gè)應(yīng)用:鳶尾花分類 11
1.7.1 初識(shí)數(shù)據(jù) 12
1.7.2 衡量模型是否成功:訓(xùn)練數(shù)據(jù)與測試數(shù)據(jù) 14
1.7.3 要事第 一:觀察數(shù)據(jù) 15
1.7.4 構(gòu)建第 一個(gè)模型:k 近鄰算法 16
1.7.5 做出預(yù)測 17
1.7.6 評估模型 18
1.8 小結(jié)與展望 19
第 2 章 監(jiān)督學(xué)習(xí) 21
2.1 分類與回歸 21
2.2 泛化、過擬合與欠擬合 22
2.3 監(jiān)督學(xué)習(xí)算法 24
2.3.1 一些樣本數(shù)據(jù)集 25
2.3.2 k 近鄰 28
2.3.3 線性模型 35
2.3.4 樸素貝葉斯分類器 53
2.3.5 決策樹 54
2.3.6 決策樹集成 64
2.3.7 核支持向量機(jī) 71
2.3.8 神經(jīng)網(wǎng)絡(luò)(深度學(xué)習(xí)) 80
2.4 分類器的不確定度估計(jì) 91
2.4.1 決策函數(shù) 91
2.4.2 預(yù)測概率 94
2.4.3 多分類問題的不確定度 96
2.5 小結(jié)與展望 98
第3 章 無監(jiān)督學(xué)習(xí)與預(yù)處理 100
3.1 無監(jiān)督學(xué)習(xí)的類型 100
3.2 無監(jiān)督學(xué)習(xí)的挑戰(zhàn) 101
3.3 預(yù)處理與縮放 101
3.3.1 不同類型的預(yù)處理 102
3.3.2 應(yīng)用數(shù)據(jù)變換 102
3.3.3 對訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)進(jìn)行相同的縮放 104
3.3.4 預(yù)處理對監(jiān)督學(xué)習(xí)的作用 106
3.4 降維、特征提取與流形學(xué)習(xí) 107
3.4.1 主成分分析 107
3.4.2 非負(fù)矩陣分解 120
3.4.3 用t-SNE 進(jìn)行流形學(xué)習(xí) 126
3.5 聚類 130
3.5.1 k 均值聚類 130
3.5.2 凝聚聚類 140
3.5.3 DBSCAN 143
3.5.4 聚類算法的對比與評估 147
3.5.5 聚類方法小結(jié) 159
3.6 小結(jié)與展望 159
第4 章 數(shù)據(jù)表示與特征工程 161
4.1 分類變量 161
4.1.1 One-Hot 編碼(虛擬變量) 162
4.1.2 數(shù)字可以編碼分類變量 166
4.2 分箱、離散化、線性模型與樹 168
4.3 交互特征與多項(xiàng)式特征 171
4.4 單變量非線性變換 178
4.5 自動(dòng)化特征選擇 181
4.5.1 單變量統(tǒng)計(jì) 181
4.5.2 基于模型的特征選擇 183
4.5.3 迭代特征選擇 184
4.6 利用專家知識(shí) 185
4.7 小結(jié)與展望 192
第5 章 模型評估與改進(jìn) 193
5.1 交叉驗(yàn)證 194
5.1.1 scikit-learn 中的交叉驗(yàn)證 194
5.1.2 交叉驗(yàn)證的優(yōu)點(diǎn) 195
5.1.3 分層k 折交叉驗(yàn)證和其他策略 196
5.2 網(wǎng)格搜索 200
5.2.1 簡單網(wǎng)格搜索 201
5.2.2 參數(shù)過擬合的風(fēng)險(xiǎn)與驗(yàn)證集 202
5.2.3 帶交叉驗(yàn)證的網(wǎng)格搜索 203
5.3 評估指標(biāo)與評分 213
5.3.1 牢記目標(biāo) 213
5.3.2 二分類指標(biāo) 214
5.3.3 多分類指標(biāo) 230
5.3.4 回歸指標(biāo) 232
5.3.5 在模型選擇中使用評估指標(biāo) 232
5.4 小結(jié)與展望 234
第6 章 算法鏈與管道 236
6.1 用預(yù)處理進(jìn)行參數(shù)選擇 237
6.2 構(gòu)建管道 238
6.3 在網(wǎng)格搜索中使用管道 239
6.4 通用的管道接口 242
6.4.1 用make_pipeline 方便地創(chuàng)建管道 243
6.4.2 訪問步驟屬性 244
6.4.3 訪問網(wǎng)格搜索管道中的屬性 244
6.5 網(wǎng)格搜索預(yù)處理步驟與模型參數(shù) 246
6.6 網(wǎng)格搜索選擇使用哪個(gè)模型 248
6.7 小結(jié)與展望 249
第7 章 處理文本數(shù)據(jù) 250
7.1 用字符串表示的數(shù)據(jù)類型 250
7.2 示例應(yīng)用:電影評論的情感分析 252
7.3 將文本數(shù)據(jù)表示為詞袋 254
7.3.1 將詞袋應(yīng)用于玩具數(shù)據(jù)集 255
7.3.2 將詞袋應(yīng)用于電影評論 256
7.4 停用詞 259
7.5 用tf-idf 縮放數(shù)據(jù) 260
7.6 研究模型系數(shù) 263
7.7 多個(gè)單詞的詞袋(n 元分詞) 263
7.8 分詞、詞干提取與詞形還原 267
7.9 主題建模與文檔聚類 270
7.10 小結(jié)與展望 277
第8 章 全書總結(jié) 278
8.1 處理機(jī)器學(xué)習(xí)問題 278
8.2 從原型到生產(chǎn) 279
8.3 測試生產(chǎn)系統(tǒng) 280
8.4 構(gòu)建你自己的估計(jì)器 280
8.5 下一步怎么走 281
8.5.1 理論 281
8.5.2 其他機(jī)器學(xué)習(xí)框架和包 281
8.5.3 排序、推薦系統(tǒng)與其他學(xué)習(xí)類型 282
8.5.4 概率建模、推斷與概率編程 282
8.5.5 神經(jīng)網(wǎng)絡(luò) 283
8.5.6 推廣到更大的數(shù)據(jù)集 283
8.5.7 磨練你的技術(shù) 284
8.6 總結(jié) 284
關(guān)于作者 285
關(guān)于封面 285

查看全部↓


Python機(jī)器學(xué)習(xí)基礎(chǔ)教程的評論 (共 條)

分享到微博請遵守國家法律
内丘县| 松潘县| 吉木萨尔县| 邹平县| 汶上县| 永和县| 安陆市| 丽水市| 广饶县| 望奎县| 探索| 芮城县| 建德市| 车致| 永和县| 浦城县| 灵丘县| 化德县| 五大连池市| 甘德县| 嘉鱼县| 蚌埠市| 庆城县| 聊城市| 萨嘎县| 扶绥县| 稷山县| 乌兰察布市| 榆社县| 浪卡子县| 雅江县| 遂平县| 桃园县| 安义县| 贡嘎县| 辰溪县| 延安市| 江西省| 遂宁市| 扬中市| 登封市|