《Scikit-Learn與TensorFlow機(jī)器學(xué)習(xí)實(shí)用指南》第1章 機(jī)器學(xué)習(xí)概覽

來(lái)源:ApacheCN《Sklearn 與 TensorFlow 機(jī)器學(xué)習(xí)實(shí)用指南》翻譯項(xiàng)目
譯者:@SeanCheney
校對(duì):@Lisanaaa @飛龍
大多數(shù)人聽(tīng)到“機(jī)器學(xué)習(xí)”,往往會(huì)在腦海中勾勒出一個(gè)機(jī)器人:一個(gè)可靠的管家,或是一個(gè)可怕的終結(jié)者,這取決于你問(wèn)的是誰(shuí)。但是機(jī)器學(xué)習(xí)并不是未來(lái)的幻想,它已經(jīng)來(lái)到我們身邊了。事實(shí)上,一些特定領(lǐng)域已經(jīng)應(yīng)用機(jī)器學(xué)習(xí)幾十年了,比如光學(xué)字符識(shí)別 (Optical Character Recognition,OCR)。但是直到 1990 年代,第一個(gè)影響了數(shù)億人的機(jī)器學(xué)習(xí)應(yīng)用才真正成熟,它就是垃圾郵件過(guò)濾器(spam filter)。雖然并不是一個(gè)有自我意識(shí)的天網(wǎng)系統(tǒng)(Skynet),垃圾郵件過(guò)濾器從技術(shù)上是符合機(jī)器學(xué)習(xí)的(它可以很好地進(jìn)行學(xué)習(xí),用戶幾乎不用再標(biāo)記某個(gè)郵件為垃圾郵件)。后來(lái)出現(xiàn)了更多的數(shù)以百計(jì)的機(jī)器學(xué)習(xí)產(chǎn)品,支撐了更多你經(jīng)常使用的產(chǎn)品和功能,從推薦系統(tǒng)到語(yǔ)音識(shí)別。
機(jī)器學(xué)習(xí)的起點(diǎn)和終點(diǎn)分別是什么呢?確切的講,機(jī)器進(jìn)行學(xué)習(xí)是什么意思?如果我下載了一份維基百科的拷貝,我的電腦就真的學(xué)會(huì)了什么嗎?它馬上就變聰明了嗎?在本章中,我們首先會(huì)澄清機(jī)器學(xué)習(xí)到底是什么,以及為什么你要使用它。
然后,在我們出發(fā)去探索機(jī)器學(xué)習(xí)新大陸之前,我們要觀察下地圖,以便知道這片大陸上的主要地區(qū)和最明顯的地標(biāo):監(jiān)督學(xué)習(xí)vs非監(jiān)督學(xué)習(xí),在線學(xué)習(xí)vs批量學(xué)習(xí),基于實(shí)例vs基于模型學(xué)習(xí)。然后,我們會(huì)學(xué)習(xí)一個(gè)典型的機(jī)器學(xué)習(xí)項(xiàng)目的工作流程,討論可能碰到的難點(diǎn),以及如何評(píng)估和微調(diào)一個(gè)機(jī)器學(xué)習(xí)系統(tǒng)。
這一章介紹了大量每個(gè)數(shù)據(jù)科學(xué)家需要牢記在心的基礎(chǔ)概念(和習(xí)語(yǔ))。第一章只是概覽(唯一不含有代碼的一章),相當(dāng)簡(jiǎn)單,但你要確保每一點(diǎn)都搞明白了,再繼續(xù)進(jìn)行學(xué)習(xí)本書其余章節(jié)。端起一杯咖啡,開(kāi)始學(xué)習(xí)吧!
提示:如果你已經(jīng)知道了機(jī)器學(xué)習(xí)的所有基礎(chǔ)概念,可以直接翻到第2章。如果你不確認(rèn),可以嘗試回答本章末尾列出的問(wèn)題,然后再繼續(xù)。
閱讀全文:http://t.cn/RuA37RD