單視頻播放量超20萬的公開課配套教材,貓書來了!
吹爆、強推、比刷劇還爽、一生推、傳瘋了!
很難想象,網(wǎng)友們會用這些詞來形容一個純分享深度強化學(xué)習(xí)基礎(chǔ)知識的視頻課。
在 B 站上搜索 “深度強化學(xué)習(xí)”,在排名 TOP 10 的相關(guān)課程中,有 4 個是王樹森老師的 Reinforcement Learning 課程,這些課程都是其他 UP 主轉(zhuǎn)載的,披上了不同的外衣。比如有個視頻號稱王樹森是北大教授,有兩個視頻給 Reinforcement Learning 做了配套教材……你也很難想象,搜索結(jié)果的第一條,單視頻播放量超過了20萬,這大概是機器學(xué)習(xí)領(lǐng)域最受歡迎的純硬核知識課程了~

因為這個視頻課程時長 6 個多小時,很多網(wǎng)友就將該課程霸氣總結(jié)為“6小時學(xué)會深度強化學(xué)習(xí)”,拉幾個評論大家感受下:



“6 小時學(xué)會深度強化學(xué)習(xí)”進行了一定程度的藝術(shù)夸張,不過足以體現(xiàn)大家對視頻的喜愛。深度強化學(xué)習(xí)是當(dāng)今的熱門研究領(lǐng)域,這幾年在機器學(xué)習(xí)關(guān)注度有所下降的情況下,深度強化學(xué)習(xí)的關(guān)注度持續(xù)上漲,做人工智能的朋友很難不關(guān)注這個領(lǐng)域。但是它的學(xué)習(xí)難度很大——其數(shù)學(xué)原理深奧,知識體系和發(fā)展脈絡(luò)復(fù)雜,就算機器學(xué)習(xí)博士生,從零構(gòu)建完善的知識體系也并不是很容易。既然存在更(ZUI)容易學(xué) DRL 的視頻,那么跟視頻課配套的貓書《深度強化學(xué)習(xí)》是不是可以成為你閉眼選的第一本入門資料呢?它主要解決哪些問題呢?
在介紹之前,先讓我們的主角貓書出個鏡。
因為封面圖案是一只乘坐飛天掃帚的巫師貓,故本書花名“貓書”。巫師貓的寓意特別直接,有這么兩層:
深度強化學(xué)習(xí)是人工智能領(lǐng)域的魔法
貓書及其視頻是深度強化學(xué)習(xí)資料中的魔法學(xué)校
至于這個寓意是不是最終可以變成現(xiàn)實,還要看各位主角,而主角必須是閱讀這本書的各位朋友——咱們靜待各位從魔法學(xué)校畢業(yè),派貓頭鷹帶來好消息~好了,咱們先看看這本書的主要內(nèi)容吧。
本書內(nèi)容
本書基于備受讀者推崇的王樹森“深度強化學(xué)習(xí)”系列公開視頻課,專門解決“入門深度強化學(xué)習(xí)難”的問題。本書系統(tǒng)講解深度強化學(xué)習(xí)的原理與實現(xiàn),但不回避數(shù)學(xué)公式和各種模型,原創(chuàng) 100 多幅精美插圖,并以全彩印刷展示。簡潔清晰的語言+生動形象的圖示,助你掃除任何可能的學(xué)習(xí)障礙!本書內(nèi)容分為五部分:基礎(chǔ)知識、價值學(xué)習(xí)、策略學(xué)習(xí)、多智能體強化學(xué)習(xí)、應(yīng)用與展望,涉及 DQN、A3C、TRPO、DDPG、AlphaGo 等。
本書的獨特之處在于:第一,知識精簡,剔除一切不必要的概念和公式,學(xué)起來輕松;第二,內(nèi)容新穎,聚焦近10年深度強化學(xué)習(xí)領(lǐng)域的突破,讓你一上手就緊跟最新技術(shù)。
下面是這本書的目錄思維導(dǎo)圖,可以清晰地展示本書的內(nèi)容結(jié)構(gòu):

目標(biāo)讀者
雖然是魔法書,但是也不是誰都能讀懂的,你得具備一些基礎(chǔ)知識的儲備~
本書面向的受眾是有一定深度學(xué)習(xí)基礎(chǔ)的學(xué)生和算法工程師。本書假設(shè)讀者完全不懂強化學(xué)習(xí),但具備深度學(xué)習(xí)的基礎(chǔ)知識,比如優(yōu)化、目標(biāo)函數(shù)、正則、梯度等基本概念;不熟悉深度學(xué)習(xí)的技術(shù)細(xì)節(jié)和背后理論,但知曉基本常識,比如神經(jīng)網(wǎng)絡(luò)的全連接層、卷積層、sigmoid 激活函數(shù)、softmax 激活函數(shù)的用途。如果你幾乎不懂深度學(xué)習(xí),也可以閱讀本書,但是在理解上會有一定困難。
本書的目標(biāo)是解釋清楚深度強化學(xué)習(xí)背后的原理,而非簡單地描述算法或推導(dǎo)公式。通過學(xué)習(xí)本書,讀者能在短時間內(nèi)構(gòu)建完整的知識體系,避免知識碎片化。預(yù)計讀者在學(xué)完本書之后,能輕松看懂深度強化學(xué)習(xí)的代碼,讀懂該領(lǐng)域的論文、聽懂學(xué)術(shù)報告,具備進一步自學(xué)和深挖的能力。
上一幅圖看一下書中的全彩圖:

你可以去圖靈社區(qū)頁面下載PDF查看本書的試讀,這里:https://www.ituring.com.cn/book/2982。
作者團隊
好內(nèi)容源自好作者。
本書的三位作者都有博士學(xué)位,都是機器學(xué)習(xí)領(lǐng)域的學(xué)者。當(dāng)王樹森和黎彧君還是學(xué)生的時候,就在張志華老師的要求下閱讀了超過 10 本機器學(xué)習(xí)領(lǐng)域的經(jīng)典教材,三位深知什么樣的書是好書。而且三位都有多年的學(xué)術(shù)寫作經(jīng)驗,每個人都在機器學(xué)習(xí)頂會、頂刊上發(fā)表過多篇論文。此外,王樹森和張志華老師都有豐富的教學(xué)經(jīng)驗,有能力把復(fù)雜的方法和原理解釋清楚,在嚴(yán)謹(jǐn)?shù)那疤嵯伦龅酵ㄋ滓锥?/p>
新書上市,限時 6.9 折!