B站大學機器學習方向培養(yǎng)方案v3.0
0.緒論
本方案適用于cser,對ai深入學習
1.機器學習的數(shù)學基礎
機器學習用到的數(shù)學知識相當廣泛,以西瓜書為例,介紹每章所需要的數(shù)學知識,沒有數(shù)學寸步難行...
第一章:多元隨機變量分布、函數(shù)分布、期望->NFL
第二章:期望、方差,最難的就是假設檢驗了,不會假設檢驗,就會看的頭大,正態(tài)分布,兩個重要極限
第三章:矩陣求導,無約束的條件極值,矩陣的秩,極大似然估計,凸優(yōu)化的牛頓法,二范數(shù)
第四章:信息論中的信息熵
第五章:矩陣乘法,凸優(yōu)化的梯度下降法,偏導數(shù)以及復合函數(shù)偏導數(shù)
第六章:拉格朗日對偶,拉格朗日乘子
第七章:貝葉斯方法、極大似然估計、統(tǒng)計推斷
第八章:相關(guān)性。 ? ? ? ? ? ? ? ? ? ? ? ?
1.1高等數(shù)學
與其說是高等數(shù)學不如說是多元微積分,多元微積分更重要一些,尤其是鏈式求導法,在深度學習中理解反向傳播會非常有用,但一元的求導,求極限也需要。至于微分方程和無窮級數(shù)、曲線曲面積分,反而沒那么重要了。需要重點學最小二乘法,條件極值,拉格朗日乘子法,方向?qū)?shù),梯度(為了理解梯度下降),幾何,雅可比行列式
從高等數(shù)學角度理解最小二乘法
重點學一元微積分和多元微積分,微分方程和曲線積分,級數(shù),微分方程不需要學
重點學習他的插值和泰勒公式。
書籍:
《同濟七版高等數(shù)學》,我覺得這本高數(shù)書非常好,在國內(nèi)教材中,少見好教材,無論是證明還是課后的習題。
1.2線性代數(shù)/高等代數(shù)
需要重點學矩陣乘法、矩陣求導,QR分解,奇異值(SVD)分解,范數(shù),向量空間,線性映射。
從矩陣角度理解一元線性回歸,即最小二乘問題
國內(nèi)好的線代課不多,我當時學只有一個學期,課時很少,學了個皮毛,后面考研又深入學了學,這門課對以后的機器學習非常重要。機器學習很多公式推導都需要它。
極力推薦,沒有幾何,代數(shù)學的就很吃力。
矩陣求導在大部分高等代數(shù)/線性代數(shù)課里面講的都不是很深入
需要補充范數(shù)和svd分解,qr分解,范數(shù),線性映射,線性空間
書籍:
《線性代數(shù)及其應用》David C. Lay,從應用角度比同濟的要好,寫的也很棒
1.3概率論與數(shù)理統(tǒng)計
概率統(tǒng)計在機器學習中非常重要尤其是模型評估和選擇、和貝葉斯分類器。重點學參數(shù)估計,尤其是最大似然和貝葉斯估計、最大后驗估計,假設檢驗,貝葉斯方法,一元線性回歸
從概率統(tǒng)計角度理解一元線性回歸
概率論:
講的很透徹,首推
結(jié)合python講統(tǒng)計學,學完這門課對于python也會有一定幫助
書籍推薦
概率論與數(shù)理統(tǒng)計,陳希儒,這本書寫的相當好,個人認為好于浙大版本的數(shù)理統(tǒng)計。對于很多東西講的很透徹,與之相比,反而浙大那個更像是應付考試出的書了。
概率論與數(shù)理統(tǒng)計教程,更全一些,一些統(tǒng)計學考研會用到教材
隨機過程
1.4凸優(yōu)化
SVM需要用到它的拉格朗日對偶、拉格朗日乘子法、凸優(yōu)化,梯度下降法、牛頓法
書籍:
Stephen Boyd / 王書寧 ,講的很全面了,書也很厚
1.5信息論
交叉熵、KL散度
2.Python基礎
以下四個教程均來自同一個up講的很不錯,學習機器學習必看,python學習也相對簡單
題庫
??途W(wǎng) python入門or CS61A題庫
學完后做一些oj題目,對于熟悉語法有些幫助
3.python數(shù)據(jù)分析
機器學習大部分工作是在做數(shù)據(jù)處理(特征工程),所以數(shù)據(jù)分析代碼底子越好,寫機器學習代碼越輕松,因為有sklearn以后模型的訓練、測試很簡單了。
numpy
pandas
mataplotlib:可視化包
視頻學習資源
練習網(wǎng)站
??途W(wǎng)python數(shù)據(jù)分析
3.機器學習理論
新手推薦先看統(tǒng)計學習方法,個人感覺比西瓜書容易理解。很像一本數(shù)學書。不至于公式跳步,也更容易抓住重點,西瓜書看完一章需要自己總結(jié)。機器學習和計算機其他課程不一樣很容易看不懂,可以先打個問號,往后讀,然后每周抽出固定時間集中解決問號。
3.1 煉氣
這門課程是配套統(tǒng)計學習方法的,感覺講的很不錯。尤其是樸素貝葉斯方法那塊
3.2 筑基
然后就是西瓜書+南瓜書,南瓜書可以看電子版的。遇到那個公式不懂查一下。
3.3 金丹
,這本書要求數(shù)學功底有點高,難度高,但好處是詳細,但是她是深入必備書籍。
4.機器學習公式
有很詳細的公式推導,有很多學習方法有很多角度理解比如線性回歸。很精彩。但樸素貝葉斯有所不足??梢杂?/span>那個視頻互為補充。
5.機器學習實踐
有了前面基礎,代碼其實很簡單。可以看黑馬or百戰(zhàn)機器學習,我個人是看百戰(zhàn)的。搜搜云盤、論壇應該能找到。代碼非常模板化。新手可以直接上手用sklearn。
通用步驟就是
導入數(shù)據(jù)
數(shù)據(jù)預處理
特征工程
訓練
預測
6.深度學習理論
6.1 元嬰
新手推薦神經(jīng)網(wǎng)絡與深度學習by丘錫鵬+
這個老師講的很不錯,和書本配套,NNDL相比與花書簡練很多。也更容易抓住重點
6.2 渡劫
花書+中科大的
看過NNDL以后再看花書應該很輕松了
其他
李宏毅老師的機器學習(雖說是機器學習但大部分內(nèi)容是深度學習啦)
7.深度學習實踐
首推劉二大人的
后續(xù)打算學NLP和知識圖譜,學完在更新。更多內(nèi)容可以參考我的收藏夾