北大公開課-人工智能基礎(chǔ) 60 機(jī)器學(xué)習(xí)的范型之有監(jiān)督學(xué)習(xí)范式


從數(shù)據(jù)中學(xué)習(xí)——機(jī)器學(xué)習(xí)
從標(biāo)記過的數(shù)據(jù)中學(xué)習(xí)——有監(jiān)督機(jī)器學(xué)習(xí)






【SVM】
支持向量機(jī)(Support Vector Machine,SVM)是一種二分類模型,其基本模型定義在特征空間上的間隔最大的線性分類器,間隔最大使它有別于感知機(jī)。SVM還包括核技巧,這使它成為實(shí)質(zhì)上的非線性分類器。SVM的學(xué)習(xí)策略就是間隔最大化,可形式化為一個(gè)求解凸二次規(guī)劃(convex quadratic programming)的問題,也等價(jià)于正則化的合頁損失函數(shù)(hinge loss)最小化問題13。
SVM是一種非常優(yōu)秀的分類算法,它具有良好的泛化能力和魯棒性。在實(shí)際應(yīng)用中,SVM已經(jīng)被廣泛應(yīng)用于模式識別、圖像分割、文本分類、手寫字體識別等領(lǐng)域2?。
【k-means】
K均值算法(K-means Clustering Algorithm)是一種常用的聚類算法,它的核心思想是用指定數(shù)量的聚類中心(即K),將數(shù)據(jù)集中的樣本劃分成K個(gè)類別,使每個(gè)樣本點(diǎn)到最近的聚類中心的距離最小1?。K均值算法是一種基于距離度量的聚類算法,它的優(yōu)點(diǎn)是簡單、快速,容易解釋和實(shí)現(xiàn)2?。
K均值算法可以用于圖像分割、文本分類、數(shù)據(jù)挖掘等領(lǐng)域23。
【Q-learning】
Q-learning是一種無模型的增強(qiáng)學(xué)習(xí)技術(shù),它可以在MDP問題中尋找一個(gè)最優(yōu)的動作選擇策略。Q-Learning是強(qiáng)化學(xué)習(xí)方法的一種,它是一種基于價(jià)值的、離軌策略的、無模型的和在線的強(qiáng)化學(xué)習(xí)算法23。Q-learning算法是一種基于貪心策略的算法,它通過不斷地更新Q值來實(shí)現(xiàn)最優(yōu)策略的搜索1。
Q-Learning算法是一種比較簡單的強(qiáng)化學(xué)習(xí)算法,它在很多領(lǐng)域都有應(yīng)用,如機(jī)器人控制、游戲AI等??。



通過標(biāo)注過的,訓(xùn)練過的數(shù)據(jù)來訓(xùn)練系統(tǒng),提高系統(tǒng)的效率




【有監(jiān)督學(xué)習(xí)的具體步驟】
1. 準(zhǔn)備數(shù)據(jù):如果沒有現(xiàn)成的數(shù)據(jù),需要采集或者爬取數(shù)據(jù),記住數(shù)據(jù)要帶標(biāo)簽的;如果數(shù)據(jù)倉庫或者是數(shù)據(jù)庫有相應(yīng)的數(shù)據(jù),你需要將數(shù)據(jù)取出來,特征盡量多;如果只是學(xué)習(xí),你可以使用公開的數(shù)據(jù)集。
2. 數(shù)據(jù)預(yù)處理:包括數(shù)據(jù)清洗、特征選擇、特征變換、特征降維等。
3. 特征工程:根據(jù)問題的需求,對特征進(jìn)行處理和提取。
4. 模型選擇:選擇適合問題的模型。
5. 模型訓(xùn)練:使用訓(xùn)練集對模型進(jìn)行訓(xùn)練。
6. 模型評估:使用測試集對模型進(jìn)行評估。
7. 模型調(diào)優(yōu):根據(jù)評估結(jié)果對模型進(jìn)行調(diào)優(yōu)。
以上是有監(jiān)督學(xué)習(xí)的基本步驟。12







分類算法和回歸算法的區(qū)別在于輸出變量的類型。分類是指當(dāng)輸出變量是分類的,即具有2個(gè)或更多數(shù)據(jù)類型時(shí)使用?;貧w是指當(dāng)輸出變量是連續(xù)的,即具有實(shí)數(shù)值時(shí)使用。12
分類算法和回歸算法的區(qū)別還有:
- 目的不同:分類算法的目的是預(yù)測輸入變量所屬的類別,而回歸算法的目的是預(yù)測輸入變量的值。
- 本質(zhì)不同:分類算法是離散型問題,而回歸算法是連續(xù)型問題。
- 結(jié)果不同:分類算法輸出的結(jié)果是類別標(biāo)簽,而回歸算法輸出的結(jié)果是實(shí)數(shù)值。

排名算法是指將一組對象按照某種規(guī)則排序的算法。排名算法的主要步驟包括:
1. 確定評價(jià)指標(biāo):評價(jià)指標(biāo)是用來衡量對象優(yōu)劣的標(biāo)準(zhǔn),例如,網(wǎng)頁排名算法中,評價(jià)指標(biāo)可以是網(wǎng)頁的點(diǎn)擊率、訪問量等。
2. 收集數(shù)據(jù):收集與評價(jià)指標(biāo)相關(guān)的數(shù)據(jù)。
3. 數(shù)據(jù)預(yù)處理:對收集到的數(shù)據(jù)進(jìn)行清洗、去重、歸一化等處理。
4. 確定權(quán)重:對不同的評價(jià)指標(biāo)進(jìn)行加權(quán),得到每個(gè)對象的綜合評價(jià)值。
5. 排序:按照綜合評價(jià)值對對象進(jìn)行排序。






有監(jiān)督學(xué)習(xí)的幾種變體

