手機(jī)站首頁散文詩歌雜文隨筆日記小小說

散文網(wǎng) » 生活 »日常 » 北大公開課-人工智能基礎(chǔ) 60 機(jī)器學(xué)習(xí)的范型之有監(jiān)督學(xué)習(xí)范式

北大公開課-人工智能基礎(chǔ) 60 機(jī)器學(xué)習(xí)的范型之有監(jiān)督學(xué)習(xí)范式

2023-04-05 15:06 作者:朝朝暮暮1895 0人讀過 | 我要投稿

從數(shù)據(jù)中學(xué)習(xí)——機(jī)器學(xué)習(xí)

從標(biāo)記過的數(shù)據(jù)中學(xué)習(xí)——有監(jiān)督機(jī)器學(xué)習(xí)

【SVM】

支持向量機(jī)（Support Vector Machine，SVM）是一種二分類模型，其基本模型定義在特征空間上的間隔最大的線性分類器，間隔最大使它有別于感知機(jī)。SVM還包括核技巧，這使它成為實(shí)質(zhì)上的非線性分類器。SVM的學(xué)習(xí)策略就是間隔最大化，可形式化為一個(gè)求解凸二次規(guī)劃（convex quadratic programming）的問題，也等價(jià)于正則化的合頁損失函數(shù)（hinge loss）最小化問題13。

SVM是一種非常優(yōu)秀的分類算法，它具有良好的泛化能力和魯棒性。在實(shí)際應(yīng)用中，SVM已經(jīng)被廣泛應(yīng)用于模式識別、圖像分割、文本分類、手寫字體識別等領(lǐng)域2?。

【k-means】

K均值算法（K-means Clustering Algorithm）是一種常用的聚類算法，它的核心思想是用指定數(shù)量的聚類中心（即K），將數(shù)據(jù)集中的樣本劃分成K個(gè)類別，使每個(gè)樣本點(diǎn)到最近的聚類中心的距離最小1?。K均值算法是一種基于距離度量的聚類算法，它的優(yōu)點(diǎn)是簡單、快速，容易解釋和實(shí)現(xiàn)2?。

K均值算法可以用于圖像分割、文本分類、數(shù)據(jù)挖掘等領(lǐng)域23。

【Q-learning】

Q-learning是一種無模型的增強(qiáng)學(xué)習(xí)技術(shù)，它可以在MDP問題中尋找一個(gè)最優(yōu)的動作選擇策略。Q-Learning是強(qiáng)化學(xué)習(xí)方法的一種，它是一種基于價(jià)值的、離軌策略的、無模型的和在線的強(qiáng)化學(xué)習(xí)算法23。Q-learning算法是一種基于貪心策略的算法，它通過不斷地更新Q值來實(shí)現(xiàn)最優(yōu)策略的搜索1。

Q-Learning算法是一種比較簡單的強(qiáng)化學(xué)習(xí)算法，它在很多領(lǐng)域都有應(yīng)用，如機(jī)器人控制、游戲AI等??。

通過標(biāo)注過的，訓(xùn)練過的數(shù)據(jù)來訓(xùn)練系統(tǒng)，提高系統(tǒng)的效率

【有監(jiān)督學(xué)習(xí)的具體步驟】

1. 準(zhǔn)備數(shù)據(jù)：如果沒有現(xiàn)成的數(shù)據(jù)，需要采集或者爬取數(shù)據(jù)，記住數(shù)據(jù)要帶標(biāo)簽的；如果數(shù)據(jù)倉庫或者是數(shù)據(jù)庫有相應(yīng)的數(shù)據(jù)，你需要將數(shù)據(jù)取出來，特征盡量多；如果只是學(xué)習(xí)，你可以使用公開的數(shù)據(jù)集。

2. 數(shù)據(jù)預(yù)處理：包括數(shù)據(jù)清洗、特征選擇、特征變換、特征降維等。

3. 特征工程：根據(jù)問題的需求，對特征進(jìn)行處理和提取。

4. 模型選擇：選擇適合問題的模型。

5. 模型訓(xùn)練：使用訓(xùn)練集對模型進(jìn)行訓(xùn)練。

6. 模型評估：使用測試集對模型進(jìn)行評估。

7. 模型調(diào)優(yōu)：根據(jù)評估結(jié)果對模型進(jìn)行調(diào)優(yōu)。

以上是有監(jiān)督學(xué)習(xí)的基本步驟。12