最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

北大公開課-人工智能基礎(chǔ) 60 機(jī)器學(xué)習(xí)的范型之有監(jiān)督學(xué)習(xí)范式

2023-04-05 15:06 作者:朝朝暮暮1895  | 我要投稿


從數(shù)據(jù)中學(xué)習(xí)——機(jī)器學(xué)習(xí)

從標(biāo)記過的數(shù)據(jù)中學(xué)習(xí)——有監(jiān)督機(jī)器學(xué)習(xí)

【SVM】

支持向量機(jī)(Support Vector Machine,SVM)是一種二分類模型,其基本模型定義在特征空間上的間隔最大的線性分類器,間隔最大使它有別于感知機(jī)。SVM還包括核技巧,這使它成為實(shí)質(zhì)上的非線性分類器。SVM的學(xué)習(xí)策略就是間隔最大化,可形式化為一個(gè)求解凸二次規(guī)劃(convex quadratic programming)的問題,也等價(jià)于正則化的合頁損失函數(shù)(hinge loss)最小化問題13。

SVM是一種非常優(yōu)秀的分類算法,它具有良好的泛化能力和魯棒性。在實(shí)際應(yīng)用中,SVM已經(jīng)被廣泛應(yīng)用于模式識別、圖像分割、文本分類、手寫字體識別等領(lǐng)域2?。


【k-means】

K均值算法(K-means Clustering Algorithm)是一種常用的聚類算法,它的核心思想是用指定數(shù)量的聚類中心(即K),將數(shù)據(jù)集中的樣本劃分成K個(gè)類別,使每個(gè)樣本點(diǎn)到最近的聚類中心的距離最小1?。K均值算法是一種基于距離度量的聚類算法,它的優(yōu)點(diǎn)是簡單、快速,容易解釋和實(shí)現(xiàn)2?。

K均值算法可以用于圖像分割、文本分類、數(shù)據(jù)挖掘等領(lǐng)域23。


【Q-learning】

Q-learning是一種無模型的增強(qiáng)學(xué)習(xí)技術(shù),它可以在MDP問題中尋找一個(gè)最優(yōu)的動作選擇策略。Q-Learning是強(qiáng)化學(xué)習(xí)方法的一種,它是一種基于價(jià)值的、離軌策略的、無模型的和在線的強(qiáng)化學(xué)習(xí)算法23。Q-learning算法是一種基于貪心策略的算法,它通過不斷地更新Q值來實(shí)現(xiàn)最優(yōu)策略的搜索1。

Q-Learning算法是一種比較簡單的強(qiáng)化學(xué)習(xí)算法,它在很多領(lǐng)域都有應(yīng)用,如機(jī)器人控制、游戲AI等??。

通過標(biāo)注過的,訓(xùn)練過的數(shù)據(jù)來訓(xùn)練系統(tǒng),提高系統(tǒng)的效率

【有監(jiān)督學(xué)習(xí)的具體步驟】

1. 準(zhǔn)備數(shù)據(jù):如果沒有現(xiàn)成的數(shù)據(jù),需要采集或者爬取數(shù)據(jù),記住數(shù)據(jù)要帶標(biāo)簽的;如果數(shù)據(jù)倉庫或者是數(shù)據(jù)庫有相應(yīng)的數(shù)據(jù),你需要將數(shù)據(jù)取出來,特征盡量多;如果只是學(xué)習(xí),你可以使用公開的數(shù)據(jù)集。

2. 數(shù)據(jù)預(yù)處理:包括數(shù)據(jù)清洗、特征選擇、特征變換、特征降維等。

3. 特征工程:根據(jù)問題的需求,對特征進(jìn)行處理和提取。

4. 模型選擇:選擇適合問題的模型。

5. 模型訓(xùn)練:使用訓(xùn)練集對模型進(jìn)行訓(xùn)練。

6. 模型評估:使用測試集對模型進(jìn)行評估。

7. 模型調(diào)優(yōu):根據(jù)評估結(jié)果對模型進(jìn)行調(diào)優(yōu)。

以上是有監(jiān)督學(xué)習(xí)的基本步驟。12


分類算法和回歸算法的區(qū)別在于輸出變量的類型。分類是指當(dāng)輸出變量是分類的,即具有2個(gè)或更多數(shù)據(jù)類型時(shí)使用?;貧w是指當(dāng)輸出變量是連續(xù)的,即具有實(shí)數(shù)值時(shí)使用。12

分類算法和回歸算法的區(qū)別還有:

- 目的不同:分類算法的目的是預(yù)測輸入變量所屬的類別,而回歸算法的目的是預(yù)測輸入變量的值。

- 本質(zhì)不同:分類算法是離散型問題,而回歸算法是連續(xù)型問題。

- 結(jié)果不同:分類算法輸出的結(jié)果是類別標(biāo)簽,而回歸算法輸出的結(jié)果是實(shí)數(shù)值。


排名算法是指將一組對象按照某種規(guī)則排序的算法。排名算法的主要步驟包括:

1. 確定評價(jià)指標(biāo):評價(jià)指標(biāo)是用來衡量對象優(yōu)劣的標(biāo)準(zhǔn),例如,網(wǎng)頁排名算法中,評價(jià)指標(biāo)可以是網(wǎng)頁的點(diǎn)擊率、訪問量等。

2. 收集數(shù)據(jù):收集與評價(jià)指標(biāo)相關(guān)的數(shù)據(jù)。

3. 數(shù)據(jù)預(yù)處理:對收集到的數(shù)據(jù)進(jìn)行清洗、去重、歸一化等處理。

4. 確定權(quán)重:對不同的評價(jià)指標(biāo)進(jìn)行加權(quán),得到每個(gè)對象的綜合評價(jià)值。

5. 排序:按照綜合評價(jià)值對對象進(jìn)行排序。

有監(jiān)督學(xué)習(xí)的幾種變體




北大公開課-人工智能基礎(chǔ) 60 機(jī)器學(xué)習(xí)的范型之有監(jiān)督學(xué)習(xí)范式的評論 (共 條)

分享到微博請遵守國家法律
高陵县| 怀来县| 都安| 无极县| 新建县| 盐亭县| 确山县| 清流县| 洛宁县| 仙游县| 信阳市| 土默特右旗| 虎林市| 大丰市| 胶南市| 偃师市| 游戏| 托克逊县| 封丘县| 家居| 卓尼县| 遂宁市| 黑龙江省| 鄢陵县| 花莲市| 舞阳县| 汤阴县| 社旗县| 望城县| 酒泉市| 浙江省| 山东| 轮台县| 舒城县| 财经| 梅州市| 八宿县| 肃北| 阿拉善右旗| 房山区| 湘阴县|