北大公開課-人工智能基礎(chǔ) 55 機(jī)器學(xué)習(xí)的任務(wù)之分類




機(jī)器學(xué)習(xí)的典型任務(wù)包括:分類 (classification)、回歸 (regression)、聚類 (clustering)、排序 (ranking)、密度估計(jì) (density estimation)、特征降維 (dimensionality reduction)等1。其中,
分類是指將數(shù)據(jù)分成不同的類別,
回歸是指預(yù)測數(shù)值型數(shù)據(jù),
聚類是指將數(shù)據(jù)分成不同的組,
排序是指將數(shù)據(jù)按照某種規(guī)則進(jìn)行排序,
密度估計(jì)是指根據(jù)樣本數(shù)據(jù)估計(jì)概率密度函數(shù),
特征降維是指將高維數(shù)據(jù)轉(zhuǎn)化為低維數(shù)據(jù)1。

在機(jī)器學(xué)習(xí)中,分類任務(wù)是指針對輸入數(shù)據(jù)中的給定示例預(yù)測其類別標(biāo)簽的預(yù)測性建模問題。最常見的分類任務(wù)是二分類問題,即將要區(qū)分的數(shù)據(jù)分為兩個(gè)類別。例如,將病人的檢查結(jié)果分為有病和健康,是一個(gè)醫(yī)學(xué)方面的二分類問題。其他常見的分類任務(wù)包括多類別分類、多標(biāo)簽分類和不平衡分類等。
機(jī)器學(xué)習(xí)的分類任務(wù)有很多,其中一個(gè)典型的例子是將數(shù)據(jù)分成不同的類別。例如,將電子郵件分為“垃圾郵件”或“非垃圾郵件”1。在機(jī)器學(xué)習(xí)中,分類是指針對輸入數(shù)據(jù)中的給定示例預(yù)測其類別標(biāo)簽的預(yù)測性建模問題。從建模的角度來看,分類需要一個(gè)訓(xùn)練數(shù)據(jù)集,其中包含許多可供學(xué)習(xí)的輸入和輸出示例。模型將會使用訓(xùn)練數(shù)據(jù)集并計(jì)算如何將輸入數(shù)據(jù)映射到最符合的特定類別標(biāo)簽。