混合矩陣的評(píng)分:由哪些分類結(jié)果組成?這篇文章說(shuō)清楚!
混合矩陣(Confusion Matrix)是一種用于評(píng)估分類模型性能的工具,它可以展示模型在不同類別上的預(yù)測(cè)結(jié)果與實(shí)際結(jié)果之間的差異。
混合矩陣由四個(gè)不同的分類結(jié)果組成:真正例(True Positive,TP)、假正例(False Positive,F(xiàn)P)、真反例(True Negative,TN)和假反例(False Negative,F(xiàn)N)。
真正例(True Positive,TP)指的是模型正確地將正例預(yù)測(cè)為正例的數(shù)量。例如,在一個(gè)二分類問(wèn)題中,如果模型將某個(gè)病人預(yù)測(cè)為患有某種疾病,而實(shí)際上該病人確實(shí)患有該疾病,那么這個(gè)預(yù)測(cè)結(jié)果就是一個(gè)真正例。
假正例(False Positive,F(xiàn)P)指的是模型錯(cuò)誤地將反例預(yù)測(cè)為正例的數(shù)量。繼續(xù)上面的例子,如果模型將某個(gè)健康的病人預(yù)測(cè)為患有某種疾病,而實(shí)際上該病人并沒(méi)有患有該疾病,那么這個(gè)預(yù)測(cè)結(jié)果就是一個(gè)假正例。
真反例(True Negative,TN)指的是模型正確地將反例預(yù)測(cè)為反例的數(shù)量。在上面的例子中,如果模型將某個(gè)健康的病人預(yù)測(cè)為健康,而實(shí)際上該病人確實(shí)是健康的,那么這個(gè)預(yù)測(cè)結(jié)果就是一個(gè)真反例。
假反例(False Negative,F(xiàn)N)指的是模型錯(cuò)誤地將正例預(yù)測(cè)為反例的數(shù)量。繼續(xù)上面的例子,如果模型將某個(gè)患有某種疾病的病人預(yù)測(cè)為健康,而實(shí)際上該病人確實(shí)患有該疾病,那么這個(gè)預(yù)測(cè)結(jié)果就是一個(gè)假反例。
混合矩陣可以用來(lái)計(jì)算一系列評(píng)分指標(biāo),以評(píng)估分類模型的性能。常見(jiàn)的評(píng)分指標(biāo)包括準(zhǔn)確率(Accuracy)、精確率(Precision)、召回率(Recall)和F1值(F1-Score)等。
準(zhǔn)確率(Accuracy)指的是模型正確預(yù)測(cè)的樣本數(shù)量占總樣本數(shù)量的比例,即 (TP + TN) / (TP + FP + TN + FN)。準(zhǔn)確率越高,模型的性能越好。
精確率(Precision)指的是模型在所有預(yù)測(cè)為正例的樣本中,真正例的比例,即 TP / (TP + FP)。精確率衡量了模型在預(yù)測(cè)為正例的樣本中的準(zhǔn)確性。
召回率(Recall)指的是模型在所有實(shí)際為正例的樣本中,預(yù)測(cè)為正例的比例,即 TP / (TP + FN)。召回率衡量了模型對(duì)正例樣本的查全率。
F1值(F1-Score)是精確率和召回率的調(diào)和平均值,即 2 * (Precision * Recall) / (Precision + Recall)。F1值綜合考慮了模型的準(zhǔn)確性和查全率。
通過(guò)混合矩陣和評(píng)分指標(biāo),我們可以全面評(píng)估分類模型的性能,從而選擇最合適的模型或調(diào)整模型的參數(shù),以提高模型的預(yù)測(cè)能力。
【此文由“青象信息老向原創(chuàng)”轉(zhuǎn)載須備注來(lái)源】