混合矩陣怎么計(jì)算評估指標(biāo)?
混合矩陣(Confusion Matrix)是用于評估分類模型性能的一種常用工具。在二分類問題中,混合矩陣是一個(gè)2x2的矩陣,用于統(tǒng)計(jì)模型預(yù)測結(jié)果與真實(shí)標(biāo)簽的對應(yīng)關(guān)系。其中,矩陣的行表示真實(shí)標(biāo)簽,列表示模型預(yù)測結(jié)果。
混合矩陣的四個(gè)元素分別表示:
- True Positive(真正例):模型將正例預(yù)測為正例的數(shù)量。
- False Positive(假正例):模型將負(fù)例預(yù)測為正例的數(shù)量。
- True Negative(真負(fù)例):模型將負(fù)例預(yù)測為負(fù)例的數(shù)量。
- False Negative(假負(fù)例):模型將正例預(yù)測為負(fù)例的數(shù)量。
根據(jù)混合矩陣的四個(gè)元素,可以計(jì)算出一系列評估指標(biāo),如準(zhǔn)確率、召回率、精確率和F1值等,用于評估模型的性能。
以二分類問題為例,假設(shè)我們有一個(gè)二分類模型,用于預(yù)測某個(gè)疾病的患病情況。我們將模型的預(yù)測結(jié)果與真實(shí)標(biāo)簽進(jìn)行對比,得到以下混合矩陣:
| | 預(yù)測為正例 | 預(yù)測為負(fù)例 |
|----------|------------|------------|
| 真實(shí)正例 | 90 | 10 |
| 真實(shí)負(fù)例 | 20 | 80 |
根據(jù)上述混合矩陣,可以計(jì)算出以下評估指標(biāo):
- 準(zhǔn)確率(Accuracy):模型預(yù)測正確的樣本數(shù)占總樣本數(shù)的比例,即 (TP + TN) / (TP + FP + TN + FN) = (90 + 80) / (90 + 10 + 20 + 80) = 0.85。
- 召回率(Recall):模型正確預(yù)測為正例的樣本數(shù)占真實(shí)正例樣本數(shù)的比例,即 TP / (TP + FN) = 90 / (90 + 10) = 0.9。
- 精確率(Precision):模型正確預(yù)測為正例的樣本數(shù)占預(yù)測為正例的樣本數(shù)的比例,即 TP / (TP + FP) = 90 / (90 + 20) = 0.818。
- F1值(F1-score):綜合考慮了召回率和精確率的指標(biāo),即 2 * (Precision * Recall) / (Precision + Recall) = 2 * (0.818 * 0.9) / (0.818 + 0.9) = 0.857。
通過混合矩陣和相關(guān)評估指標(biāo),我們可以對分類模型的性能進(jìn)行全面的評估和比較,從而選擇最合適的模型。
【此文由青象信息老向原創(chuàng),轉(zhuǎn)載須備注來源】