混淆矩陣與模型評估指標

日前,跨象乘云? 發(fā)布了《汽車出廠前測試時間數(shù)據(jù)分析 - 人工智能垂直領域工程項目案例分享》。本案例為機器學習與人工智能技術應用前導課程,開展工業(yè)、智能制造領域的大數(shù)據(jù)分析,以汽車制造企業(yè)的出廠部件測試為教學對象,介紹在汽車出廠前如何進行故障檢查,故障識別以及質(zhì)量檢測。本實驗主要內(nèi)容包括:基于包含 171 個匿名功能特征的 7,6000 條汽車部件樣本數(shù)據(jù),實現(xiàn)數(shù)據(jù)的整理提煉,特征提取、特征工程、故障診斷、部件性能診斷分析。通過深入淺出的方式會介紹各種大數(shù)據(jù)分析技術在智能制造業(yè)領域的應用。

不同的模型對應著不同的評估指標,不同的評估指標,選擇出來的最優(yōu)模型都是不一樣的,所以還是需要根據(jù)具體的業(yè)務需求來選擇適合自己模型的評估指標。而評估指標的關鍵,便是混淆矩陣。混淆矩陣是用來總結(jié)一個分類器結(jié)果的矩陣。對于 K 元分類,其實它就是一個 KxK 的表格,用來記錄分類器的預測結(jié)果。對于最常見的二元分類來說,它的混淆矩陣是 2x2 的,如下:

關鍵概念
TP(True Positive - 真陽性):真實為 0,預測為 0
FN(False Negative - 假陰性):真實為 0,預測為 1
FP(False Positive - 假陽性):真實為 1,預測為 0
TN(True Negative - 真陰性):真實為 1,預測為 1
關鍵指標







部分內(nèi)容摘錄自 SAMshare 微信號:gh_8528ce7b7e80
標簽: