學習筆記-YOLOv5運行結果文件認識初探
內容主要來源:https://blog.csdn.net/qq_42784882/article/details/127386465

當我們的yolov5跑完數據集后,會反饋給我們很多文件,如上圖所示。
前置概念:
基礎概念:

幾個指標:

weights:
此文件夾存放訓練過程最好的和最后一此迭代訓練得到的權重:best.pt和last.pt

confusion混淆矩陣:

左側為預測類,下方為目標真實類,從下方上看。比如,此次訓練,time目標被被訓練得到的模型識別為time的比例為1,即被百分百識別。而have目標識別have的比例0.8左右,另有0.2比例被識別為tea。同理,name目標被錯誤識別為people的比例為0.2左右。
labels.jpg:

左上為每個類別的數量。右上為框的尺寸和數量。
左下為框的中心點坐標。右下為框的長度和寬度。
對應的許是訓練集的數據內容,不知道有沒有驗證集,這一點和具體怎么度量就以后再說吧。
P_curve:
p曲線,即precision精確率曲線。下方的confidence按照我在吳恩達機器學習中學到的內容,理解為模型求解圖片后,對于圖片 存在/是 某一類別的對象,給出的可能性、置信度。我們可以設置圖片置信度的閾值,判斷置信度大于該閾值的圖片屬于該類別,得到模型對該圖片的最終判斷,即是某物。那么圖片就好理解了,即置信度閾值越高,模型才認為圖片是該物品,模型判斷的越準確,這是很自然的,無需解釋。但置信度閾值過高,可能會導致掉那些忽略信度低,但確實有該物品的圖像。
藍線是全體類別判斷精度,灰線則是其余具體的類的精準率_置信度曲線。

R_curve:
Recall/召回率/查全率曲線。Recall即上面公式圖中的TPR對應的Sensitivity:真實值是yes(positive或稱正例,即有要檢測的類別的單個圖片樣本)的樣本的預測結果正確的比例,正例預測正確的比例。即正例查全的比例。顯然,置信度月底,查全率會越高,即不容易漏過有對象的圖片。
藍線,灰線同上。

PR_curve:
精確度和召回率的關系曲線。毫無疑問,我們希望R越低越好,P越高越好,但這是矛盾的,前者需要置信度閾值降低,后者需要置信度閾值增高,它們是一對矛盾的性能度量指標。
于是有了PR_curve,精確度和召回率曲線,此處的P為mAP(mean Average Precision),即平均精度,

毫無疑問,我們希望P與R都能到1,即曲線圍成最大的正方框,面積接近1。
F1_curve
F1(F1-score)曲線。F1=2*P*R/(P+R),是P與R的調和平均數,我認為是一種對P與R的綜合度量。1最好,0最差。

引用第一個衡量指標:mAP曲線的面積大小。
result:

橫坐標為輪數(epoch),縱坐標為各類損失,越小,效果越好些。個人認為box為預測標框與標注標框偏差,obj是圖片有無識別出對象偏差,cls為對象分類偏差。
引用第二個衡量指標:“宏觀上一般訓練結果主要觀察精度和召回率波動情況,波動不是很大則訓練效果較好;如果訓練比較好的話圖上呈現的是穩(wěn)步上升?!?/span>