散文網(wǎng) » 科技 »學習 » 學YOLO目標檢測算法！輕松搞定Yolo面試官

學YOLO目標檢測算法！輕松搞定Yolo面試官

2023-02-27 14:31 作者:跟著唐宇迪學AI 0人讀過 | 我要投稿

? ? ? ?Yolo系列的模型，更新迭代速度可以稱得上是內(nèi)卷之王了，目前已經(jīng)有了V8的版本，面試官心中的理想人選必然得是緊跟學術發(fā)展潮流的，只知道V1-V4的改進點稍顯遜色，本篇就來總結下V5-V7版本的改進點，讓你只看一次，便可在面試時胸有成竹。

資料已經(jīng)整理好了，文末附下載方式！以下是詳細內(nèi)容介紹～

? YoloV5在V4的基礎上，又做了以下改進：

（1）Focus模塊：先間隔完成分塊任務，將圖像特征重排，在通道維度拼接后再走卷積操作，減少網(wǎng)絡層數(shù)和計算量，對速度有一定提升。

（1）BottleneckCSP：將CSP結構與殘差連接巧妙結合，與V4版本的CSPNet結構類似，直觀來看是雙層殘差結構的嵌套，但卷積層的具體參數(shù)，二者的內(nèi)部實現(xiàn)稍有不同。

（3）FPN+PAN：特征融合的更加細致，上采樣與下采樣的多次拼接，進一步支撐小目標檢測。

? ? ? ? ? YoloV5在小目標檢測上效果進一步提升，將自適應錨框計算的代碼也整合到項目源碼中，通過參數(shù)的靈活配置，可以得到不同復雜度的模型，源碼中內(nèi)置的超參數(shù)優(yōu)化策略，也提升了模型的整體性能，是一份很具參考價值、可維護使用的工程性目標檢測項目源碼。

? ? ? ? ? ?YoloV6和V7的發(fā)布時間間隔很短，V6的主要工作是圍繞更好地適應GPU設備，將RepVGG的結構引用到backbone和neck中，同時對檢測頭進行解耦，分開了邊框回歸和類別分類，由于V6版本猶如曇花一現(xiàn)，且與V7版本有相似的改進點，所以本文重點闡述YoloV7版本的以下改進：

（1）RepVGG：重參數(shù)化的主要目的是為了加速、節(jié)省內(nèi)存，由于nvidia設備對3*3的卷積核運算優(yōu)化效果最好，YoloV7將不同尺寸的卷積核、BN層、短路連接層，全部轉化成3*3的卷積，在推理時合并計算，大幅度節(jié)省了計算耗時。

對BN層，在計算公式上做推導、合并，最終的公式如下所示：

對1*1的卷積層和短路連接層，采用填充0的方式，構建成3*3的卷積核，其中短路連接還將卷積核參數(shù)固定成0和1。

（2）正樣本分配策略：把GT的中心點上下左右偏移0.5個單位，由原來一個grid變成了三個grid，得到更多的正樣本候選框。篩選候選框需要滿足以下三個條件：

?GT與anchor的長寬比例要在0.25-4之間

?計算IOU損失，動態(tài)匹配topk。先按大小順序排列取前topk個，但容易出現(xiàn)topk中iou數(shù)值有斷崖式下降的情況，所以做累加和，做一個向下的截斷，自適應topk個樣本。

?計算類別預測損失

（3）相對位置預測：與正樣本分配策略中的中心點偏移、長寬比例篩選條件相呼應。

（2）輔助的輸出頭：每個輸出頭都對應增加一個輔助頭，但仍然利用主頭的預測結果來指導選擇正樣本，由粗到細地引導標簽分配策略。

? ? ? YoloV7在參數(shù)量和計算量上大幅度減少，但性能仍有少量的提升，整體來看，yolo系列的更新迭代，除了自身結構特色的優(yōu)化外，也融進了很多通用性的技巧，這些可移植的改進點非常值得我們?nèi)ゼ毣偨Y、參考借鑒。

? ?? ?當你論文找不到創(chuàng)新點、實際項目沒有提升思路，看看yolo系列就能讓你在短時間內(nèi)吸收諸多的實用技巧，靈感和思路也就應運而生了。面試時yolo系列也是最常見的探討話題，可以稱得上是人工智能方向的基礎送分題了，掌握扎實的基礎上，再加上擴展和自己的總結理解，邏輯清晰地表達觀點、形成共鳴和討論，面試官很難不記住你！