學YOLO目標檢測算法!輕松搞定Yolo面試官

? ? ? ?Yolo系列的模型,更新迭代速度可以稱得上是內(nèi)卷之王了,目前已經(jīng)有了V8的版本,面試官心中的理想人選必然得是緊跟學術發(fā)展潮流的,只知道V1-V4的改進點稍顯遜色,本篇就來總結下V5-V7版本的改進點,讓你只看一次,便可在面試時胸有成竹。
資料已經(jīng)整理好了,文末附下載方式!以下是詳細內(nèi)容介紹~

? YoloV5在V4的基礎上,又做了以下改進:
(1)Focus模塊:先間隔完成分塊任務,將圖像特征重排,在通道維度拼接后再走卷積操作,減少網(wǎng)絡層數(shù)和計算量,對速度有一定提升。

(1)BottleneckCSP:將CSP結構與殘差連接巧妙結合,與V4版本的CSPNet結構類似,直觀來看是雙層殘差結構的嵌套,但卷積層的具體參數(shù),二者的內(nèi)部實現(xiàn)稍有不同。

(3)FPN+PAN:特征融合的更加細致,上采樣與下采樣的多次拼接,進一步支撐小目標檢測。

? ? ? ? ? YoloV5在小目標檢測上效果進一步提升,將自適應錨框計算的代碼也整合到項目源碼中,通過參數(shù)的靈活配置,可以得到不同復雜度的模型,源碼中內(nèi)置的超參數(shù)優(yōu)化策略,也提升了模型的整體性能,是一份很具參考價值、可維護使用的工程性目標檢測項目源碼。
? ? ? ? ? ?YoloV6和V7的發(fā)布時間間隔很短,V6的主要工作是圍繞更好地適應GPU設備,將RepVGG的結構引用到backbone和neck中,同時對檢測頭進行解耦,分開了邊框回歸和類別分類,由于V6版本猶如曇花一現(xiàn),且與V7版本有相似的改進點,所以本文重點闡述YoloV7版本的以下改進:
(1)RepVGG:重參數(shù)化的主要目的是為了加速、節(jié)省內(nèi)存,由于nvidia設備對3*3的卷積核運算優(yōu)化效果最好,YoloV7將不同尺寸的卷積核、BN層、短路連接層,全部轉化成3*3的卷積,在推理時合并計算,大幅度節(jié)省了計算耗時。
對BN層,在計算公式上做推導、合并,最終的公式如下所示:

對1*1的卷積層和短路連接層,采用填充0的方式,構建成3*3的卷積核,其中短路連接還將卷積核參數(shù)固定成0和1。

(2)正樣本分配策略:把GT的中心點上下左右偏移0.5個單位,由原來一個grid變成了三個grid,得到更多的正樣本候選框。篩選候選框需要滿足以下三個條件:
?GT與anchor的長寬比例要在0.25-4之間
?計算IOU損失,動態(tài)匹配topk。先按大小順序排列取前topk個,但容易出現(xiàn)topk中iou數(shù)值有斷崖式下降的情況,所以做累加和,做一個向下的截斷,自適應topk個樣本。

?計算類別預測損失
(3)相對位置預測:與正樣本分配策略中的中心點偏移、長寬比例篩選條件相呼應。

(2)輔助的輸出頭:每個輸出頭都對應增加一個輔助頭,但仍然利用主頭的預測結果來指導選擇正樣本,由粗到細地引導標簽分配策略。
? ? ? YoloV7在參數(shù)量和計算量上大幅度減少,但性能仍有少量的提升,整體來看,yolo系列的更新迭代,除了自身結構特色的優(yōu)化外,也融進了很多通用性的技巧,這些可移植的改進點非常值得我們?nèi)ゼ毣偨Y、參考借鑒。
? ?? ?當你論文找不到創(chuàng)新點、實際項目沒有提升思路,看看yolo系列就能讓你在短時間內(nèi)吸收諸多的實用技巧,靈感和思路也就應運而生了。面試時yolo系列也是最常見的探討話題,可以稱得上是人工智能方向的基礎送分題了,掌握扎實的基礎上,再加上擴展和自己的總結理解,邏輯清晰地表達觀點、形成共鳴和討論,面試官很難不記住你!

免費領取方式
關注UP主“?跟著唐宇迪學AI?”
直接發(fā)送 “YOLO”

還有一種免費領取方式
看評論區(qū)?
