基于YOLOv5的艦船檢測與識別系統(tǒng)(Python+清新界面+數(shù)據(jù)集)
摘要:基于YOLOv5的艦船檢測與識別系統(tǒng)用于識別包括漁船、游輪等多種海上船只類型,檢測船艦?zāi)繕?biāo)并進(jìn)行識別計(jì)數(shù),以提供海洋船只的自動化監(jiān)測和管理。本文詳細(xì)介紹船艦類型識別系統(tǒng),在介紹算法原理的同時(shí),給出Python的實(shí)現(xiàn)代碼、訓(xùn)練數(shù)據(jù)集以及PyQt的UI界面。在界面中可以選擇各種圖片、視頻進(jìn)行檢測識別;可對圖像中存在的多目標(biāo)進(jìn)行識別分類。博文提供了完整的Python代碼和使用教程,適合新入門的朋友參考,完整代碼資源文件請轉(zhuǎn)至文末的下載鏈接。

完整資源下載:https://mbd.pub/o/bread/ZJaXlZxt
參考視頻演示:https://www.bilibili.com/video/BV19b411o76q/
離線依賴庫下載鏈接:https://pan.baidu.com/s/1hW9z9ofV1FRSezTSj59JSg?pwd=oy4n?(提取碼:oy4n )

前言
????????準(zhǔn)確有效的海上船舶識別技術(shù)對于提高船舶航行安全是非常重要的,同時(shí)也是船舶智能化發(fā)展的關(guān)鍵技術(shù)。傳統(tǒng)的船舶識別主要依靠船舶自動識別系統(tǒng)(Automatic identification system,AIS)和雷達(dá)等通信導(dǎo)航設(shè)備完成。船舶雷達(dá)主要用于航行避讓、船舶定位和狹水道引航等,是船舶航行必要的導(dǎo)航設(shè)備,但其也存在目標(biāo)誤識別、目標(biāo)丟失和易受環(huán)境噪聲影響等缺點(diǎn)。船舶自動識別系統(tǒng)能夠準(zhǔn)確獲得船舶基本信息,可輔助識別船只、協(xié)助追蹤目標(biāo)、簡化信息交流和提供其他輔助信息,以避免碰撞發(fā)生,但對于未裝配該系統(tǒng)或終端關(guān)機(jī)的船舶則無法獲取相關(guān)信息。上述基于通信導(dǎo)航設(shè)備的船舶識別方法有其優(yōu)點(diǎn),但因無法獲取船舶直觀圖像,在港口等交通密集水域有較大的局限性。目前,基于深度學(xué)習(xí)的船舶識別方法的研究已取得了一定進(jìn)展,通過自動提取船舶圖像特征及不斷學(xué)習(xí)與訓(xùn)練,實(shí)現(xiàn)對海上交通視頻和圖像中船舶的識別,其代表模型有CNN、R-CNN、Faster R-CNN、SSD和YOLO等。其中,針對卷積神經(jīng)網(wǎng)絡(luò)的船舶識別結(jié)果易受到圖像背景干擾的問題。
????????本系統(tǒng)基于YOLOv5,對于圖片、視頻和攝像頭捕獲的實(shí)時(shí)畫面,可檢測艦船,系統(tǒng)支持結(jié)果記錄、展示和保存,每次檢測的結(jié)果記錄在表格中。這里給出了博主設(shè)計(jì)的界面,同款的簡約風(fēng),功能也可以滿足圖片、視頻和攝像頭的識別檢測,希望大家可以喜歡,初始界面如下圖:

????????檢測類別時(shí)的界面截圖(點(diǎn)擊圖片可放大)如下圖,可識別畫面中存在的多個(gè)類別,也可開啟攝像頭或視頻檢測:

???????? 詳細(xì)的功能演示效果參見博主的B站視頻或下一節(jié)的動圖演示,覺得不錯(cuò)的朋友敬請點(diǎn)贊、關(guān)注加收藏!系統(tǒng)UI界面的設(shè)計(jì)工作量較大,界面美化更需仔細(xì)雕琢,大家有任何建議或意見和可在下方評論交流。
1.?效果演示
????????我們還是通過動圖看一下識別的效果,系統(tǒng)主要實(shí)現(xiàn)的功能是對圖片、視頻和攝像頭畫面中的艦船進(jìn)行識別,識別的結(jié)果可視化顯示在界面和圖像中,另外提供多個(gè)目標(biāo)的顯示選擇功能,演示效果如下。
(一)系統(tǒng)介紹
????????基于YOLOv5的艦船檢測與識別系統(tǒng)主要用于海上船只類型的智能檢測與識別,基于深度學(xué)習(xí)技術(shù)識別包括漁船、游輪、貨輪、軍艦等多種常見的船艦類型,輸出船只的標(biāo)記框坐標(biāo)和類別,以輔助自動化監(jiān)測海上船只航行情況;軟件提供登錄注冊功能,可進(jìn)行用戶管理;軟件能夠有效識別相機(jī)采集的圖片、視頻等文件,檢測船只類型情況,并記錄識別結(jié)果在界面表格中方便查看;可開啟攝像頭實(shí)時(shí)監(jiān)測和統(tǒng)計(jì)當(dāng)前視野范圍各種類型船艦,支持結(jié)果記錄、展示和保存。
(二)用戶注冊登錄界面
????????這里設(shè)計(jì)了一個(gè)登錄界面,可以注冊賬號和密碼,然后進(jìn)行登錄。界面還是參考了當(dāng)前流行的UI設(shè)計(jì),左側(cè)是一個(gè)logo,右側(cè)輸入賬號、密碼、驗(yàn)證碼等等。

(三)選擇圖片識別
????????系統(tǒng)允許選擇圖片文件進(jìn)行識別,點(diǎn)擊圖片選擇按鈕圖標(biāo)選擇圖片后,顯示所有識別的結(jié)果,可通過下拉選框查看單個(gè)結(jié)果,以便具體判斷某一特定目標(biāo)。本功能的界面展示如下圖所示:

(四)視頻識別效果展示
????????很多時(shí)候我們需要識別一段視頻中的多個(gè)艦船,這里設(shè)計(jì)了視頻選擇功能。點(diǎn)擊視頻按鈕可選擇待檢測的視頻,系統(tǒng)會自動解析視頻逐幀識別多個(gè)艦船,并將艦船的分類和計(jì)數(shù)結(jié)果記錄在右下角表格中,效果如下圖所示:

(五)攝像頭檢測效果展示
????????有時(shí)需要開啟攝像頭對艦船進(jìn)行識別,如下圖所示,點(diǎn)擊攝像頭按鈕后系統(tǒng)進(jìn)入準(zhǔn)備狀態(tài),系統(tǒng)顯示實(shí)時(shí)畫面并開始檢測畫面中的艦船,識別結(jié)果展示如下圖:

2.?數(shù)據(jù)集和YOLOv5訓(xùn)練
????????本文的實(shí)驗(yàn)數(shù)據(jù)集包含海峽、港口、海面等背景下的圖像,也包含不同氣候環(huán)境干擾的圖像。其中,訓(xùn)練集4022張圖片,驗(yàn)證集1130張圖片,測試集574張圖片,共計(jì)5726張圖片,選取部分?jǐn)?shù)據(jù)部分樣本數(shù)據(jù)集如圖所示。

? ? ? ? 每張圖像均提供了圖像類標(biāo)記信息,圖像中艦船的bounding box,艦船的關(guān)鍵part信息,以及艦船的屬性信息,數(shù)據(jù)集并解壓后得到如下的圖片

? ? ? ? ?船艦數(shù)據(jù)集的類別信息如下:
???????? YOLOv5算法具有4個(gè)版本,具體包括:Yolov5s、Yolov5m、Yolov5l、Yolov5x四種,不同的版本在網(wǎng)絡(luò)上有一定加深與加寬。Yolov5網(wǎng)絡(luò)結(jié)構(gòu)是由Input、Backbone、Neck、Prediction組成。Yolov5的Input部分是網(wǎng)絡(luò)的輸入端,采用Mosaic數(shù)據(jù)增強(qiáng)方式,對輸入數(shù)據(jù)隨機(jī)裁剪,然后進(jìn)行拼接。Backbone是Yolov5提取特征的網(wǎng)絡(luò)部分,特征提取能力直接影響整個(gè)網(wǎng)絡(luò)性能。Yolov5的Backbone相比于之前Yolov4提出了新的Focus結(jié)構(gòu)。Focus結(jié)構(gòu)是將圖片進(jìn)行切片操作,將W(寬)、H(高)信息轉(zhuǎn)移到了通道空間中,使得在沒有丟失任何信息的情況下,進(jìn)行了2倍下采樣操作。

???????? 輸入端-輸入端表示輸入的圖片。該網(wǎng)絡(luò)的輸入圖像大小為608*608,該階段通常包含一個(gè)圖像預(yù)處理階段,即將輸入圖像縮放到網(wǎng)絡(luò)的輸入大小,并進(jìn)行歸一化等操作。在網(wǎng)絡(luò)訓(xùn)練階段,YOLOv5使用Mosaic數(shù)據(jù)增強(qiáng)操作提升模型的訓(xùn)練速度和網(wǎng)絡(luò)的精度;并提出了一種自適應(yīng)錨框計(jì)算與自適應(yīng)圖片縮放方法。
???????? 基準(zhǔn)網(wǎng)絡(luò)-基準(zhǔn)網(wǎng)絡(luò)通常是一些性能優(yōu)異的分類器種的網(wǎng)絡(luò),該模塊用來提取一些通用的特征表示。YOLOv5中不僅使用了CSPDarknet53結(jié)構(gòu),而且使用了Focus結(jié)構(gòu)作為基準(zhǔn)網(wǎng)絡(luò)。
???????? Neck網(wǎng)絡(luò)-Neck網(wǎng)絡(luò)通常位于基準(zhǔn)網(wǎng)絡(luò)和頭網(wǎng)絡(luò)的中間位置,利用它可以進(jìn)一步提升特征的多樣性及魯棒性。雖然YOLOv5同樣用到了SPP模塊、FPN+PAN模塊,但是實(shí)現(xiàn)的細(xì)節(jié)有些不同。
???????? Head輸出端-Head用來完成目標(biāo)檢測結(jié)果的輸出。針對不同的檢測算法,輸出端的分支個(gè)數(shù)不盡相同,通常包含一個(gè)分類分支和一個(gè)回歸分支。YOLOv4利用GIOU_Loss來代替Smooth L1 Loss函數(shù),從而進(jìn)一步提升算法的檢測精度。
????????以上就是YOLOv5的整體介紹,接下來進(jìn)行訓(xùn)練。本項(xiàng)目使用Yolov5訓(xùn)練了一個(gè)海上船舶目標(biāo)檢測模型,在筆記本的3070顯卡下訓(xùn)練了300 epoch,訓(xùn)練集和驗(yàn)證集上損失、精確率、召回率、mAP的變化圖:

????????在深度學(xué)習(xí)中,我們通常通過損失函數(shù)下降的曲線來觀察模型訓(xùn)練的情況。而YOLOv5訓(xùn)練時(shí)主要包含三個(gè)方面的損失:矩形框損失(box_loss)、置信度損失(obj_loss)和分類損失(cls_loss),在訓(xùn)練結(jié)束后,我們也可以在logs目錄下找到生成對若干訓(xùn)練過程統(tǒng)計(jì)圖。下圖為博主訓(xùn)練艦船類識別的模型訓(xùn)練曲線圖。

? ? ? ? 一般我們會接觸到兩個(gè)指標(biāo),分別是召回率recall和精度precision,兩個(gè)指標(biāo)p和r都是簡單地從一個(gè)角度來判斷模型的好壞,均是介于0到1之間的數(shù)值,其中接近于1表示模型的性能越好,接近于0表示模型的性能越差,為了綜合評價(jià)目標(biāo)檢測的性能,一般采用均值平均密度map來進(jìn)一步評估模型的好壞。我們通過設(shè)定不同的置信度的閾值,可以得到在模型在不同的閾值下所計(jì)算出的p值和r值,一般情況下,p值和r值是負(fù)相關(guān)的,繪制出來可以得到如下圖所示的曲線,其中曲線的面積我們稱AP,目標(biāo)檢測模型中每種目標(biāo)可計(jì)算出一個(gè)AP值,對所有的AP值求平均則可以得到模型的mAP值。以PR-curve為例,可以看到我們的模型在驗(yàn)證集上的均值平均準(zhǔn)確率為0.753。

3.?艦船檢測識別
????????在訓(xùn)練完成后得到最佳模型,接下來我們將幀圖像輸入到這個(gè)網(wǎng)絡(luò)進(jìn)行預(yù)測,從而得到預(yù)測結(jié)果,預(yù)測方法(predict.py)部分的代碼如下所示:
????????執(zhí)行得到的結(jié)果如下圖所示,圖中艦船的種類和置信度值都標(biāo)注出來了,預(yù)測速度較快?;诖四P臀覀兛梢詫⑵湓O(shè)計(jì)成一個(gè)帶有界面的系統(tǒng),在界面上選擇圖片、視頻或攝像頭然后調(diào)用模型進(jìn)行檢測。

????????博主對整個(gè)系統(tǒng)進(jìn)行了詳細(xì)測試,最終開發(fā)出一版流暢得到清新界面,就是博文演示部分的展示,完整的UI界面、測試圖片視頻、代碼文件,以及Python離線依賴包(方便安裝運(yùn)行,也可自行配置環(huán)境),均已打包上傳,感興趣的朋友可以通過下載鏈接獲取。

下載鏈接
????若您想獲得博文中涉及的實(shí)現(xiàn)完整全部程序文件(包括測試圖片、視頻,py, UI文件等,如下圖),這里已打包上傳至博主的面包多平臺,見可參考博客與視頻,已將所有涉及的文件同時(shí)打包到里面,點(diǎn)擊即可運(yùn)行,完整文件截圖如下:

????在文件夾下的資源顯示如下,下面的鏈接中也給出了Python的離線依賴包,讀者可在正確安裝Anaconda和Pycharm軟件后,復(fù)制離線依賴包至項(xiàng)目目錄下進(jìn)行安裝,離線依賴的使用詳細(xì)演示也可見本人B站視頻:win11從頭安裝軟件和配置環(huán)境運(yùn)行深度學(xué)習(xí)項(xiàng)目、Win10中使用pycharm和anaconda進(jìn)行python環(huán)境配置教程。

注意:該代碼采用Pycharm+Python3.8開發(fā),經(jīng)過測試能成功運(yùn)行,運(yùn)行界面的主程序?yàn)閞unMain.py和LoginUI.py,測試圖片腳本可運(yùn)行testPicture.py,測試視頻腳本可運(yùn)行testVideo.py。為確保程序順利運(yùn)行,請按照requirements.txt配置Python依賴包的版本。Python版本:3.8,請勿使用其他版本,詳見requirements.txt文件;
完整資源中包含數(shù)據(jù)集及訓(xùn)練代碼,環(huán)境配置與界面中文字、圖片、logo等的修改方法請見視頻,項(xiàng)目完整文件下載請見參考博客文章里面,或參考視頻的簡介處給出:???
完整資源下載:https://mbd.pub/o/bread/ZJaXlZxt
參考視頻演示:https://www.bilibili.com/video/BV19b411o76q/
離線依賴庫下載鏈接:https://pan.baidu.com/s/1hW9z9ofV1FRSezTSj59JSg?pwd=oy4n?(提取碼:oy4n )

? ? ? ? 在Qt Designer中可以徹底修改界面的各個(gè)控件及設(shè)置,然后將ui文件轉(zhuǎn)換為py文件即可調(diào)用和顯示界面。如果只需要修改界面中的文字、圖標(biāo)和背景圖的,可以直接在ConfigUI.config文件中修改,步驟如下:
????????(1)打開UI_rec/tools/ConfigUI.config文件,若亂碼請選擇GBK編碼打開。
????????(2)如需修改界面文字,只要選中要改的字符替換成自己的就好。
????????(3)如需修改背景、圖標(biāo)等,只需修改圖片的路徑。例如,原文件中的背景圖設(shè)置如下:
????????可修改為自己的名為background2.png圖片(位置在UI_rec/icons/文件夾中),可將該項(xiàng)設(shè)置如下即可修改背景圖:
結(jié)束語
????????由于博主能力有限,博文中提及的方法即使經(jīng)過試驗(yàn),也難免會有疏漏之處。希望您能熱心指出其中的錯(cuò)誤,以便下次修改時(shí)能以一個(gè)更完美更嚴(yán)謹(jǐn)?shù)臉幼?,呈現(xiàn)在大家面前。同時(shí)如果有更好的實(shí)現(xiàn)方法也請您不吝賜教。