散文網(wǎng) » 科技 »學(xué)習(xí) » 基于YOLOv5的艦船檢測與識別系統(tǒng)（Python+清新界面+數(shù)據(jù)集）

基于YOLOv5的艦船檢測與識別系統(tǒng)（Python+清新界面+數(shù)據(jù)集）

2023-03-20 18:04 作者:思緒亦無限 0人讀過 | 我要投稿

摘要：基于YOLOv5的艦船檢測與識別系統(tǒng)用于識別包括漁船、游輪等多種海上船只類型，檢測船艦?zāi)繕?biāo)并進(jìn)行識別計(jì)數(shù)，以提供海洋船只的自動化監(jiān)測和管理。本文詳細(xì)介紹船艦類型識別系統(tǒng)，在介紹算法原理的同時(shí)，給出Python的實(shí)現(xiàn)代碼、訓(xùn)練數(shù)據(jù)集以及PyQt的UI界面。在界面中可以選擇各種圖片、視頻進(jìn)行檢測識別；可對圖像中存在的多目標(biāo)進(jìn)行識別分類。博文提供了完整的Python代碼和使用教程，適合新入門的朋友參考，完整代碼資源文件請轉(zhuǎn)至文末的下載鏈接。

完整資源下載：https://mbd.pub/o/bread/ZJaXlZxt

參考視頻演示：https://www.bilibili.com/video/BV19b411o76q/

離線依賴庫下載鏈接：https://pan.baidu.com/s/1hW9z9ofV1FRSezTSj59JSg?pwd=oy4n?（提取碼：oy4n ）

前言

????????準(zhǔn)確有效的海上船舶識別技術(shù)對于提高船舶航行安全是非常重要的，同時(shí)也是船舶智能化發(fā)展的關(guān)鍵技術(shù)。傳統(tǒng)的船舶識別主要依靠船舶自動識別系統(tǒng)(Automatic identification system,AIS)和雷達(dá)等通信導(dǎo)航設(shè)備完成。船舶雷達(dá)主要用于航行避讓、船舶定位和狹水道引航等，是船舶航行必要的導(dǎo)航設(shè)備，但其也存在目標(biāo)誤識別、目標(biāo)丟失和易受環(huán)境噪聲影響等缺點(diǎn)。船舶自動識別系統(tǒng)能夠準(zhǔn)確獲得船舶基本信息，可輔助識別船只、協(xié)助追蹤目標(biāo)、簡化信息交流和提供其他輔助信息，以避免碰撞發(fā)生，但對于未裝配該系統(tǒng)或終端關(guān)機(jī)的船舶則無法獲取相關(guān)信息。上述基于通信導(dǎo)航設(shè)備的船舶識別方法有其優(yōu)點(diǎn)，但因無法獲取船舶直觀圖像，在港口等交通密集水域有較大的局限性。目前，基于深度學(xué)習(xí)的船舶識別方法的研究已取得了一定進(jìn)展，通過自動提取船舶圖像特征及不斷學(xué)習(xí)與訓(xùn)練，實(shí)現(xiàn)對海上交通視頻和圖像中船舶的識別，其代表模型有CNN、R-CNN、Faster R-CNN、SSD和YOLO等。其中，針對卷積神經(jīng)網(wǎng)絡(luò)的船舶識別結(jié)果易受到圖像背景干擾的問題。

????????本系統(tǒng)基于YOLOv5，對于圖片、視頻和攝像頭捕獲的實(shí)時(shí)畫面，可檢測艦船，系統(tǒng)支持結(jié)果記錄、展示和保存，每次檢測的結(jié)果記錄在表格中。這里給出了博主設(shè)計(jì)的界面，同款的簡約風(fēng)，功能也可以滿足圖片、視頻和攝像頭的識別檢測，希望大家可以喜歡，初始界面如下圖：

????????檢測類別時(shí)的界面截圖（點(diǎn)擊圖片可放大）如下圖，可識別畫面中存在的多個(gè)類別，也可開啟攝像頭或視頻檢測：

???????? 詳細(xì)的功能演示效果參見博主的B站視頻或下一節(jié)的動圖演示，覺得不錯(cuò)的朋友敬請點(diǎn)贊、關(guān)注加收藏！系統(tǒng)UI界面的設(shè)計(jì)工作量較大，界面美化更需仔細(xì)雕琢，大家有任何建議或意見和可在下方評論交流。

1.?效果演示

????????我們還是通過動圖看一下識別的效果，系統(tǒng)主要實(shí)現(xiàn)的功能是對圖片、視頻和攝像頭畫面中的艦船進(jìn)行識別，識別的結(jié)果可視化顯示在界面和圖像中，另外提供多個(gè)目標(biāo)的顯示選擇功能，演示效果如下。

（一）系統(tǒng)介紹

????????基于YOLOv5的艦船檢測與識別系統(tǒng)主要用于海上船只類型的智能檢測與識別，基于深度學(xué)習(xí)技術(shù)識別包括漁船、游輪、貨輪、軍艦等多種常見的船艦類型，輸出船只的標(biāo)記框坐標(biāo)和類別，以輔助自動化監(jiān)測海上船只航行情況；軟件提供登錄注冊功能，可進(jìn)行用戶管理；軟件能夠有效識別相機(jī)采集的圖片、視頻等文件，檢測船只類型情況，并記錄識別結(jié)果在界面表格中方便查看；可開啟攝像頭實(shí)時(shí)監(jiān)測和統(tǒng)計(jì)當(dāng)前視野范圍各種類型船艦，支持結(jié)果記錄、展示和保存。

（二）用戶注冊登錄界面

????????這里設(shè)計(jì)了一個(gè)登錄界面，可以注冊賬號和密碼，然后進(jìn)行登錄。界面還是參考了當(dāng)前流行的UI設(shè)計(jì)，左側(cè)是一個(gè)logo，右側(cè)輸入賬號、密碼、驗(yàn)證碼等等。

（三）選擇圖片識別

????????系統(tǒng)允許選擇圖片文件進(jìn)行識別，點(diǎn)擊圖片選擇按鈕圖標(biāo)選擇圖片后，顯示所有識別的結(jié)果，可通過下拉選框查看單個(gè)結(jié)果，以便具體判斷某一特定目標(biāo)。本功能的界面展示如下圖所示：

（四）視頻識別效果展示

????????很多時(shí)候我們需要識別一段視頻中的多個(gè)艦船，這里設(shè)計(jì)了視頻選擇功能。點(diǎn)擊視頻按鈕可選擇待檢測的視頻，系統(tǒng)會自動解析視頻逐幀識別多個(gè)艦船，并將艦船的分類和計(jì)數(shù)結(jié)果記錄在右下角表格中，效果如下圖所示：

（五）攝像頭檢測效果展示

????????有時(shí)需要開啟攝像頭對艦船進(jìn)行識別，如下圖所示，點(diǎn)擊攝像頭按鈕后系統(tǒng)進(jìn)入準(zhǔn)備狀態(tài)，系統(tǒng)顯示實(shí)時(shí)畫面并開始檢測畫面中的艦船，識別結(jié)果展示如下圖：

2.?數(shù)據(jù)集和YOLOv5訓(xùn)練

????????本文的實(shí)驗(yàn)數(shù)據(jù)集包含海峽、港口、海面等背景下的圖像，也包含不同氣候環(huán)境干擾的圖像。其中，訓(xùn)練集4022張圖片，驗(yàn)證集1130張圖片，測試集574張圖片，共計(jì)5726張圖片，選取部分?jǐn)?shù)據(jù)部分樣本數(shù)據(jù)集如圖所示。

? ? ? ? 每張圖像均提供了圖像類標(biāo)記信息，圖像中艦船的bounding box，艦船的關(guān)鍵part信息，以及艦船的屬性信息，數(shù)據(jù)集并解壓后得到如下的圖片

? ? ? ? ?船艦數(shù)據(jù)集的類別信息如下：

???????? YOLOv5算法具有4個(gè)版本，具體包括：Yolov5s、Yolov5m、Yolov5l、Yolov5x四種，不同的版本在網(wǎng)絡(luò)上有一定加深與加寬。Yolov5網(wǎng)絡(luò)結(jié)構(gòu)是由Input、Backbone、Neck、Prediction組成。Yolov5的Input部分是網(wǎng)絡(luò)的輸入端，采用Mosaic數(shù)據(jù)增強(qiáng)方式，對輸入數(shù)據(jù)隨機(jī)裁剪，然后進(jìn)行拼接。Backbone是Yolov5提取特征的網(wǎng)絡(luò)部分，特征提取能力直接影響整個(gè)網(wǎng)絡(luò)性能。Yolov5的Backbone相比于之前Yolov4提出了新的Focus結(jié)構(gòu)。Focus結(jié)構(gòu)是將圖片進(jìn)行切片操作，將W（寬）、H（高）信息轉(zhuǎn)移到了通道空間中，使得在沒有丟失任何信息的情況下，進(jìn)行了2倍下采樣操作。

???????? 輸入端-輸入端表示輸入的圖片。該網(wǎng)絡(luò)的輸入圖像大小為608*608，該階段通常包含一個(gè)圖像預(yù)處理階段，即將輸入圖像縮放到網(wǎng)絡(luò)的輸入大小，并進(jìn)行歸一化等操作。在網(wǎng)絡(luò)訓(xùn)練階段，YOLOv5使用Mosaic數(shù)據(jù)增強(qiáng)操作提升模型的訓(xùn)練速度和網(wǎng)絡(luò)的精度；并提出了一種自適應(yīng)錨框計(jì)算與自適應(yīng)圖片縮放方法。

???????? 基準(zhǔn)網(wǎng)絡(luò)-基準(zhǔn)網(wǎng)絡(luò)通常是一些性能優(yōu)異的分類器種的網(wǎng)絡(luò)，該模塊用來提取一些通用的特征表示。YOLOv5中不僅使用了CSPDarknet53結(jié)構(gòu)，而且使用了Focus結(jié)構(gòu)作為基準(zhǔn)網(wǎng)絡(luò)。

???????? Neck網(wǎng)絡(luò)-Neck網(wǎng)絡(luò)通常位于基準(zhǔn)網(wǎng)絡(luò)和頭網(wǎng)絡(luò)的中間位置，利用它可以進(jìn)一步提升特征的多樣性及魯棒性。雖然YOLOv5同樣用到了SPP模塊、FPN+PAN模塊，但是實(shí)現(xiàn)的細(xì)節(jié)有些不同。

???????? Head輸出端-Head用來完成目標(biāo)檢測結(jié)果的輸出。針對不同的檢測算法，輸出端的分支個(gè)數(shù)不盡相同，通常包含一個(gè)分類分支和一個(gè)回歸分支。YOLOv4利用GIOU_Loss來代替Smooth L1 Loss函數(shù)，從而進(jìn)一步提升算法的檢測精度。

????????以上就是YOLOv5的整體介紹，接下來進(jìn)行訓(xùn)練。本項(xiàng)目使用Yolov5訓(xùn)練了一個(gè)海上船舶目標(biāo)檢測模型，在筆記本的3070顯卡下訓(xùn)練了300 epoch，訓(xùn)練集和驗(yàn)證集上損失、精確率、召回率、mAP的變化圖：

????????在深度學(xué)習(xí)中，我們通常通過損失函數(shù)下降的曲線來觀察模型訓(xùn)練的情況。而YOLOv5訓(xùn)練時(shí)主要包含三個(gè)方面的損失：矩形框損失(box_loss)、置信度損失（obj_loss）和分類損失(cls_loss)，在訓(xùn)練結(jié)束后，我們也可以在logs目錄下找到生成對若干訓(xùn)練過程統(tǒng)計(jì)圖。下圖為博主訓(xùn)練艦船類識別的模型訓(xùn)練曲線圖。

? ? ? ? 一般我們會接觸到兩個(gè)指標(biāo)，分別是召回率recall和精度precision，兩個(gè)指標(biāo)p和r都是簡單地從一個(gè)角度來判斷模型的好壞，均是介于0到1之間的數(shù)值，其中接近于1表示模型的性能越好，接近于0表示模型的性能越差，為了綜合評價(jià)目標(biāo)檢測的性能，一般采用均值平均密度map來進(jìn)一步評估模型的好壞。我們通過設(shè)定不同的置信度的閾值，可以得到在模型在不同的閾值下所計(jì)算出的p值和r值，一般情況下，p值和r值是負(fù)相關(guān)的，繪制出來可以得到如下圖所示的曲線，其中曲線的面積我們稱AP，目標(biāo)檢測模型中每種目標(biāo)可計(jì)算出一個(gè)AP值，對所有的AP值求平均則可以得到模型的mAP值。以PR-curve為例，可以看到我們的模型在驗(yàn)證集上的均值平均準(zhǔn)確率為0.753。

3.?艦船檢測識別

????????在訓(xùn)練完成后得到最佳模型，接下來我們將幀圖像輸入到這個(gè)網(wǎng)絡(luò)進(jìn)行預(yù)測，從而得到預(yù)測結(jié)果，預(yù)測方法（predict.py）部分的代碼如下所示：

????????執(zhí)行得到的結(jié)果如下圖所示，圖中艦船的種類和置信度值都標(biāo)注出來了，預(yù)測速度較快?；诖四Ｐ臀覀兛梢詫⑵湓O(shè)計(jì)成一個(gè)帶有界面的系統(tǒng)，在界面上選擇圖片、視頻或攝像頭然后調(diào)用模型進(jìn)行檢測。

????????博主對整個(gè)系統(tǒng)進(jìn)行了詳細(xì)測試，最終開發(fā)出一版流暢得到清新界面，就是博文演示部分的展示，完整的UI界面、測試圖片視頻、代碼文件，以及Python離線依賴包（方便安裝運(yùn)行，也可自行配置環(huán)境），均已打包上傳，感興趣的朋友可以通過下載鏈接獲取。

下載鏈接

????若您想獲得博文中涉及的實(shí)現(xiàn)完整全部程序文件（包括測試圖片、視頻，py, UI文件等，如下圖），這里已打包上傳至博主的面包多平臺，見可參考博客與視頻，已將所有涉及的文件同時(shí)打包到里面，點(diǎn)擊即可運(yùn)行，完整文件截圖如下：

????在文件夾下的資源顯示如下，下面的鏈接中也給出了Python的離線依賴包，讀者可在正確安裝Anaconda和Pycharm軟件后，復(fù)制離線依賴包至項(xiàng)目目錄下進(jìn)行安裝，離線依賴的使用詳細(xì)演示也可見本人B站視頻：win11從頭安裝軟件和配置環(huán)境運(yùn)行深度學(xué)習(xí)項(xiàng)目、Win10中使用pycharm和anaconda進(jìn)行python環(huán)境配置教程。

注意：該代碼采用Pycharm+Python3.8開發(fā)，經(jīng)過測試能成功運(yùn)行，運(yùn)行界面的主程序?yàn)閞unMain.py和LoginUI.py，測試圖片腳本可運(yùn)行testPicture.py，測試視頻腳本可運(yùn)行testVideo.py。為確保程序順利運(yùn)行，請按照requirements.txt配置Python依賴包的版本。Python版本：3.8，請勿使用其他版本，詳見requirements.txt文件；

完整資源中包含數(shù)據(jù)集及訓(xùn)練代碼，環(huán)境配置與界面中文字、圖片、logo等的修改方法請見視頻，項(xiàng)目完整文件下載請見參考博客文章里面，或參考視頻的簡介處給出：???

完整資源下載：https://mbd.pub/o/bread/ZJaXlZxt

參考視頻演示：https://www.bilibili.com/video/BV19b411o76q/

離線依賴庫下載鏈接：https://pan.baidu.com/s/1hW9z9ofV1FRSezTSj59JSg?pwd=oy4n?（提取碼：oy4n ）

? ? ? ? 在Qt Designer中可以徹底修改界面的各個(gè)控件及設(shè)置，然后將ui文件轉(zhuǎn)換為py文件即可調(diào)用和顯示界面。如果只需要修改界面中的文字、圖標(biāo)和背景圖的，可以直接在ConfigUI.config文件中修改，步驟如下：

????????（1）打開UI_rec/tools/ConfigUI.config文件，若亂碼請選擇GBK編碼打開。
????????（2）如需修改界面文字，只要選中要改的字符替換成自己的就好。
????????（3）如需修改背景、圖標(biāo)等，只需修改圖片的路徑。例如，原文件中的背景圖設(shè)置如下：

????????可修改為自己的名為background2.png圖片（位置在UI_rec/icons/文件夾中），可將該項(xiàng)設(shè)置如下即可修改背景圖：

結(jié)束語

????????由于博主能力有限，博文中提及的方法即使經(jīng)過試驗(yàn)，也難免會有疏漏之處。希望您能熱心指出其中的錯(cuò)誤，以便下次修改時(shí)能以一個(gè)更完美更嚴(yán)謹(jǐn)?shù)臉幼?，呈現(xiàn)在大家面前。同時(shí)如果有更好的實(shí)現(xiàn)方法也請您不吝賜教。

標(biāo)簽：深度學(xué)習(xí)python 目標(biāo)檢測 YOLOv5 船艦檢測 UI