散文網(wǎng) » 科技 »學(xué)習(xí) » 基于深度學(xué)習(xí)的動物識別系統(tǒng)（YOLOv5清新界面版，Python代碼）

基于深度學(xué)習(xí)的動物識別系統(tǒng)（YOLOv5清新界面版，Python代碼）

2023-03-20 18:08 作者:思緒亦無限 0人讀過 | 我要投稿

摘要：動物識別系統(tǒng)用于識別和統(tǒng)計常見動物數(shù)量，通過深度學(xué)習(xí)技術(shù)檢測日常幾種動物圖像識別，支持圖片、視頻和攝像頭畫面等形式。在介紹算法原理的同時，給出Python的實現(xiàn)代碼、訓(xùn)練數(shù)據(jù)集以及PyQt的UI界面。動物識別系統(tǒng)主要用于常見動物的識別，檢測幾種動物的數(shù)目、位置、預(yù)測置信度等；檢測模型可選擇切換，識別結(jié)果記錄在界面表格中；系統(tǒng)設(shè)計有注冊登錄功能，方便用戶進行管理和使用。博文提供了完整的Python代碼和使用教程，適合新入門的朋友參考，完整代碼資源文件請轉(zhuǎn)至文末的下載鏈接。

完整資源下載：https://mbd.pub/o/bread/ZJaXk55s

參考視頻演示：https://www.bilibili.com/video/BV1yT411r7kG/

離線依賴庫下載鏈接：https://pan.baidu.com/s/1hW9z9ofV1FRSezTSj59JSg?pwd=oy4n?（提取碼：oy4n ）

前言

????????人工智能的出現(xiàn)引發(fā)了動物監(jiān)測與識別的巨大變革，如何應(yīng)用智能技術(shù)，來開展野生動物資源的觀測與評估工作成為研究重點。如今CNN作為一種學(xué)習(xí)效率極高且易于訓(xùn)練的深度學(xué)習(xí)模型，在動物識別中最為常用。在CNN的基礎(chǔ)上，人們通過對卷積層、池化層、全連接層等結(jié)構(gòu)的交替與優(yōu)化，加強對圖像的特征提取并通過調(diào)整網(wǎng)絡(luò)層數(shù)加強學(xué)習(xí)能力，進一步訓(xùn)練提高識別性能。

????????這里博主也設(shè)計了基于深度學(xué)習(xí)的動物識別系統(tǒng)，下面給出了軟件界面，同款的簡約風(fēng)，功能也可以滿足圖片、視頻和攝像頭的識別檢測，希望大家可以喜歡，初始界面如下圖：

????????檢測動物時的界面截圖（點擊圖片可放大）如下圖，可識別畫面中存在的多個動物，也可開啟攝像頭或視頻檢測：

???????? 詳細的功能演示效果參見博主的B站視頻或下一節(jié)的動圖演示，覺得不錯的朋友敬請點贊、關(guān)注加收藏！系統(tǒng)UI界面的設(shè)計工作量較大，界面美化更需仔細雕琢，大家有任何建議或意見和可在下方評論交流。

1.?效果演示

????????這里通過動圖看一下識別動物的效果，系統(tǒng)主要實現(xiàn)的功能是對圖片、視頻和攝像頭畫面中的動物屬性進行識別，識別的結(jié)果可視化顯示在界面和圖像中，另外提供多個動物的顯示選擇功能，演示效果如下。

（一）用戶注冊登錄界面

????????這里設(shè)計了一個登錄界面，可以注冊賬號和密碼，然后進行登錄。界面還是參考了當前流行的UI設(shè)計，左側(cè)是一個logo，右側(cè)輸入賬號、密碼、驗證碼

（二）選擇圖片識別

????????系統(tǒng)允許選擇圖片文件進行識別，點擊圖片選擇按鈕圖標選擇圖片后，顯示所有動物識別的結(jié)果，可通過下拉選框查看單個動物的類別。本功能的界面展示如下圖所示：

（三）視頻識別效果展示

????????很多時候我們需要識別一段視頻中的動物種類，這里設(shè)計了視頻選擇功能。點擊視頻按鈕可選擇待檢測的視頻，系統(tǒng)會自動解析視頻逐幀識別動物，并將結(jié)果記錄在右下角表格中，效果如下圖所示：

2.?原理與數(shù)據(jù)集

（一）源碼簡介

????????基于人工特征的野生動物識別方法主要通過人工對野生動物圖像中具有辨識度的特征信息進行提取，并通過特征比對的方式就可以對野生動物所屬的類別進行識別判斷。本文借助YOLOv5實現(xiàn)，下面介紹一下YOLOv5原理。

????????YOLOv5的調(diào)用、訓(xùn)練和預(yù)測都十分方便，并且它為不同的設(shè)備需求和不同的應(yīng)用場景提供了大小和參數(shù)數(shù)量不同的網(wǎng)絡(luò)。

????????（1）主干部分：使用了Focus網(wǎng)絡(luò)結(jié)構(gòu)，具體操作是在一張圖片中每隔一個像素拿到一個值，這個時候獲得了四個獨立的特征層，然后將四個獨立的特征層進行堆疊，此時寬高信息就集中到了通道信息，輸入通道擴充了四倍。該結(jié)構(gòu)在YoloV5第5版之前有所應(yīng)用，最新版本中未使用。

????????（2）數(shù)據(jù)增強：Mosaic數(shù)據(jù)增強、Mosaic利用了四張圖片進行拼接實現(xiàn)數(shù)據(jù)中增強，優(yōu)點是可以豐富檢測物體的背景，且在BN計算的時候可以計算四張圖片的數(shù)據(jù)。

????????（3）多正樣本匹配：在之前的Yolo系列里面，在訓(xùn)練時每一個真實框?qū)?yīng)一個正樣本，即在訓(xùn)練時，每一個真實框僅由一個先驗框負責預(yù)測。YoloV5中為了加快模型的訓(xùn)練效率，增加了正樣本的數(shù)量，在訓(xùn)練時，每一個真實框可以由多個先驗框負責預(yù)測。

（二）數(shù)據(jù)集準備

????????這里我們使用的動物識別數(shù)據(jù)集，是從COCO和VOC數(shù)據(jù)集中抽取的包含鳥、貓、狗、馬、羊等類別的圖像數(shù)據(jù)，每張圖片除包括類別標簽外，還有一個標注的物體邊框（Bounding Box）。組成的訓(xùn)練數(shù)據(jù)集包含1284張圖片，驗證集321張圖片，測試集321張圖片，共計1926張圖片。

????????由于原數(shù)據(jù)集采用的是xml的標注文件格式，所以我們需要將xml格式修改為YOLOv5能夠使用的標注格式，可通過以下代碼進行轉(zhuǎn)換：

????????打開具體的標注文件，你將會看到下面的內(nèi)容，txt文件中每一行表示一個目標，以空格進行區(qū)分，分別表示目標的類別id，歸一化處理之后的中心點x坐標、y坐標、目標框的w和h。

3.?基于YOLOv5的訓(xùn)練與識別

（一）訓(xùn)練過程

????????我們可以在終端輸入如下命令進行訓(xùn)練，當然也可以直接點擊train.py運行。

????????在深度學(xué)習(xí)中，我們通常通過損失函數(shù)下降的曲線來觀察模型訓(xùn)練的情況。而YOLOv5訓(xùn)練時主要包含三個方面的損失：矩形框損失(box_loss)、置信度損失（obj_loss）和分類損失(cls_loss)，在訓(xùn)練結(jié)束后，我們也可以在logs目錄下找到生成對若干訓(xùn)練過程統(tǒng)計圖。下圖為博主訓(xùn)練動物類識別的模型訓(xùn)練曲線圖。

? ? ? ? 一般我們會接觸到兩個指標，分別是召回率recall和精度precision，兩個指標p和r都是簡單地從一個角度來判斷模型的好壞，均是介于0到1之間的數(shù)值，其中接近于1表示模型的性能越好，接近于0表示模型的性能越差，為了綜合評價目標檢測的性能，一般采用均值平均密度map來進一步評估模型的好壞。我們通過設(shè)定不同的置信度的閾值，可以得到在模型在不同的閾值下所計算出的p值和r值，一般情況下，p值和r值是負相關(guān)的，繪制出來可以得到如下圖所示的曲線，其中曲線的面積我們稱AP，目標檢測模型中每種目標可計算出一個AP值，對所有的AP值求平均則可以得到模型的mAP值。

? ? ? ? 以PR-curve為例，可以看到我們的模型在驗證集上的均值平均準確率為0.755。

（二）預(yù)測過程

????????執(zhí)行predict.py得到的結(jié)果如下圖所示，圖中動物的種類和置信度值都標注出來了，預(yù)測速度較快?；诖四Ｐ臀覀兛梢詫⑵湓O(shè)計成一個帶有界面的系統(tǒng)，在界面上選擇圖片、視頻或攝像頭然后調(diào)用模型進行檢測。

????????博主整個系統(tǒng)進行了詳細測試，最終開發(fā)出一版流暢得到清新界面，就是博文演示部分的展示，完整的UI界面、測試圖片視頻、代碼文件，以及Python離線依賴包（方便安裝運行，也可自行配置環(huán)境），均已打包上傳，感興趣的朋友可以通過下載鏈接獲取。

下載鏈接

????若您想獲得博文中涉及的實現(xiàn)完整全部程序文件（包括測試圖片、視頻，py, UI文件等，如下圖），這里已打包上傳至博主的面包多平臺，見可參考博客與視頻，已將所有涉及的文件同時打包到里面，點擊即可運行，完整文件截圖如下：

????在文件夾下的資源顯示如下，下面的鏈接中也給出了Python的離線依賴包，讀者可在正確安裝Anaconda和Pycharm軟件后，復(fù)制離線依賴包至項目目錄下進行安裝，離線依賴的使用詳細演示也可見本人B站視頻：win11從頭安裝軟件和配置環(huán)境運行深度學(xué)習(xí)項目、Win10中使用pycharm和anaconda進行python環(huán)境配置教程。

注意：該代碼采用Pycharm+Python3.8開發(fā)，經(jīng)過測試能成功運行，運行界面的主程序為runMain.py和LoginUI.py，測試圖片腳本可運行testPicture.py，測試視頻腳本可運行testVideo.py。為確保程序順利運行，請按照requirements.txt配置Python依賴包的版本。Python版本：3.8，請勿使用其他版本，詳見requirements.txt文件；

完整資源中包含數(shù)據(jù)集及訓(xùn)練代碼，環(huán)境配置與界面中文字、圖片、logo等的修改方法請見視頻，項目完整文件下載請見參考博客文章里面，或參考視頻的簡介處給出：???

完整資源下載：https://mbd.pub/o/bread/ZJaXk55s

參考視頻演示：https://www.bilibili.com/video/BV1yT411r7kG/

離線依賴庫下載鏈接：https://pan.baidu.com/s/1hW9z9ofV1FRSezTSj59JSg?pwd=oy4n?（提取碼：oy4n ）

? ? ? ? 在Qt Designer中可以徹底修改界面的各個控件及設(shè)置，然后將ui文件轉(zhuǎn)換為py文件即可調(diào)用和顯示界面。如果只需要修改界面中的文字、圖標和背景圖的，可以直接在ConfigUI.config文件中修改，步驟如下：

????????（1）打開UI_rec/tools/ConfigUI.config文件，若亂碼請選擇GBK編碼打開。
????????（2）如需修改界面文字，只要選中要改的字符替換成自己的就好。
????????（3）如需修改背景、圖標等，只需修改圖片的路徑。例如，原文件中的背景圖設(shè)置如下：

????????可修改為自己的名為background2.png圖片（位置在UI_rec/icons/文件夾中），可將該項設(shè)置如下即可修改背景圖：

結(jié)束語

????????由于博主能力有限，博文中提及的方法即使經(jīng)過試驗，也難免會有疏漏之處。希望您能熱心指出其中的錯誤，以便下次修改時能以一個更完美更嚴謹?shù)臉幼?，呈現(xiàn)在大家面前。同時如果有更好的實現(xiàn)方法也請您不吝賜教。

標簽：深度學(xué)習(xí)Python 目標檢測動物識別 YOLOv5 UI界面美化