吸煙行為檢測(cè)系統(tǒng)(Python+YOLOv5深度學(xué)習(xí)模型+清新界面)
摘要:吸煙行為檢測(cè)軟件用于日常場(chǎng)景下吸煙行為監(jiān)測(cè),快速準(zhǔn)確識(shí)別和定位吸煙位置、記錄并顯示檢測(cè)結(jié)果,輔助公共場(chǎng)所吸煙安全報(bào)警等。本文詳細(xì)介紹吸煙行為檢測(cè)系統(tǒng),在介紹算法原理的同時(shí),給出Python的實(shí)現(xiàn)代碼、訓(xùn)練數(shù)據(jù)集以及PyQt的UI界面。在界面中可以選擇各種圖片、視頻進(jìn)行檢測(cè)識(shí)別,基于YOLOv5算法實(shí)現(xiàn)對(duì)圖像中存在的多目標(biāo)進(jìn)行識(shí)別分類(lèi)。博文提供了完整的Python代碼和使用教程,適合新入門(mén)的朋友參考,完整代碼資源文件請(qǐng)轉(zhuǎn)至文末的下載鏈接。

完整代碼下載:https://mbd.pub/o/bread/ZJaXlplv
參考視頻演示:https://www.bilibili.com/video/BV1u24y1t7Vi/
離線依賴(lài)庫(kù)下載:https://pan.baidu.com/s/1hW9z9ofV1FRSezTSj59JSg?pwd=oy4n?(提取碼:oy4n )

前言
????????吸煙行為檢測(cè)是指通過(guò)計(jì)算機(jī)視覺(jué)技術(shù)對(duì)人體吸煙行為進(jìn)行實(shí)時(shí)監(jiān)測(cè)和識(shí)別的過(guò)程。吸煙行為檢測(cè)主要包括吸煙檢測(cè)和煙霧檢測(cè)兩類(lèi)。吸煙檢測(cè)主要通過(guò)分析監(jiān)控視頻圖像中人體的姿態(tài)、動(dòng)作等特征,結(jié)合機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等方法實(shí)現(xiàn)對(duì)吸煙行為的自動(dòng)檢測(cè)和識(shí)別。煙霧檢測(cè)則主要通過(guò)分析監(jiān)控視頻圖像中的煙霧特征,如煙霧顏色、煙霧形狀、煙霧密度等,結(jié)合圖像處理和模式識(shí)別技術(shù),實(shí)現(xiàn)對(duì)煙霧的自動(dòng)檢測(cè)和識(shí)別。吸煙行為檢測(cè)可以廣泛應(yīng)用于公共場(chǎng)所、辦公場(chǎng)所、醫(yī)院等場(chǎng)所的吸煙行為監(jiān)管,有助于減少吸煙對(duì)健康的危害和減少吸煙對(duì)公共環(huán)境的污染。同時(shí),吸煙行為檢測(cè)也可以用于煙草研究、吸煙行為數(shù)據(jù)分析等領(lǐng)域。近年來(lái),隨著計(jì)算機(jī)視覺(jué)和人工智能技術(shù)的不斷發(fā)展和應(yīng)用,吸煙行為檢測(cè)的精度和實(shí)時(shí)性不斷提高,為吸煙行為監(jiān)管和煙草控制提供了新的技術(shù)手段。
????????網(wǎng)上的類(lèi)似識(shí)別程序代碼很多,大部分都是采用YOLO等算法等的源碼進(jìn)行重新訓(xùn)練,對(duì)于界面的展示較少,幾乎沒(méi)有人將其開(kāi)發(fā)成一個(gè)可以展示的完整軟件,并不方便選擇文件和實(shí)時(shí)檢測(cè)。對(duì)此這里給出博主設(shè)計(jì)的界面,同款的簡(jiǎn)約風(fēng),功能也可以滿足圖片、視頻和攝像頭的識(shí)別檢測(cè),希望大家可以喜歡,初始界面如下圖:

????????檢測(cè)類(lèi)別時(shí)的界面截圖(點(diǎn)擊圖片可放大)如下圖,可識(shí)別畫(huà)面中存在的多個(gè)類(lèi)別,也可開(kāi)啟攝像頭或視頻檢測(cè):

???????? 詳細(xì)的功能演示效果參見(jiàn)博主的B站視頻或下一節(jié)的動(dòng)圖演示,覺(jué)得不錯(cuò)的朋友敬請(qǐng)點(diǎn)贊、關(guān)注加收藏!系統(tǒng)UI界面的設(shè)計(jì)工作量較大,界面美化更需仔細(xì)雕琢,大家有任何建議或意見(jiàn)和可在下方評(píng)論交流。
1.?效果演示
????????軟件的功能和顏值都很重要,首先我們還是通過(guò)動(dòng)圖看一下識(shí)別的效果,系統(tǒng)主要實(shí)現(xiàn)的功能是對(duì)圖片、視頻和攝像頭畫(huà)面中的吸煙行為進(jìn)行識(shí)別,識(shí)別的結(jié)果可視化顯示在界面和圖像中,另外提供多個(gè)吸煙行為的顯示選擇功能,演示效果如下。
(一)用戶注冊(cè)登錄界面
????????這里設(shè)計(jì)了一個(gè)登錄界面,可以注冊(cè)賬號(hào)和密碼,然后進(jìn)行登錄。界面還是參考了當(dāng)前流行的UI設(shè)計(jì),左側(cè)是一個(gè)動(dòng)圖,右側(cè)輸入賬號(hào)、密碼、驗(yàn)證碼等等。

(二)選擇圖片識(shí)別
????????系統(tǒng)允許選擇圖片文件進(jìn)行識(shí)別,點(diǎn)擊圖片選擇按鈕圖標(biāo)選擇圖片后,顯示所有農(nóng)作物識(shí)別的結(jié)果,可通過(guò)下拉選框查看單個(gè)吸煙行為的結(jié)果。本功能的界面展示如下圖所示:

(三)視頻識(shí)別效果展示
????????很多時(shí)候我們需要識(shí)別一段視頻中的吸煙行為情況,這里設(shè)計(jì)了視頻選擇功能。點(diǎn)擊視頻按鈕可選擇待檢測(cè)的視頻,系統(tǒng)會(huì)自動(dòng)解析視頻逐幀識(shí)別吸煙行為,并將結(jié)果記錄在右下角表格中,效果如下圖所示:

(四)攝像頭檢測(cè)效果展示
????????在真實(shí)場(chǎng)景中,我們往往利用設(shè)備攝像頭獲取實(shí)時(shí)畫(huà)面,同時(shí)需要對(duì)畫(huà)面中的吸煙行為進(jìn)行識(shí)別,因此本文考慮到此項(xiàng)功能。如下圖所示,點(diǎn)擊攝像頭按鈕后系統(tǒng)進(jìn)入準(zhǔn)備狀態(tài),系統(tǒng)顯示實(shí)時(shí)畫(huà)面并開(kāi)始檢測(cè)畫(huà)面中的吸煙行為,識(shí)別結(jié)果展示如下圖:

2.?檢測(cè)方法與訓(xùn)練
(一)系統(tǒng)介紹
????????吸煙行為檢測(cè)軟件主要用于日常公共場(chǎng)合等限制吸煙的場(chǎng)所智能監(jiān)測(cè),基于YOLOv5算法檢測(cè)吸煙行為的標(biāo)記位置,保存和記錄檢測(cè)框坐標(biāo),以輔助公共場(chǎng)所吸煙安全警報(bào);軟件提供登錄注冊(cè)功能,可進(jìn)行用戶管理;軟件能夠有效通過(guò)圖片、視頻等文件形式,檢測(cè)定位吸煙行為并提示,記錄結(jié)果在界面表格中方便查看;可開(kāi)啟攝像頭實(shí)時(shí)定位吸煙行為,支持結(jié)果記錄、展示和保存。
(二)網(wǎng)絡(luò)結(jié)構(gòu)
???????? Yolov5網(wǎng)絡(luò)結(jié)構(gòu)是由Input、Backbone、Neck、Prediction組成。Yolov5的Input部分是網(wǎng)絡(luò)的輸入端,采用Mosaic數(shù)據(jù)增強(qiáng)方式,對(duì)輸入數(shù)據(jù)隨機(jī)裁剪,然后進(jìn)行拼接。Backbone是Yolov5提取特征的網(wǎng)絡(luò)部分,特征提取能力直接影響整個(gè)網(wǎng)絡(luò)性能。Yolov5的Backbone相比于之前Yolov4提出了新的Focus結(jié)構(gòu)。Focus結(jié)構(gòu)是將圖片進(jìn)行切片操作,將W(寬)、H(高)信息轉(zhuǎn)移到了通道空間中,使得在沒(méi)有丟失任何信息的情況下,進(jìn)行了2倍下采樣操作。


???????? Backbone可以被稱(chēng)作YoloV5的主干特征提取網(wǎng)絡(luò),根據(jù)它的結(jié)構(gòu)以及之前Yolo主干的叫法,我一般叫它CSPDarknet,輸入的圖片首先會(huì)在CSPDarknet里面進(jìn)行特征提取,提取到的特征可以被稱(chēng)作特征層,是輸入圖片的特征集合。在主干部分,我們獲取了三個(gè)特征層進(jìn)行下一步網(wǎng)絡(luò)的構(gòu)建,這三個(gè)特征層我稱(chēng)它為有效特征層。
????????FPN可以被稱(chēng)作YoloV5的加強(qiáng)特征提取網(wǎng)絡(luò),在主干部分獲得的三個(gè)有效特征層會(huì)在這一部分進(jìn)行特征融合,特征融合的目的是結(jié)合不同尺度的特征信息。在FPN部分,已經(jīng)獲得的有效特征層被用于繼續(xù)提取特征。在YoloV5里依然使用到了Panet的結(jié)構(gòu),我們不僅會(huì)對(duì)特征進(jìn)行上采樣實(shí)現(xiàn)特征融合,還會(huì)對(duì)特征再次進(jìn)行下采樣實(shí)現(xiàn)特征融合。
????????Yolo Head是YoloV5的分類(lèi)器與回歸器,通過(guò)CSPDarknet和FPN,我們已經(jīng)可以獲得三個(gè)加強(qiáng)過(guò)的有效特征層。每一個(gè)特征層都有寬、高和通道數(shù),此時(shí)我們可以將特征圖看作一個(gè)又一個(gè)特征點(diǎn)的集合,每一個(gè)特征點(diǎn)都有通道數(shù)個(gè)特征。Yolo Head實(shí)際上所做的工作就是對(duì)特征點(diǎn)進(jìn)行判斷,判斷特征點(diǎn)是否有物體與其對(duì)應(yīng)。與以前版本的Yolo一樣,YoloV5所用的解耦頭是一起的,也就是分類(lèi)和回歸在一個(gè)1X1卷積里實(shí)現(xiàn)。
(四)數(shù)據(jù)集及訓(xùn)練
????????吸煙行為檢測(cè)數(shù)據(jù)集的部分截圖如下所示,其中訓(xùn)練集4408張圖片,驗(yàn)證集358張圖片、測(cè)試集包括25張圖片,共計(jì)4791張圖片構(gòu)成。部分標(biāo)注情況如下圖所示。

????????每張圖像均提供了圖像類(lèi)標(biāo)記信息,圖像中吸煙行為的bounding box,吸煙行為的關(guān)鍵part信息,以及吸煙行為的屬性信息,數(shù)據(jù)集并解壓后得到如下的圖片

????????這里我們開(kāi)始訓(xùn)練和測(cè)試自己的數(shù)據(jù)集,在cmd終端中運(yùn)行train.py進(jìn)行訓(xùn)練,以下是訓(xùn)練過(guò)程中的結(jié)果截圖。

????????在深度學(xué)習(xí)中,我們通常通過(guò)損失函數(shù)下降的曲線來(lái)觀察模型訓(xùn)練的情況。而YOLOv5訓(xùn)練時(shí)主要包含三個(gè)方面的損失:矩形框損失(box_loss)、置信度損失(obj_loss)和分類(lèi)損失(cls_loss),在訓(xùn)練結(jié)束后,我們也可以在logs目錄下找到生成對(duì)若干訓(xùn)練過(guò)程統(tǒng)計(jì)圖。下圖為博主訓(xùn)練吸煙行為識(shí)別的模型訓(xùn)練曲線圖。

????????一般我們會(huì)接觸到兩個(gè)指標(biāo),分別是召回率recall和精度precision,兩個(gè)指標(biāo)p和r都是簡(jiǎn)單地從一個(gè)角度來(lái)判斷模型的好壞,均是介于0到1之間的數(shù)值,其中接近于1表示模型的性能越好,接近于0表示模型的性能越差,為了綜合評(píng)價(jià)目標(biāo)檢測(cè)的性能,一般采用均值平均密度map來(lái)進(jìn)一步評(píng)估模型的好壞。我們通過(guò)設(shè)定不同的置信度的閾值,可以得到在模型在不同的閾值下所計(jì)算出的p值和r值,一般情況下,p值和r值是負(fù)相關(guān)的,繪制出來(lái)可以得到如下圖所示的曲線,其中曲線的面積我們稱(chēng)AP,目標(biāo)檢測(cè)模型中每種目標(biāo)可計(jì)算出一個(gè)AP值,對(duì)所有的AP值求平均則可以得到模型的mAP值。

????????以PR-curve為例,可以看到我們的模型在驗(yàn)證集上的均值平均準(zhǔn)確率為0.898。
3.?吸煙行為檢測(cè)識(shí)別
????????在訓(xùn)練完成后得到最佳模型,接下來(lái)我們將幀圖像輸入到這個(gè)網(wǎng)絡(luò)進(jìn)行預(yù)測(cè),從而得到預(yù)測(cè)結(jié)果,預(yù)測(cè)方法(predict.py)部分的代碼如下所示:
????????得到預(yù)測(cè)結(jié)果我們便可以將幀圖像中的吸煙行為框出,然后在圖片上用opencv繪圖操作,輸出吸煙行為以及吸煙行為的預(yù)測(cè)分?jǐn)?shù)。以下是讀取一個(gè)吸煙行為圖片并進(jìn)行檢測(cè)的腳本,首先將圖片數(shù)據(jù)進(jìn)行預(yù)處理后送predict進(jìn)行檢測(cè),然后計(jì)算標(biāo)記框的位置并在每一幀中標(biāo)注出來(lái)。
????????執(zhí)行得到的結(jié)果如下圖所示,圖中吸煙行為的種類(lèi)和置信度值都標(biāo)注出來(lái)了,預(yù)測(cè)速度較快?;诖四P臀覀兛梢詫⑵湓O(shè)計(jì)成一個(gè)帶有界面的系統(tǒng),在界面上選擇圖片、視頻或攝像頭然后調(diào)用模型進(jìn)行檢測(cè)。

????????博主對(duì)整個(gè)系統(tǒng)進(jìn)行了詳細(xì)測(cè)試,最終開(kāi)發(fā)出一版流暢得到清新界面,就是博文演示部分的展示,完整的UI界面、測(cè)試圖片視頻、代碼文件,以及Python離線依賴(lài)包(方便安裝運(yùn)行,也可自行配置環(huán)境),均已打包上傳,感興趣的朋友可以通過(guò)下載鏈接獲取。

下載鏈接
????若您想獲得博文中涉及的實(shí)現(xiàn)完整全部程序文件(包括測(cè)試圖片、視頻,py, UI文件等,如下圖),這里已打包上傳至博主的面包多平臺(tái),見(jiàn)可參考博客與視頻,已將所有涉及的文件同時(shí)打包到里面,點(diǎn)擊即可運(yùn)行,完整文件截圖如下:

????在文件夾下的資源顯示如下,下面的鏈接中也給出了Python的離線依賴(lài)包,讀者可在正確安裝Anaconda和Pycharm軟件后,復(fù)制離線依賴(lài)包至項(xiàng)目目錄下進(jìn)行安裝,離線依賴(lài)的使用詳細(xì)演示也可見(jiàn)本人B站視頻:win11從頭安裝軟件和配置環(huán)境運(yùn)行深度學(xué)習(xí)項(xiàng)目、Win10中使用pycharm和anaconda進(jìn)行python環(huán)境配置教程。

注意:該代碼采用Pycharm+Python3.8開(kāi)發(fā),經(jīng)過(guò)測(cè)試能成功運(yùn)行,運(yùn)行界面的主程序?yàn)閞unMain.py和LoginUI.py,測(cè)試圖片腳本可運(yùn)行testPicture.py,測(cè)試視頻腳本可運(yùn)行testVideo.py。為確保程序順利運(yùn)行,請(qǐng)按照requirements.txt配置Python依賴(lài)包的版本。Python版本:3.8,請(qǐng)勿使用其他版本,詳見(jiàn)requirements.txt文件;
完整資源中包含數(shù)據(jù)集及訓(xùn)練代碼,環(huán)境配置與界面中文字、圖片、logo等的修改方法請(qǐng)見(jiàn)視頻,項(xiàng)目完整文件下載請(qǐng)見(jiàn)參考博客文章里面,或參考視頻的簡(jiǎn)介處給出:???
完整代碼下載:https://mbd.pub/o/bread/ZJaXlplv
參考視頻演示:https://www.bilibili.com/video/BV1u24y1t7Vi/
離線依賴(lài)庫(kù)下載:https://pan.baidu.com/s/1hW9z9ofV1FRSezTSj59JSg?pwd=oy4n?(提取碼:oy4n )

界面中文字、圖標(biāo)和背景圖修改方法:
????????在Qt Designer中可以徹底修改界面的各個(gè)控件及設(shè)置,然后將ui文件轉(zhuǎn)換為py文件即可調(diào)用和顯示界面。如果只需要修改界面中的文字、圖標(biāo)和背景圖的,可以直接在ConfigUI.config文件中修改,步驟如下:
????????(1)打開(kāi)UI_rec/tools/ConfigUI.config文件,若亂碼請(qǐng)選擇GBK編碼打開(kāi)。
????????(2)如需修改界面文字,只要選中要改的字符替換成自己的就好。
????????(3)如需修改背景、圖標(biāo)等,只需修改圖片的路徑。例如,原文件中的背景圖設(shè)置如下:
????????可修改為自己的名為background2.png圖片(位置在UI_rec/icons/文件夾中),可將該項(xiàng)設(shè)置如下即可修改背景圖:
結(jié)束語(yǔ)
????????由于博主能力有限,博文中提及的方法即使經(jīng)過(guò)試驗(yàn),也難免會(huì)有疏漏之處。希望您能熱心指出其中的錯(cuò)誤,以便下次修改時(shí)能以一個(gè)更完美更嚴(yán)謹(jǐn)?shù)臉幼?,呈現(xiàn)在大家面前。同時(shí)如果有更好的實(shí)現(xiàn)方法也請(qǐng)您不吝賜教。