散文網(wǎng) » 生活 »日常 » 【圖像識別】基于卷積神經(jīng)網(wǎng)絡CNN實現(xiàn)車牌識別matlab源碼

【圖像識別】基于卷積神經(jīng)網(wǎng)絡CNN實現(xiàn)車牌識別matlab源碼

2021-08-18 08:46 作者:Matlab工程師 0人讀過 | 我要投稿

?過去幾年，深度學習（Deep learning）在解決諸如視覺識別(visual recognition)、語音識別(speech recognition)和自然語言處理(natural language processing)等很多問題方面都表現(xiàn)出非常好的性能。在不同類型的深度神經(jīng)網(wǎng)絡當中，卷積神經(jīng)網(wǎng)絡是得到最深入研究的。早期由于缺乏訓練數(shù)據(jù)和計算能力，要在不產(chǎn)生過擬合(overfitting)的情況下訓練高性能卷積神經(jīng)網(wǎng)絡是很困難的。標記數(shù)據(jù)和近來GPU的發(fā)展，使得卷積神經(jīng)網(wǎng)絡研究涌現(xiàn)并取得一流結(jié)果。本文中，我們將縱覽卷積神經(jīng)網(wǎng)絡近來發(fā)展，同時介紹卷積神經(jīng)網(wǎng)絡在視覺識別方面的一些應用。

CNN快速發(fā)展，得益于LeNet-5、Alexnet、ZFNet、VGGNet、GoogleNet、ResNet等不同結(jié)構(gòu)的設計出現(xiàn)。

1.CNN的基本結(jié)構(gòu)

卷積神經(jīng)網(wǎng)絡的結(jié)構(gòu)有很多種，但是其基本架構(gòu)是相似的，拿LeNet-5為例來介紹，如下圖，它包含三個主要的層——卷積層（ convolutional layer）、池化層（ pooling layer）、全連接層（ fully-connected layer）

???圖中的卷積網(wǎng)絡工作流程如下，輸入層由32×32個感知節(jié)點組成，接收原始圖像。然后，計算流程在卷積和子抽樣之間交替進行，如下所述：

? ? 第一隱藏層進行卷積，它由6個特征映射組成，每個特征映射由28×28個神經(jīng)元組成，每個神經(jīng)元指定一個?5×5?的接受域；

? ? 第二隱藏層實現(xiàn)子抽樣和局部平均，它同樣由?6?個特征映射組成，但其每個特征映射由14×14?個神經(jīng)元組成。每個神經(jīng)元具有一個?2×2?的接受域，一個可訓練系數(shù)，一個可訓練偏置和一個?sigmoid?激活函數(shù)。可訓練系數(shù)和偏置控制神經(jīng)元的操作點。

? ? 第三隱藏層進行第二次卷積，它由?16個特征映射組?成，每個特征映射由?10×10?個神經(jīng)元組成。該隱藏層中的每個神經(jīng)元可能具有和下一個隱藏層幾個特征映射相連的突觸連接，它以與第一個卷積?層相似的方式操作。

? ? 第四個隱藏層進行第二次子抽樣和局部平均計算。它由?16?個特征映射組成，但每個特征映射由?5×5?個神經(jīng)元組成，它以?與第一次抽樣相似的方式操作。

? ? 第五個隱藏層實現(xiàn)卷積的最后階段，它由?120?個神經(jīng)元組成，每個神經(jīng)元指定一個?5×5?的接受域。

? ? 最后是個全連接層，得到輸出向量。

? ? 相繼的計算層在卷積和抽樣之間的連續(xù)交替，我們得到一個“雙尖塔”的效果，也就是在每個卷積或抽樣層，隨著空?間分辨率下降，與相應的前一層相比特征映射的數(shù)量增加。卷積之后進行子抽樣的思想是受到動物視覺系統(tǒng)中的“簡單的”細胞后面跟著“復雜的”細胞的想法的啟發(fā)而產(chǎn)生的。

其中，卷積層，用來學習輸入數(shù)據(jù)的特征表征。卷積層由很多的卷積核（convolutional kernel）組成，卷積核用來計算不同的feature map；

激勵函數(shù)（activation function）給CNN卷積神經(jīng)網(wǎng)絡引入了非線性，常用的有sigmoid 、tanh、 ReLU函數(shù)；

池化層降低卷積層輸出的特征向量，同時改善結(jié)果（使結(jié)構(gòu)不容易出現(xiàn)過擬合），典型應用有average pooling 和 max pooling；

全連接層將卷積層和Pooling 層堆疊起來以后，就能夠形成一層或多層全連接層，這樣就能夠?qū)崿F(xiàn)高階的推力能力

2.CNN卷積神經(jīng)網(wǎng)絡的改進策略

? 自從2012年AlexNet 取得成功以后，科研工作者提出了很多改進CNN的方法，基本都是從以下六個方面入手：convolutional layer、pooling layer、activation function、loss function、regularization 、optimization

2.1convolutional layer

1). Network in network

It replaces the linear filter of the convolutional layer by a micro network

2). Inception module : 是繼承了NIN的擴展. 使用不同size的filter來捕獲不同size的visual patterns.

2.2 pooling layer

池化層是CNN的重要組成部分，它通過減少卷積層之間的連接數(shù)量來降低計算的復雜度。

1).Lp pooling：Lp 池化是建立在復雜細胞運行機制的基礎(chǔ)上，受生物啟發(fā)而來

2). Mixed pooling：combination of max pooling and average pooling

3).Stochastic pooling：Stochastic pooling 是受 droptout 啟發(fā)而來的方法

4).Spectral pooling

5). Spatial pyramid pooling

空間金字塔池化可以把任何尺度的圖像的卷積特征轉(zhuǎn)化成相同維度，這不僅可以讓CNN處理任意尺度的圖像，還能避免 cropping和warping操作，導致一些信息的丟失，具有非常重要的意義。

一般的CNN都需要輸入圖像的大小是固定的，這是因為全連接層的輸入需要固定輸入維度，但在卷積操作是沒有對圖像尺度有限制，所有作者提出了空間金字塔池化，先讓圖像進行卷積操作，然后轉(zhuǎn)化成維度的特征輸入到全連接層，這個可以把CNN擴展到任意大小的圖像。

2.3activation function

一個合適的激勵函數(shù)可以有效地提高CNN的運算性能。常用的非線性激活函數(shù)有sigmoid、tanh、relu等等，前兩者sigmoid/tanh比較常見于全鏈接層，后者relu常見于卷積層。

sigmoid函數(shù)圖像曾在神經(jīng)網(wǎng)絡和深度學習（一）中介紹過，這里再介紹ReLU、LReLU、PReLU、RReLU、ELU幾種激勵函數(shù)的特性曲線

2.4 Loss function

1). Softmax loss :

2). Hinge loss : to train large margin classifiers such as SVM

3). Contrastive loss : to train Siamese network

2.5 Regularization 正則化

通過正則化可以有效的減小CNN的過擬合問題。這里介紹兩種正則化技術(shù)——Dropout 、 DropConnect

Dropout是指在模型訓練時隨機讓網(wǎng)絡某些隱含層節(jié)點的權(quán)重不工作，不工作的那些節(jié)點可以暫時認為不是網(wǎng)絡結(jié)構(gòu)的一部分，但是它的權(quán)重得保留下來(只是暫時不更新而已) ；而DropConnect 是DropOut的進一步發(fā)展，不再和DropOut一樣隨意設置輸出神經(jīng)元的值為0，而是隨機設置權(quán)重矩陣W 為0。

2.6 Optimization

這里介紹幾種優(yōu)化CNN的關(guān)鍵技術(shù)：

1). Weights initialization

2). Stochastic gradient descent

3). Batch Normalization

4). Shortcut connections

3. 加速CNN計算速度

3.1 FFT : 使用快速傅里葉變換，可以重復利用一些單元，比如輸出梯度的傅里葉變換

3.2 Matrix Factorization : 矩陣因子分解，可以減小計算量，來加速CNN 的訓練

3.3 Vector quantization : 矢量量化（VQ）是用來壓縮密集的連接層，使得CNN模型變得更小

4. CNN 的主要應用

使用CNN,可以使得以下幾個應用達到最佳的（state-of-the-art）性能:

1). Image Classification

2). Object Tracking

3). Pose Estimation

4). Text Detection

5). Visual Saliency detection

6). Action Recognition

7). Scene Labeling

function varargout = System_Main(varargin) gui_Singleton = 1; gui_State = struct('gui_Name', ? ? ? mfilename, ... ? ? ? ? ? ? ? ? ? 'gui_Singleton', ?gui_Singleton, ... ? ? ? ? ? ? ? ? ? 'gui_OpeningFcn', @System_Main_OpeningFcn, ... ? ? ? ? ? ? ? ? ? 'gui_OutputFcn', ?@System_Main_OutputFcn, ... ? ? ? ? ? ? ? ? ? ?'gui_LayoutFcn', ?[] , ... ? ? ? ? ? ? ? ? ? 'gui_Callback', ? []); if nargin && ischar(varargin{1}) ? ?gui_State.gui_Callback = str2func(varargin{1}); end if nargout ? ?[varargout{1:nargout}] = gui_mainfcn(gui_State, varargin{:}); else ? ?gui_mainfcn(gui_State, varargin{:}); ? ? end function System_Main_OpeningFcn(hObject, eventdata, handles, varargin) handles.output = hObject; guidata(hObject, handles); movegui(hObject,'center'); function varargout = System_Main_OutputFcn(hObject, eventdata, handles) varargout{1} = handles.output; %打開圖片菜單 function OpenPicture_Callback(hObject, eventdata, handles) [pathname filename]=uigetfile('.jpg','選擇圖片'); chepailujing=[pathname filename]; handles.chepailujing=chepailujing; fpath=[filename pathname]; axes(handles.axes1); im = imread(fpath); %im=imresize(im,[240,320]) imshow(im); title('原圖像', 'FontWeight', 'Bold'); handles.IM=im; guidata(hObject, handles); fpath; %保存圖片菜單 function SavePicture_Callback(hObject, eventdata, handles) % --- 車牌定位實現(xiàn)按鈕 function CarDiwei_Callback(hObject, eventdata, handles) [PY2,PY1,PX2,PX1]=caitu_fenge(handles.IM);%分割方法 axes(handles.axes1); hold on; row = [PY1 PY2]; col = [PX1 PX2]; plot([col(1) col(2)], [row(1) row(1)], 'g-', 'LineWidth', 3); plot([col(1) col(2)], [row(2) row(2)], 'g-', 'LineWidth', 3); plot([col(1) col(1)], [row(1) row(2)], 'g-', 'LineWidth', 3); plot([col(2) col(2)], [row(1) row(2)], 'g-', 'LineWidth', 3); hold off; I_bai=handles.IM; [PY2,PY1,PX2,PX1,threshold]=SEC_xiuzheng(PY2,PY1,PX2,PX1);%選著車牌位置 handles.threshold=threshold; Plate=I_bai(PY1:PY2,PX1:PX2,:); bw=Plate; handles.bw=bw; guidata(hObject,handles); axes(handles.axes2); imshow(bw); title('車牌圖像'); % --- Executes on button press in CarXuanzhuan. function CarXuanzhuan_Callback(hObject, eventdata, handles) bw=rgb2gray(handles.bw); qingxiejiao=rando_bianhuan(bw); handles.qingxiejiao=qingxiejiao; bw=imrotate(bw,qingxiejiao,'bilinear','crop'); axes(handles.axes3); imshow(bw); title('車牌調(diào)整角度圖像'); bw=im2bw(bw,graythresh(bw));%figure,imshow(bw); bw=bwmorph(bw,'hbreak',inf);%figure,imshow(bw); bw=bwmorph(bw,'spur',inf);%figure,imshow(bw);title('擦除之前'); bw=bwmorph(bw,'open',5);%figure,imshow(bw);title('閉合運算'); handles.bw=bw; guidata(hObject,handles); % --- Executes on button press in EditBlue. function EditBlue_Callback(hObject, eventdata, handles) bw = bwareaopen(handles.bw, handles.threshold); bw=~bw; bw=touying(bw);%Y方向處理 bw=~bw;%擦除反色 bw = bwareaopen(bw, handles.threshold); bw=~bw;%二次擦除 handles.bw=bw; guidata(hObject,handles); axes(handles.axes4); imshow(bw); title('擦除多余藍色'); % --- Executes on button press in EditCar. function EditCar_Callback(hObject, eventdata, handles) bw=handles.bw; [y,x]=size(bw);%對長寬重新賦值 %=================文字分割================================= fenge=shuzifenge(bw,handles.qingxiejiao) [m,k]=size(fenge); %=================顯示分割圖像結(jié)果========================= figure; for s=1:2:k-1 ? ?subplot(1,k/2,(s+1)/2);imshow(bw( 1:y,fenge(s):fenge(s+1))); end function CarShibie_Callback(hObject, eventdata, handles) bw=handles.bw; [y,x]=size(bw); fenge=shuzifenge(bw,handles.qingxiejiao) [m,k]=size(fenge); %================ 給七張圖片定位===============桂AV6388 han_zi ?=bw( 1:y,fenge(1):fenge(2)); zi_mu ? =bw( 1:y,fenge(3):fenge(4)); zm_sz_1 =bw( 1:y,fenge(5):fenge(6)); zm_sz_2 =bw( 1:y,fenge(7):fenge(8)); ? shuzi_1 =bw( 1:y,fenge(9):fenge(10)); shuzi_2 =bw( 1:y,fenge(11):fenge(12)); shuzi_3 =bw( 1:y,fenge(13):fenge(14)); %==========================識別==================================== %======================把修正數(shù)據(jù)讀入============================== xiuzhenghanzi = ? imresize(han_zi, [110 55],'bilinear'); xiuzhengzimu ?= ? imresize(zi_mu, ?[110 55],'bilinear'); xiuzhengzm_sz_1= ?imresize(zm_sz_1,[110 55],'bilinear'); xiuzhengzm_sz_2 = imresize(zm_sz_2,[110 55],'bilinear'); xiuzhengshuzi_1 = imresize(shuzi_1,[110 55],'bilinear'); xiuzhengshuzi_2 = imresize(shuzi_2,[110 55],'bilinear'); xiuzhengshuzi_3 = imresize(shuzi_3,[110 55],'bilinear'); %============ 把0-9 , A-Z以及省份簡稱的數(shù)據(jù)存儲方便訪問==================== hanzishengfen=duquhanzi(imread('picture/cpgui.bmp'),imread('picture/cpguizhou.bmp'),imread('picture/cpjing.bmp'),imread('picture/cpsu.bmp'),imread('picture/cpyue.bmp')); %因數(shù)字和字母比例不同。這里要修改 shuzizimu=duquszzm(imread('picture/0.bmp'),imread('picture/1.bmp'),imread('picture/2.bmp'),imread('picture/3.bmp'),imread('picture/4.bmp'),... ? ? ? ? ? ? ? ? ? imread('picture/5.bmp'),imread('picture/6.bmp'),imread('picture/7.bmp'),imread('picture/8.bmp'),imread('picture/9.bmp'),... ? ? ? ? ? ? ? ? ? imread('picture/10.bmp'),imread('picture/11.bmp'),imread('picture/12.bmp'),imread('picture/13.bmp'),imread('picture/14.bmp'),... ? ? ? ? ? ? ? ? ? imread('picture/15.bmp'),imread('picture/16.bmp'),imread('picture/17.bmp'),imread('picture/18.bmp'),imread('picture/19.bmp'),... ? ? ? ? ? ? ? ? ? imread('picture/20.bmp'),imread('picture/21.bmp'),imread('picture/22.bmp'),imread('picture/23.bmp'),imread('picture/24.bmp'),... ? ? ? ? ? ? ? ? ? imread('picture/25.bmp'),imread('picture/26.bmp'),imread('picture/27.bmp'),imread('picture/28.bmp'),imread('picture/29.bmp'),... ? ? ? ? ? ? ? ? ? imread('picture/30.bmp'),imread('picture/31.bmp'),imread('picture/32.bmp'),imread('picture/33.bmp')); zimu ?= duquzimu(imread('picture/10.bmp'),imread('picture/11.bmp'),imread('picture/12.bmp'),imread('picture/13.bmp'),imread('picture/14.bmp'),... ? ? ? ? ? ? ? ? imread('picture/15.bmp'),imread('picture/16.bmp'),imread('picture/17.bmp'),imread('picture/18.bmp'),imread('picture/19.bmp'),... ? ? ? ? ? ? ? ? imread('picture/20.bmp'),imread('picture/21.bmp'),imread('picture/22.bmp'),imread('picture/23.bmp'),imread('picture/24.bmp'),... ? ? ? ? ? ? ? ? imread('picture/25.bmp'),imread('picture/26.bmp'),imread('picture/27.bmp'),imread('picture/28.bmp'),imread('picture/29.bmp'),... ? ? ? ? ? ? ? ? imread('picture/30.bmp'),imread('picture/31.bmp'),imread('picture/32.bmp'),imread('picture/33.bmp')); shuzi = duqushuzi(imread('picture/0.bmp'),imread('picture/1.bmp'),imread('picture/2.bmp'),imread('picture/3.bmp'),imread('picture/4.bmp'),... ? ? ? ? ? ? ? ? imread('picture/5.bmp'),imread('picture/6.bmp'),imread('picture/7.bmp'),imread('picture/8.bmp'),imread('picture/9.bmp')); %============================識別結(jié)果================================ ? i=1;%shibiezm_sz該函數(shù)識別數(shù)字有問題 jieguohanzi ?= shibiehanzi(hanzishengfen,xiuzhenghanzi);shibiejieguo(1,i) =jieguohanzi; ?i=i+1; jieguozimu ? = shibiezimu(zimu,xiuzhengzimu); ? ? ? ? ? shibiejieguo(1,i) =jieguozimu; ? i=i+1; jieguozm_sz_1= shibiezm_sz(shuzizimu,xiuzhengzm_sz_1); ?shibiejieguo(1,i) =jieguozm_sz_1;i=i+1; jieguozm_sz_2= shibiezm_sz(shuzizimu,xiuzhengzm_sz_2); ?shibiejieguo(1,i) =jieguozm_sz_2;i=i+1; jieguoshuzi_1= shibieshuzi(shuzi,xiuzhengshuzi_1); ? ? ?shibiejieguo(1,i) =jieguoshuzi_1;i=i+1; jieguoshuzi_2= shibieshuzi(shuzi,xiuzhengshuzi_2); ? ? ?shibiejieguo(1,i) =jieguoshuzi_2;i=i+1; jieguoshuzi_3= shibieshuzi(shuzi,xiuzhengshuzi_3); ? ? ?shibiejieguo(1,i) =jieguoshuzi_3;i=i+1; %==========================對話框顯示顯示============================================= set(handles.Result,'String', shibiejieguo); handles.shibiejieguo=shibiejieguo; guidata(hObject,handles); % --- Executes on button press in CarVoide. function CarVoide_Callback(hObject, eventdata, handles) duchushengyin(handles.shibiejieguo); % --- Executes on button press in CNNbut. function CNNbut_Callback(hObject, eventdata, handles)

標簽：