散文網(wǎng) » 科技 »學(xué)習(xí) » 基于深度神經(jīng)網(wǎng)絡(luò)的圖像分類與訓(xùn)練系統(tǒng)（MATLAB GUI版，代碼+圖文詳解）

基于深度神經(jīng)網(wǎng)絡(luò)的圖像分類與訓(xùn)練系統(tǒng)（MATLAB GUI版，代碼+圖文詳解）

2023-05-04 16:30 作者:思緒亦無限 0人讀過 | 我要投稿

摘要：本博客詳細(xì)介紹了基于深度神經(jīng)網(wǎng)絡(luò)的圖像分類與訓(xùn)練系統(tǒng)的MATLAB實(shí)現(xiàn)，包括GUI界面和數(shù)據(jù)集，可選擇模型進(jìn)行圖片分類，支持一鍵訓(xùn)練神經(jīng)網(wǎng)絡(luò)。首先介紹了基于GoogleNet、ResNet進(jìn)行圖像分類的背景、意義，系統(tǒng)研究現(xiàn)狀及相關(guān)算法。然后展示了系統(tǒng)的界面演示效果，包括選擇圖片分類、選擇文件夾批量識(shí)別、更換不同網(wǎng)絡(luò)模型和通過界面選擇數(shù)據(jù)集一鍵訓(xùn)練模型等功能。強(qiáng)調(diào)了GUI界面的設(shè)計(jì)和實(shí)現(xiàn)，使得用戶可以直觀、方便地完成圖像分類和模型訓(xùn)練任務(wù)。接著，詳細(xì)介紹了神經(jīng)網(wǎng)絡(luò)訓(xùn)練的過程，包括訓(xùn)練代碼、訓(xùn)練曲線和模型評(píng)估結(jié)果。在第四節(jié)中，我們講述了系統(tǒng)實(shí)現(xiàn)的兩個(gè)部分：預(yù)測部分和訓(xùn)練部分，結(jié)合GUI界面給出了設(shè)計(jì)框架和實(shí)現(xiàn)。最后，對(duì)整個(gè)博客的內(nèi)容進(jìn)行了總結(jié)，并提出了一些潛在的改進(jìn)方向和挑戰(zhàn)，以期推動(dòng)圖像分類技術(shù)的發(fā)展和進(jìn)步。

完整代碼下載：https://mbd.pub/o/bread/ZJiYmZlq

參考視頻演示：https://www.bilibili.com/video/BV1Fh4y1J7BD/

1. 引言

撰寫這篇博客的初衷是分享YOLOv5目標(biāo)檢測算法的實(shí)現(xiàn)與應(yīng)用，為大家提供實(shí)踐指南。感謝粉絲們的支持。我們鼓勵(lì)讀者深入理解背后原理，發(fā)揮創(chuàng)造力，進(jìn)行探索與嘗試，而不是簡單地套用現(xiàn)成的解決方案。期待在未來的技術(shù)交流中，共同進(jìn)步與成長。本博客內(nèi)容為博主原創(chuàng)，相關(guān)引用和參考文獻(xiàn)我已在文中標(biāo)注，考慮到可能會(huì)有相關(guān)研究人員蒞臨指導(dǎo)，博主的博客這里盡可能以學(xué)術(shù)期刊的格式撰寫，如需參考可引用本博客格式如下：

[1] 思緒無限. 基于深度神經(jīng)網(wǎng)絡(luò)的圖像分類與訓(xùn)練系統(tǒng)（MATLAB GUI版，代碼+圖文詳解）[J/OL]. ZhiHu, 2023.05.?https://zhuanlan.zhihu.com/p/626515642.html.

[2] Suxu Wu. (2023, May). Image classification and training system based on deep neural networks (MATLAB GUI version, with code and detailed explanation) [J/OL]. ZhiHu.?https://zhuanlan.zhihu.com/p/626515642.html.

圖像分類作為計(jì)算機(jī)視覺領(lǐng)域的一個(gè)重要問題，隨著深度學(xué)習(xí)技術(shù)的快速發(fā)展，已經(jīng)取得了顯著的進(jìn)展。卷積神經(jīng)網(wǎng)絡(luò)（CNN）模型被廣泛應(yīng)用于圖像分類任務(wù)中，如GoogleNet（Szegedy et al., 2015）和ResNet（He et al., 2016）。GoogleNet的主要貢獻(xiàn)是提出了Inception模塊，通過多尺度卷積操作來增加網(wǎng)絡(luò)的寬度（Szegedy et al., 2015）。ResNet則采用了殘差連接，通過跨層連接的方式解決了深度網(wǎng)絡(luò)的梯度消失問題，從而使網(wǎng)絡(luò)可以加深（He et al., 2016）。這些卷積神經(jīng)網(wǎng)絡(luò)在多個(gè)知名數(shù)據(jù)集上取得了顯著成果，如ImageNet（Deng et al., 2009）和CIFAR-10（Krizhevsky, 2009）。ImageNet是一個(gè)大規(guī)模視覺識(shí)別數(shù)據(jù)集，包含超過1400萬張圖片，涵蓋了2萬多個(gè)類別（Deng et al., 2009）。CIFAR-10則是一個(gè)小規(guī)模數(shù)據(jù)集，包含60000張32x32像素的彩色圖片，分為10個(gè)類別（Krizhevsky, 2009）。

除了GoogleNet和ResNet，還有其他卷積神經(jīng)網(wǎng)絡(luò)模型在圖像分類任務(wù)中取得了較好的成績。例如，VGGNet（Simonyan and Zisserman, 2014）通過使用更小的卷積核（3x3）和更深的網(wǎng)絡(luò)結(jié)構(gòu)提高了分類性能。DenseNet（Huang et al., 2017）則引入了密集連接，將每一層的特征圖與后續(xù)所有層進(jìn)行連接，提高了信息流動(dòng)性。為了更好地理解卷積神經(jīng)網(wǎng)絡(luò)的內(nèi)部特征，Zeiler和Fergus（2014）提出了一種反卷積網(wǎng)絡(luò)（DeconvNet），用于可視化各層的特征圖。此外，為了防止過擬合，Hinton等人（2012）提出了Dropout方法；為了加速訓(xùn)練過程，Ioffe和Szegedy（2015）提出了Batch Normalization技術(shù)。

本博客的目的是介紹一種基于深度神經(jīng)網(wǎng)絡(luò)的圖像分類與訓(xùn)練系統(tǒng)，該系統(tǒng)使用MATLAB實(shí)現(xiàn)，并提供友好的圖形用戶界面，方便用戶在不同的網(wǎng)絡(luò)模型和數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn)。本博客的貢獻(xiàn)點(diǎn)如下：

提供一個(gè)基于MATLAB的圖像分類與訓(xùn)練系統(tǒng)，支持多種卷積神經(jīng)網(wǎng)絡(luò)模型，如GoogleNet和ResNet。
系統(tǒng)提供友好的圖形用戶界面，支持選擇圖片分類、選擇文件夾批量識(shí)別、更換不同網(wǎng)絡(luò)模型等功能。
系統(tǒng)可以通過界面選擇數(shù)據(jù)集進(jìn)行訓(xùn)練，并給出訓(xùn)練曲線和模型評(píng)估結(jié)果。

2. 系統(tǒng)界面演示效果

在本節(jié)中，我們將介紹系統(tǒng)的圖形用戶界面（GUI）及其功能。該界面允許用戶執(zhí)行以下操作：

（1）選擇圖片分類：用戶可以選擇一張圖片，系統(tǒng)將根據(jù)預(yù)訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò)模型對(duì)其進(jìn)行分類，并顯示預(yù)測結(jié)果。

（2）選擇文件夾批量識(shí)別：用戶可以選擇一個(gè)文件夾，系統(tǒng)將對(duì)文件夾中的所有圖片進(jìn)行分類，并在預(yù)測完成后生成一個(gè)包含結(jié)果的列表和可視化展示。

（3）更換不同網(wǎng)絡(luò)模型：用戶可以在GoogleNet和ResNet等預(yù)訓(xùn)練模型之間進(jìn)行切換，以便在不同模型上進(jìn)行實(shí)驗(yàn)。

通過界面選擇數(shù)據(jù)集訓(xùn)練一鍵訓(xùn)練模型：用戶可以選擇一個(gè)自定義的數(shù)據(jù)集文件夾，系統(tǒng)將自動(dòng)訓(xùn)練一個(gè)新的卷積神經(jīng)網(wǎng)絡(luò)模型，并顯示訓(xùn)練過程中的損失和準(zhǔn)確率曲線。

3. 神經(jīng)網(wǎng)絡(luò)訓(xùn)練

在這一節(jié)詳細(xì)闡述如何使用MATLAB實(shí)現(xiàn)基于ResNet-50的圖像分類模型的訓(xùn)練過程。這里詳細(xì)解釋每個(gè)代碼段的作用，以便于讀者更好地理解模型的訓(xùn)練過程。

首先進(jìn)行一些準(zhǔn)備工作，包括清空MATLAB的環(huán)境變量、設(shè)置隨機(jī)數(shù)生成器的種子以保證結(jié)果的可重復(fù)性、獲取當(dāng)前腳本所在的目錄并將工作目錄切換到該目錄。這些操作有助于確保代碼可以在不同的計(jì)算機(jī)上順利運(yùn)行。

接下來，我們需要加載數(shù)據(jù)集，首先指定圖像數(shù)據(jù)所在的目錄。然后，使用checkDataset函數(shù)對(duì)數(shù)據(jù)集進(jìn)行檢查，以確保數(shù)據(jù)集中不存在灰度圖像或二值圖像。如果發(fā)現(xiàn)這些圖像，就將它們從數(shù)據(jù)集中刪除。使用每個(gè)子文件夾的名稱作為圖像的標(biāo)簽，以便于后續(xù)的訓(xùn)練和分類任務(wù)。

數(shù)據(jù)集加載完成后，我們需要將其劃分為訓(xùn)練集、驗(yàn)證集和測試集。這里采用隨機(jī)劃分的方法，將60%的數(shù)據(jù)作為訓(xùn)練集，20%的數(shù)據(jù)作為驗(yàn)證集，剩下的20%作為測試集。通過這種方式，可以確保模型在不同類型的數(shù)據(jù)上都能得到充分的訓(xùn)練和有效的評(píng)估。

為了直觀展示訓(xùn)練數(shù)據(jù)，我們隨機(jī)選擇16個(gè)訓(xùn)練樣本并將它們顯示在一個(gè)圖像中。這有助于了解數(shù)據(jù)集的大致情況和圖像樣本的特點(diǎn)。

然后，我們需要加載一個(gè)預(yù)訓(xùn)練的ResNet-50模型。ResNet-50是一個(gè)具有50層的深度卷積神經(jīng)網(wǎng)絡(luò)，已在大型數(shù)據(jù)集上進(jìn)行了預(yù)訓(xùn)練。通過使用預(yù)訓(xùn)練的模型，可以利用在其他數(shù)據(jù)集上學(xué)到的特征來加速訓(xùn)練過程并提高模型性能。

加載預(yù)訓(xùn)練模型后，需要對(duì)其進(jìn)行一些修改以適應(yīng)分類任務(wù)。首先，需要替換模型中的全連接層，以適應(yīng)數(shù)據(jù)集中的類別數(shù)量。接下來，需要替換模型中的分類層，使其與我們的任務(wù)相對(duì)應(yīng)。這里采用新的全連接層和分類層來實(shí)現(xiàn)這一目的。

執(zhí)行以上代碼輸出網(wǎng)絡(luò)層情況如下：

為了提高模型的泛化能力，我們?cè)谟?xùn)練過程中使用數(shù)據(jù)增強(qiáng)技術(shù)。數(shù)據(jù)增強(qiáng)可以通過對(duì)訓(xùn)練圖像進(jìn)行隨機(jī)變換（例如翻轉(zhuǎn)、平移等）來生成更多的訓(xùn)練樣本。這有助于模型在面對(duì)不同視角、尺度和形態(tài)的圖像時(shí)具有更好的泛化能力。在本例中，采用隨機(jī)水平翻轉(zhuǎn)以及隨機(jī)平移的方法進(jìn)行數(shù)據(jù)增強(qiáng)。此外，還需要處理灰度圖像。由于預(yù)訓(xùn)練的ResNet-50模型期望輸入為彩色圖像，需要將灰度圖像轉(zhuǎn)換為偽彩色圖像，使其可以被模型正確處理。

在完成數(shù)據(jù)預(yù)處理和模型修改后，需要設(shè)置訓(xùn)練選項(xiàng)。這里，選擇隨機(jī)梯度下降法（SGDM）作為優(yōu)化器，并設(shè)置批大小為32、最大迭代次數(shù)為2、初始學(xué)習(xí)率為1e-4。此外，還設(shè)置了每輪打亂訓(xùn)練數(shù)據(jù)的順序、指定驗(yàn)證集以及驗(yàn)證頻率等參數(shù)。最后，選擇實(shí)時(shí)繪制訓(xùn)練進(jìn)度曲線，以便于觀察模型訓(xùn)練過程中的性能變化。

接下來，使用修改后的模型和訓(xùn)練選項(xiàng)對(duì)訓(xùn)練集進(jìn)行訓(xùn)練。在訓(xùn)練過程中，模型會(huì)根據(jù)設(shè)定的驗(yàn)證頻率使用驗(yàn)證集對(duì)性能進(jìn)行評(píng)估。這有助于了解模型在未知數(shù)據(jù)上的泛化能力。

執(zhí)行以上代碼進(jìn)行訓(xùn)練，訓(xùn)練的過程輸出如下：

訓(xùn)練完成后，將訓(xùn)練好的模型保存到文件中，以便于后續(xù)的使用和分析。

為了評(píng)估模型的性能，使用測試集進(jìn)行分類。通過將模型預(yù)測的結(jié)果與真實(shí)標(biāo)簽進(jìn)行比較，可以計(jì)算出模型在測試集上的準(zhǔn)確率。這是衡量模型性能的一個(gè)重要指標(biāo)。

為了更直觀地展示模型的預(yù)測效果，隨機(jī)選擇四個(gè)測試樣本并將它們顯示在一個(gè)圖像中。這有助于直觀地了解模型在不同類型圖像上的預(yù)測效果。

最后，繪制混淆矩陣以展示模型在各個(gè)類別上的性能?；煜仃囀且环N常用的可視化方法，可以直觀地顯示模型在不同類別上的正確分類和誤分類情況。通過混淆矩陣，可以進(jìn)一步分析模型在哪些類別上表現(xiàn)較好，以及在哪些類別上存在改進(jìn)空間。

4. 系統(tǒng)實(shí)現(xiàn)

本節(jié)介紹如何在MATLAB中實(shí)現(xiàn)圖像分類與訓(xùn)練系統(tǒng)的設(shè)計(jì)：該系統(tǒng)將分為兩個(gè)部分，第一部分是預(yù)測部分，負(fù)責(zé)選擇圖片、文件夾分類和更換模型；第二部分是訓(xùn)練部分，負(fù)責(zé)選擇數(shù)據(jù)集、設(shè)置訓(xùn)練參數(shù)、一鍵訓(xùn)練模型并評(píng)估。將結(jié)合GUI界面展示系統(tǒng)的設(shè)計(jì)框架和實(shí)現(xiàn)方法。

在本圖像分類與訓(xùn)練系統(tǒng)中，可以通過一個(gè)技術(shù)邏輯圖來概括整個(gè)系統(tǒng)的結(jié)構(gòu)和工作流程。以下是技術(shù)邏輯圖的文字描述：

用戶界面（GUI）：用戶界面是整個(gè)系統(tǒng)的核心部分，它負(fù)責(zé)接收用戶的輸入和指令。用戶界面包括兩個(gè)主要部分：預(yù)測部分和訓(xùn)練部分。預(yù)測部分允許用戶選擇圖片、文件夾和模型進(jìn)行分類；訓(xùn)練部分允許用戶選擇數(shù)據(jù)集、設(shè)置訓(xùn)練參數(shù)并一鍵訓(xùn)練模型。
數(shù)據(jù)預(yù)處理：在用戶選擇了數(shù)據(jù)集后，系統(tǒng)將對(duì)數(shù)據(jù)進(jìn)行預(yù)處理，包括數(shù)據(jù)增強(qiáng)和灰度圖像轉(zhuǎn)換。這一步驟確保輸入的數(shù)據(jù)符合模型的要求，同時(shí)增強(qiáng)模型的泛化能力。
模型訓(xùn)練：在用戶設(shè)置好訓(xùn)練參數(shù)后，系統(tǒng)將使用第三節(jié)中介紹的方法對(duì)模型進(jìn)行訓(xùn)練。在訓(xùn)練過程中，系統(tǒng)會(huì)實(shí)時(shí)繪制訓(xùn)練進(jìn)度曲線，以便用戶了解模型的訓(xùn)練情況。
模型評(píng)估：訓(xùn)練完成后，系統(tǒng)將自動(dòng)評(píng)估模型的性能，并將結(jié)果展示給用戶。這有助于用戶了解模型在未知數(shù)據(jù)上的泛化能力。
圖像分類：在預(yù)測部分，用戶可以選擇圖片、文件夾和模型進(jìn)行分類。系統(tǒng)將根據(jù)用戶的選擇加載相應(yīng)的模型，并對(duì)選擇的圖片或文件夾中的圖像進(jìn)行分類。

5. 總結(jié)與展望

本博客介紹了基于深度神經(jīng)網(wǎng)絡(luò)的圖像分類與訓(xùn)練系統(tǒng)（MATLAB實(shí)現(xiàn)）。從引言開始，介紹基于GoogleNet、ResNet進(jìn)行圖像分類的背景、意義，系統(tǒng)研究現(xiàn)狀及相關(guān)算法。隨后，展示了系統(tǒng)的界面演示效果，包括選擇圖片分類、選擇文件夾批量識(shí)別、更換不同網(wǎng)絡(luò)模型和通過界面選擇數(shù)據(jù)集一鍵訓(xùn)練模型等功能。在第三節(jié)中，詳細(xì)介紹了神經(jīng)網(wǎng)絡(luò)訓(xùn)練的過程，包括訓(xùn)練代碼、訓(xùn)練曲線和模型評(píng)估結(jié)果。第四節(jié)講述了系統(tǒng)實(shí)現(xiàn)的兩個(gè)部分：預(yù)測部分和訓(xùn)練部分，結(jié)合GUI界面給出了設(shè)計(jì)框架和實(shí)現(xiàn)。

雖然本博客已經(jīng)詳細(xì)介紹了基于深度神經(jīng)網(wǎng)絡(luò)的圖像分類與訓(xùn)練系統(tǒng)（MATLAB實(shí)現(xiàn)），但仍有一些潛在的改進(jìn)方向和挑戰(zhàn)。以下是未來可能進(jìn)行的研究和改進(jìn)：

更多的預(yù)訓(xùn)練模型：在目前的系統(tǒng)中，主要使用了GoogleNet和ResNet作為預(yù)訓(xùn)練模型。為了提高系統(tǒng)的泛化能力和適應(yīng)性，未來可以考慮引入更多的預(yù)訓(xùn)練模型，如VGGNet、DenseNet等。
提升訓(xùn)練效率：雖然已經(jīng)實(shí)現(xiàn)了數(shù)據(jù)增強(qiáng)和批量訓(xùn)練等功能，但訓(xùn)練過程仍然可能需要較長的時(shí)間。未來，可以嘗試使用更高效的優(yōu)化算法和硬件加速設(shè)備，如GPU，以提高訓(xùn)練效率。
更多的數(shù)據(jù)集支持：目前，我們的系統(tǒng)僅支持用戶選擇固定格式的數(shù)據(jù)集進(jìn)行訓(xùn)練。未來可以考慮支持更多類型的數(shù)據(jù)集，以便用戶可以更靈活地進(jìn)行訓(xùn)練。
實(shí)時(shí)識(shí)別和在線學(xué)習(xí)：為了使系統(tǒng)更具實(shí)用性，可以考慮在未來的版本中加入實(shí)時(shí)識(shí)別和在線學(xué)習(xí)功能。這將使得用戶能夠在任何時(shí)間、任何地點(diǎn)使用系統(tǒng)進(jìn)行圖像分類，并根據(jù)新的數(shù)據(jù)不斷更新模型。
更友好的用戶界面：雖然已經(jīng)實(shí)現(xiàn)了一個(gè)簡潔明了的用戶界面，但仍有改進(jìn)空間。在未來的版本中，可以考慮進(jìn)一步優(yōu)化用戶界面，使其更加直觀易用。

通過這些改進(jìn)和拓展，基于深度神經(jīng)網(wǎng)絡(luò)的圖像分類與訓(xùn)練系統(tǒng)能夠?yàn)楦鼜V泛的用戶群體提供更高效、更便捷的圖像分類和訓(xùn)練服務(wù)。希望本博客能夠?yàn)橄嚓P(guān)領(lǐng)域的研究者和開發(fā)者提供啟發(fā)和參考，共同推動(dòng)圖像分類技術(shù)的發(fā)展和進(jìn)步。通過持續(xù)改進(jìn)和優(yōu)化系統(tǒng)，類似的系統(tǒng)將在實(shí)際應(yīng)用中發(fā)揮更大的作用，例如，在醫(yī)學(xué)診斷、工業(yè)檢測、智能安防等領(lǐng)域，圖像分類技術(shù)將助力提升診斷準(zhǔn)確率、降低生產(chǎn)成本和提高安防水平。隨著計(jì)算能力的提升和算法的不斷完善。

下載鏈接

若您想獲得博文中涉及的實(shí)現(xiàn)完整全部程序文件（包括測試圖片、視頻，mlx, mlapp文件等，如下圖），這里已打包上傳至博主的面包多平臺(tái)，見可參考博客與視頻，已將所有涉及的文件同時(shí)打包到里面，點(diǎn)擊即可運(yùn)行，完整文件截圖如下：

在文件夾下的資源顯示如下圖所示：

注意：該代碼采用MATLAB R2022a開發(fā)，經(jīng)過測試能成功運(yùn)行，運(yùn)行界面的主程序?yàn)镮mageClassifier.mlapp，測試圖片腳本可運(yùn)行testimage.py，訓(xùn)練模型腳本可運(yùn)行trainResNet.mlx。為確保程序順利運(yùn)行，請(qǐng)使用MATLAB2022a運(yùn)行并在“附加功能管理器”（MATLAB的上方菜單欄->主頁->附加功能->管理附加功能）中添加有以下工具。

完整資源中包含數(shù)據(jù)集及訓(xùn)練代碼，環(huán)境配置與界面中文字、圖片、logo等的修改方法請(qǐng)見視頻，項(xiàng)目完整文件下載請(qǐng)見以下鏈接給出：???

下載鏈接：https://mbd.pub/o/bread/ZJiYmZlq

參考視頻演示：https://www.bilibili.com/video/BV1Fh4y1J7BD/

6. 結(jié)束語

由于博主能力有限，博文中提及的方法即使經(jīng)過試驗(yàn)，也難免會(huì)有疏漏之處。希望您能熱心指出其中的錯(cuò)誤，以便下次修改時(shí)能以一個(gè)更完美更嚴(yán)謹(jǐn)?shù)臉幼?，呈現(xiàn)在大家面前。同時(shí)如果有更好的實(shí)現(xiàn)方法也請(qǐng)您不吝賜教。

參考文獻(xiàn)

[1] Szegedy, C., Liu, W., Jia, Y., Sermanet, P., Reed, S., Anguelov, D., ... & Rabinovich, A. (2015). Going deeper with convolutions. In Proceedings of the IEEE conference on computer vision and pattern recognition (pp. 1-9).

[2] He, K., Zhang, X., Ren, S., & Sun, J. (2016). Deep residual learning for image recognition. In Proceedings of the IEEE conference on computer vision and pattern recognition (pp. 770-778).

[3] Deng, J., Dong, W., Socher, R., Li, L. J., Li, K., & Fei-Fei, L. (2009, June). Imagenet: A large-scale hierarchical image database. In 2009 IEEE conference on computer vision and pattern recognition (pp. 248-255). IEEE.

[4] Krizhevsky, A. (2009). Learning multiple layers of features from tiny images (Doctoral dissertation, University of Toronto).

[5] Simonyan, K., & Zisserman, A. (2014). Very deep convolutional networks for large-scale image recognition. arXiv preprint arXiv:1409.1556.

[6] Huang, G., Liu, Z., Van Der Maaten, L., & Weinberger, K. Q. (2017). Densely connected convolutional networks. In Proceedings of the IEEE conference on computer vision and pattern recognition (pp. 4700-4708).

[7] Zeiler, M. D., & Fergus, R. (2014). Visualizing and understanding convolutional networks. In European conference on computer vision (pp. 818-833). Springer, Cham.

[8] Hinton, G. E., Srivastava, N., Krizhevsky, A., Sutskever, I., & Salakhutdinov, R. R. (2012). Improving neural networks by preventing co-adaptation of feature detectors. arXiv preprint arXiv:1207.0580.

[9] Ioffe, S., & Szegedy, C. (2015). Batch normalization: Accelerating deep network training by reducing internal covariate shift. arXiv preprint arXiv:1502.03167.

標(biāo)簽：MATLAB GUI設(shè)計(jì)深度學(xué)習(xí)深度神經(jīng)網(wǎng)絡(luò)機(jī)器視覺圖像分類