嘉晚飯01分類模型(基于卷積神經(jīng)網(wǎng)絡(luò))

摘要:本文創(chuàng)造性地將卷積神經(jīng)網(wǎng)絡(luò)運(yùn)用到嘉晚飯的01問題上,希望能讓機(jī)器學(xué)習(xí)訓(xùn)練出的模型為我們提供解答。實(shí)驗搭建了簡單的卷積神經(jīng)網(wǎng)絡(luò),選擇交叉熵?fù)p失函數(shù)并用Adam,SGD,AdamGrad等優(yōu)化器對參數(shù)進(jìn)行優(yōu)化,在自行搭建的01數(shù)據(jù)集上正確率達(dá)到了80%以上。將嘉然與向晚的圖片分別丟入模型,分別輸出兩者為1的概率。
關(guān)鍵詞:然攻 晚攻 卷積神經(jīng)網(wǎng)絡(luò)
前言
近年來,隨著“嘉晚飯是真的”的事實(shí)深入人心,糖瓷碗的隊伍也在不斷壯大,優(yōu)質(zhì)的二創(chuàng)也不斷增多。但值得注意的是,各位糖瓷碗對于“誰1誰0”的問題一直爭論不休,甚至撒潑打滾、大打出手??梢哉f嘉晚飯的01問題已經(jīng)成為亟待解決的世紀(jì)難題。為豐富嘉晚飯01的理論體系,筆者嘗試運(yùn)用卷積神經(jīng)網(wǎng)絡(luò)構(gòu)建女同01判斷器,探尋然攻最強(qiáng)的真相。
一.01數(shù)據(jù)集構(gòu)建
神經(jīng)網(wǎng)絡(luò)的訓(xùn)練需要合適的數(shù)據(jù)集支撐。對01判斷而言,外貌是一個重要的指標(biāo)。在動漫或漫畫領(lǐng)域已有不少01分明的百合作品,如終將成為你、牽?;ㄅc加瀨同學(xué)等等。由于圖像范圍有限,采集困難,我們僅采集了100張這樣的圖片,將其手動標(biāo)簽為0與1,搭建了一個簡單的數(shù)據(jù)集。其部分示意如下:

圖像均為RGB三通道圖像。由于圖像大小不同,在讀入時采取了隨即裁剪的策略,保證讀入時均為256*256像素。圖像中70%作為訓(xùn)練集,30%作為測試集。
此外還分別收集了嘉然與向晚各40張圖片,用于在模型訓(xùn)練完成后判斷嘉然與向晚的01含量。部分示意圖如下:

二.卷積神經(jīng)網(wǎng)絡(luò)的搭建
略。(可在CSDN中搜索“基于卷積神經(jīng)網(wǎng)絡(luò)的嘉晚飯01判定器”查看)
三.訓(xùn)練結(jié)果及分析

在訓(xùn)練集上,采用交叉熵?fù)p失函數(shù)計算loss值,并用Adam算法對loss進(jìn)行優(yōu)化,如圖所示為loss隨batch_idx的變化,可見在幾次epoch之后模型的loss值基本穩(wěn)定且趨近于0,收斂速度比較快。在測試集上驗證模型,最終準(zhǔn)確率為80%。
我們將嘉然與向晚分別40張圖片丟入,讓模型分別判斷每張圖片為1或為0,計算圖片中被歸為1的圖片數(shù)量占總數(shù)的比例,作為嘉然與向晚為1的概率。實(shí)驗中進(jìn)行多次測試,取平均值,最終得到向晚為1的概率為76.92%,嘉然為1的概率為36.84%:

繪制餅狀圖直觀表示:


可以看到晚晚為1的概率比然然要高不少。
四.總結(jié)
在此次實(shí)驗中,我們構(gòu)建了01判斷模型,從圖像角度入手對嘉晚飯的01問題進(jìn)行了分析。但是值得注意的是,此模型的構(gòu)造完全基于外貌,會受到發(fā)色、臉型等因素的顯著影響。輸出向晚為1的概率更高僅代表在一定的統(tǒng)計意義上,向晚擁有更多百合關(guān)系中1的外貌特征,并不意味著向晚在嘉晚飯中就是1?!拔?你0”才是嘉晚飯相處模式中不受外貌、時間等因素影響的亙古不變的真理。當(dāng)然,誰0誰1雖然是關(guān)鍵性問題,但這個問題的答案不影響嘉晚兩人的美好關(guān)系,更不會影響諸位糖瓷碗對嘉晚飯的喜愛。
結(jié)合我們對嘉晚飯的深入理解,向晚在這段關(guān)系中顯然不可能是1,因此我們可以說此次模型的搭建是失敗的,缺乏考量的,不理智的、可笑的。在搭建模型時可以考慮更多的因素,如語言習(xí)慣,相處習(xí)慣等,這些需要采集更多的數(shù)據(jù)并進(jìn)行合理的數(shù)據(jù)處理。實(shí)驗中由于已有01資料較少,難以整理,導(dǎo)致數(shù)據(jù)集較小,可以通過裁切旋轉(zhuǎn)加入噪聲等數(shù)據(jù)增強(qiáng)的方式增加數(shù)據(jù)集數(shù)量。
附錄
代碼(可在CSDN中搜索“基于卷積神經(jīng)網(wǎng)絡(luò)的嘉晚飯01判定器”查看)