Fashion-MNIST 數(shù)據(jù)集

日前,跨象乘云? 發(fā)布了《Fashion-MNIST 服飾圖片分類識(shí)別 - 人工智能垂直領(lǐng)域工程項(xiàng)目案例分享》。本案例基于 Fashion-MNIST 數(shù)據(jù)集,進(jìn)行卷積神經(jīng)網(wǎng)絡(luò)(CNN)模型訓(xùn)練,實(shí)現(xiàn)對(duì)服裝圖片分類識(shí)別。通過該項(xiàng)目練習(xí),學(xué)生將了解并掌握人工智能模型訓(xùn)練的完整工作生命周期,從:加載數(shù)據(jù)、數(shù)據(jù)增強(qiáng)、數(shù)據(jù)預(yù)處理、構(gòu)建模型、模型評(píng)估,到最后的應(yīng)用上線測試,等技術(shù)原理與實(shí)現(xiàn)手段。完成本項(xiàng)目后,學(xué)生將可以利用該模型,自動(dòng)識(shí)別本地上傳的服裝圖片,并識(shí)別區(qū)分出各種服裝類型:T-shirt/top(T恤)/ Trouser(褲子)/ Pullover(套衫)/ Dress(裙子)/ Coat(外套)/ Sandal(涼鞋)/ Shirt(汗衫)/ Sneaker(運(yùn)動(dòng)鞋)/Bag(包)/ Ankle boot(踝靴)。該模型的部署與應(yīng)用,將極大提升服裝銷售平臺(tái),如:優(yōu)衣庫,H&M,唯品會(huì) …… 在智能導(dǎo)購,庫存核算,在線商品搜索等系統(tǒng)上的效能。

Fashion-MNIST 是一個(gè)替代 MNIST 手寫數(shù)字集的圖像數(shù)據(jù)集。 它是由 Zalando(一家德國的時(shí)尚科技公司)旗下的研究部門提供。其涵蓋了來自 10 種類別的共 7 萬個(gè)不同商品的正面圖片。Fashion-MNIST 的大小、格式和訓(xùn)練集 / 測試集劃分與原始的 MNIST 完全一致。60000/10000 的訓(xùn)練測試數(shù)據(jù)劃分,28x28 的灰度圖片。你可以直接用它來測試你的機(jī)器學(xué)習(xí)和深度學(xué)習(xí)算法性能,且不需要改動(dòng)任何的代碼。 這個(gè)數(shù)據(jù)集的樣子大致如下(每個(gè)類別占三行):

經(jīng)典的 MNIST 數(shù)據(jù)集包含了大量的手寫數(shù)字。十幾年來,來自機(jī)器學(xué)習(xí)、機(jī)器視覺、人工智能、深度學(xué)習(xí)領(lǐng)域的研究員們把這個(gè)數(shù)據(jù)集作為衡量算法的基準(zhǔn)之一。你會(huì)在很多的會(huì)議,期刊的論文中發(fā)現(xiàn)這個(gè)數(shù)據(jù)集的身影。實(shí)際上,MNIST 數(shù)據(jù)集已經(jīng)成為算法作者的必測的數(shù)據(jù)集之一。有人曾調(diào)侃道:『如果一個(gè)算法在 MNIST 無效,那么它就根本沒法用;而如果它在 MNIST 上有效,它在其他數(shù)據(jù)上也可能無效』。?
Fashion-MNIST 的目的是要成為 MNIST 數(shù)據(jù)集的一個(gè)直接替代品。作為算法作者,你不需要修改任何的代碼,就可以直接使用這個(gè)數(shù)據(jù)集。Fashion-MNIST 的圖片大小,訓(xùn)練、測試樣本數(shù)及類別數(shù)與經(jīng)典 MNIST 完全相同。取代 MNIST 數(shù)據(jù)集的原因由如下幾個(gè):?
MNIST 太簡單了。 很多深度學(xué)習(xí)算法在測試集上的準(zhǔn)確率已經(jīng)達(dá)到 99.6%!?
MNIST 被用爛了。?
MNIST 數(shù)字識(shí)別的任務(wù)不代表現(xiàn)代機(jī)器學(xué)習(xí)。在 MNIST 上的想法沒法遷移到真正的機(jī)器視覺問題上。
你可以使用以下鏈接(https://github.com/zalandoresearch/fashion-mnist)下載這個(gè)數(shù)據(jù)集。Fashion-MNIST 的數(shù)據(jù)集的存儲(chǔ)方式和命名與經(jīng)典 MNIST 數(shù)據(jù)集(http://yann.lecun.com/exdb/mnist/)完全一致。或者,你可以直接克隆這個(gè)代碼庫。數(shù)據(jù)集就放在 data/fashion 下。這個(gè)代碼庫還包含了一些用于評(píng)測和可視化的腳本。?

t-SNE 在 Fashion-MNIST(左側(cè))和經(jīng)典 MNIST 上的可視化(右側(cè))

PCA 在 Fashion-MNIST(左側(cè))和經(jīng)典 MNIST 上的可視化(右側(cè))

Kaggle 下載鏈接:https://www.kaggle.com/zalando-research/fashionmnist
頭圖原文:https://medium.com/tensorflow/hello-deep-learning-fashion-mnist-with-keras-50fcff8cd74a