100+深度學習開源數(shù)據(jù)集分類匯總(醫(yī)學圖像、衛(wèi)星圖像、語義分割、自動駕駛、圖像分類
編輯丨極市平臺
醫(yī)學圖像
瘧疾細胞圖像數(shù)據(jù)集
下載鏈接:http://suo.nz/2VQTUt

皮膚癌 MNIST:HAM10000
下載鏈接:http://suo.nz/33n6Xy
該數(shù)據(jù)集收集了來自不同人群的皮膚鏡圖像,通過不同的方式獲取和存儲。最終數(shù)據(jù)集包含 10015 張皮膚鏡圖像,可用作學術機器學習目的的訓練集。案例包括色素病變領域所有重要診斷類別的代表性集合:光化性角化病和上皮內癌/鮑溫氏病 (akiec)、基底細胞癌 (bcc),超過50%的病變是通過組織病理學(histo)證實的,其余病例的ground truth要么是后續(xù)檢查(follow_up),要么是專家共識(consensus),要么是活體共聚焦顯微鏡(confocal)證實. 數(shù)據(jù)集包括具有多個圖像的病變,可以通過 HAM10000_metadata 文件中的 lesion_id 列進行跟蹤。

乳房組織病理學圖像
下載鏈接:http://suo.nz/347Jt1
原始數(shù)據(jù)集包含以 40 倍掃描的 162 個完整的乳腺癌 (BCa) 標本幻燈片圖像。從中提取了 277,524 個大小為 50 x 50 的補?。?98,738 個 IDC 負值和 78,786 個 IDC 正值)。每個補丁的文件名格式為:u_xX_yY_classC.png — > example 10253_idx5_x1351_y1101_class0.png。其中 u 是患者 ID (10253_idx5),X 是裁剪此補丁的 x 坐標,Y 是裁剪此補丁的 y 坐標,C 表示類,其中 0 是非 IDC 和1 是數(shù)據(jù)中心。

胸部 X 光圖像(肺炎)
下載鏈接:http://suo.nz/3aXYPg
數(shù)據(jù)集分為 3 個文件夾(train、test、val)并包含每個圖像類別(肺炎/正常)的子文件夾。有 5,863 張 X 射線圖像 (JPEG) 和 2 個類別(肺炎/正常)。胸部 X 光圖像(前后位)選自廣州市婦女兒童醫(yī)療中心 1 至 5 歲兒科患者的回顧性隊列。

白內障數(shù)據(jù)集
下載鏈接:http://suo.nz/2cOidH
用于白內障檢測的白內障和正常眼睛圖像數(shù)據(jù)集。
惡性與良性皮膚癌
下載鏈接:http://suo.nz/2kkvio
該數(shù)據(jù)集包含良性皮膚痣和惡性皮膚痣圖像的平衡數(shù)據(jù)集。數(shù)據(jù)由兩個文件夾組成,每個文件夾包含兩種痣的 1800 張圖片 (224x244)。
CT 醫(yī)學圖像
下載鏈接:http://suo.nz/2tQehH
該數(shù)據(jù)集旨在允許測試不同的方法來檢查與使用對比度和患者年齡相關的 CT 圖像數(shù)據(jù)的趨勢。基本思想是識別與這些特征密切相關的圖像紋理、統(tǒng)計模式和特征,并可能構建簡單的工具,在這些圖像被錯誤分類時自動對其進行分類(或查找可能是可疑情況、錯誤測量或校準不良機器的異常值)

MedMNIST醫(yī)學圖像分割評估
下載鏈接:http://suo.nz/2Bmrmo
MedMNIST,這是 10 個預處理的醫(yī)學開放數(shù)據(jù)集的集合。MedMNIST 經過標準化處理,可在輕量級 28x28 圖像上執(zhí)行分類任務,無需背景知識。它涵蓋了醫(yī)學圖像分析中的主要數(shù)據(jù)模式,在數(shù)據(jù)規(guī)模(從 100 到 100,000)和任務(二元/多類、序數(shù)回歸和多標簽)上具有多樣性。MedMNIST 可用于教育目的、快速原型設計、多模式機器學習或醫(yī)學圖像分析中的 AutoML。此外,MedMNIST Classification Decathlon 旨在對所有 10 個數(shù)據(jù)集上的 AutoML 算法進行基準測試

多標簽視網(wǎng)膜疾病 (MuReD) 數(shù)據(jù)集
下載鏈接:http://suo.nz/2ISEr5
多標簽視網(wǎng)膜疾?。∕uReD)數(shù)據(jù)集,使用從三個不同的最先進來源(即 ARIA、STARE 和 RFMiD 數(shù)據(jù)集)收集的圖像,并執(zhí)行一系列后處理確保圖像質量的處理步驟、要分類的廣泛疾病以及每個疾病標簽有足夠數(shù)量的樣本。MuReD 數(shù)據(jù)集由 2208 張圖像組成,具有 20 個不同的標簽,圖像質量和分辨率各不相同。同時,確保數(shù)據(jù)的最低質量,每個標簽有足夠數(shù)量的樣本。

2.語義分割
高分二號 (GF-2) 衛(wèi)星圖像大型土地覆蓋數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://suo.nz/2dPkdv
GID 是具有高分二號 (GF-2) 衛(wèi)星圖像的大型土地覆蓋數(shù)據(jù)集。這個新的數(shù)據(jù)集被命名為高分影像數(shù)據(jù)集(GID),由于其覆蓋面大、分布廣、空間分辨率高等特點,與現(xiàn)有的土地覆蓋數(shù)據(jù)集相比具有優(yōu)勢。GID 由兩部分組成:大規(guī)模分類集和精細土地覆蓋分類集。大規(guī)模分類集包含 150 個像素級帶注釋的 GF-2 圖像,精細分類集由 30,000 個多尺度圖像塊加上 10 個像素級帶注釋的 GF-2 圖像組成。分別基于 5 個類別的訓練圖像和驗證圖像收集并重新標記 15 個類別的訓練數(shù)據(jù)和驗證數(shù)據(jù)。

DADA-seg
數(shù)據(jù)集下載地址:http://suo.nz/3bZ3qm
DADA-seg 是一個按像素標注的事故數(shù)據(jù)集,其中包含交通事故的各種關鍵場景。

Dark Zurich
數(shù)據(jù)集下載地址:http://suo.nz/34sQlF
Dark Zurich 是一個圖像數(shù)據(jù)集,包含在夜間、黃昏和白天拍攝的總共 8779 張圖像,以及每張圖像的相機各自的 GPS 坐標。這些 GPS 注釋用于構建一天中的跨時間對應關系,即,將每個夜間或黎明圖像與其白天對應物相匹配。
斯坦福背景數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://suo.nz/2WWDgY
斯坦福背景數(shù)據(jù)集是 Gould 等人引入的新數(shù)據(jù)集。(ICCV 2009)用于評估幾何和語義場景理解的方法。該數(shù)據(jù)集包含 715 張圖像,這些圖像選自現(xiàn)有的公共數(shù)據(jù)集:LabelMe 、 MSRC、 PASCAL VOC 和Geometric Context。我們的選擇標準是圖像是戶外場景,像素大約為 320 x 240,至少包含一個前景物體,并且地平線位于圖像內(不需要可見)。

CIHP人體解析數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://suo.nz/2ll7hi
Crowd Instance-level Human Parsing (CIHP) 數(shù)據(jù)集包含 38,280 張多人圖像,這些圖像具有精細的注釋、高外觀可變性和復雜性。該數(shù)據(jù)集可用于人體部分分割任務。

WoodScape自動駕駛魚眼數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://suo.nz/2sRklZ
WoodScape 包含四個環(huán)視攝像頭和九項任務,包括分割、深度估計、3D 邊界框檢測和新型污染檢測。為超過 10,000 張圖像提供實例級別的 40 個類的語義注釋。
3.圖像分類
FruitNet水果分類/識別數(shù)據(jù)集
下載鏈接:http://suo.nz/2Cfo4y
需要高質量的水果圖像來解決水果分類和識別問題。要構建機器學習模型,整潔干凈的數(shù)據(jù)集是基本要求。為了這個目標,我們創(chuàng)建了名為“FruitNet”的六種流行印度水果的數(shù)據(jù)集。該數(shù)據(jù)集包含 6 種不同類別水果的 14700 多張經過處理的格式的高質量圖像。圖像分為 3 個子文件夾 1) 優(yōu)質水果 2) 劣質水果和 3) 混合質量水果。每個子文件夾包含 6 個水果圖像,即蘋果、香蕉、番石榴、酸橙、橙子和石榴。使用具有高端分辨率相機的手機來捕捉圖像。這些圖像是在不同的背景和不同的光照條件下拍攝的。建議的數(shù)據(jù)集可用于訓練,水果分類或重組模型的測試和驗證。
衛(wèi)星圖像分類
下載鏈接:http://suo.nz/2D00yp
衛(wèi)星圖像分類數(shù)據(jù)集-RSI-CB256,該數(shù)據(jù)集有 4 個不同的類別,混合了傳感器和谷歌地圖快照
intel 自然風光圖像分類數(shù)據(jù)集
下載鏈接:http://suo.nz/2KwdmY
這是世界各地自然風光的圖像數(shù)據(jù)。
內容:此數(shù)據(jù)包含分布在 6 個類別下的大約 25,000 張大小為 150x150 的圖像。{'建筑物'-> 0, '森林'-> 1, '冰川'-> 2, '山'-> 3, '海'-> 4, '街道'-> 5}
建筑遺產元素圖像數(shù)據(jù)集
下載鏈接:http://suo.nz/2RmsZl
Architectural Heritage Elements Dataset (AHE) 是一個圖像數(shù)據(jù)集,用于開發(fā)深度學習算法和建筑遺產圖像分類中的特定技術。該數(shù)據(jù)集包含 10235 張圖像,分為 10 個類別:祭壇:829 張圖像;后殿:514 張圖片;鐘樓:1059張圖片;欄目:1919張圖片;圓頂(內部):616 張圖像;圓頂(外部):1177 張圖像;飛扶壁:407張圖片;Gargoyle(和 Chimera):1571 張圖像;彩色玻璃:1033 幅圖像;保險庫:1110 張圖像。
貝殼或鵝卵石:圖像分類數(shù)據(jù)集
下載鏈接:http://suo.nz/2YSG42
數(shù)據(jù)集包含兩個類:貝殼或卵石。該數(shù)據(jù)集可用于二元分類任務,以確定某個圖像是貝殼還是鵝卵石。
板球-足球-棒球分類
數(shù)據(jù)集下載鏈接:http://suo.nz/33juP6
該數(shù)據(jù)集包含 252 張打板球、踢足球和打棒球的圖像。主文件夾中有 3 個子文件夾 (1) cricket (2) football (3) baseball (cricket-football-baseball)。

花卉數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://suo.nz/2fGKVt
該數(shù)據(jù)集包含 4242 張花卉圖像。數(shù)據(jù)收集基于數(shù)據(jù)flicr、google images、yandex images。此數(shù)據(jù)集可用于從照片中識別植物。數(shù)據(jù)圖片會分為五類:洋甘菊、郁金香、玫瑰、向日葵、蒲公英。每個種類大約有800張照片。照片分辨率不高,約為 320x240 像素。照片不會縮小到單一尺寸,它們有不同的比例。
90種動物圖像數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://suo.nz/2ncY0a
在這個數(shù)據(jù)集中有 90 個不同類別的 5400 張動物圖像。此數(shù)據(jù)集是從 Google 圖片創(chuàng)建的:https://images.google.com/。所有照片將按照其所屬類別存放于各自的文件夾下。動物類別包括:羚羊,獾,蝙蝠,熊,蜜蜂,甲蟲,野牛,公豬,蝴蝶,貓 毛蟲,黑猩猩等。該數(shù)據(jù)集中的圖像大小不固定,可能需要后續(xù)的處理。

衣服數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://suo.nz/2uJaOJ
衣服數(shù)據(jù)集總共收集了 20 種衣服的 5,000 張圖像。該數(shù)據(jù)集是根據(jù)公共領域許可 (CC0) 發(fā)布的。我們使用了三種不同的方式來收集數(shù)據(jù)集:Toloka——眾包平臺;社交媒體上的網(wǎng)絡眾包計劃;Tagias——一家專門從事數(shù)據(jù)收集的公司。標簽是使用 IPython 小部件手動完成的,同時我們使用簡單的神經網(wǎng)絡糾正了標簽錯誤。
數(shù)據(jù)集包含 20 個類,包括T 恤(1011 件),長袖(699 件),褲子(692 件),鞋子(431 件)襯衫(378 件),連衣裙(357 件),外套(312 件),短褲(308 件),帽子(171 件),裙子(155 件),西裝外套(109 件)等。
商標數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://suo.nz/2CfnTq
在這項工作中,我們構建了一個大規(guī)模的 logo 數(shù)據(jù)集 Logo-2K+,它涵蓋了來自真實世界 logo 圖像的各種 logo 類別。我們生成的徽標數(shù)據(jù)集包含 167,140 張圖像,具有 10 個根類別和 2,341 個類別。

食物圖像數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://suo.nz/2D00oT
該數(shù)據(jù)集包含完整 food-101 數(shù)據(jù)的許多不同子集。為了給圖像分析制作一個比 CIFAR10 或 MNIST 更簡單的訓練集,該數(shù)據(jù)包括圖像的大規(guī)模縮小版本,以實現(xiàn)快速測試。數(shù)據(jù)已被重新格式化為 HDF5,特別是 Keras HDF5Matrix,這樣可以輕松讀取它們。

4.垃圾分類、水下垃圾/口罩垃圾/煙頭垃圾檢測
AquaTrash垃圾識別數(shù)據(jù)集
數(shù)據(jù)集下載鏈接:http://suo.nz/2CdMGi
該數(shù)據(jù)集包含 369 張用于深度學習的垃圾圖像??偣灿?470 個邊界框。共有 4 類 {(0: glass), (1:paper), (2:metal), (3:plastic)}

口罩垃圾檢測
數(shù)據(jù)集下載鏈接:http://suo.nz/2CYpbL
這個數(shù)據(jù)集是一個極具挑戰(zhàn)性的集合,包含從 1200 多個城市和農村地區(qū)捕獲和眾包的 7000 多張原始 Masks 圖像,其中每張圖像都由DC Labs 的計算機視覺專業(yè)人員手動審查和驗證。
數(shù)據(jù)集大?。?000+ 捕獲者:超過 1200 多個眾包貢獻者 分辨率:99% 圖像高清及以上(1920x1080 及以上) 地點:拍攝于印度 900 多個城市 多樣性:各種照明條件,如白天、夜晚、不同的距離、觀察點等 使用設備:2020-2021 年使用手機拍攝 用途:口罩檢測、口罩隔離、垃圾口罩檢測等

煙頭垃圾數(shù)據(jù)集
數(shù)據(jù)集下載鏈接:http://suo.nz/2KuC0k
該數(shù)據(jù)集由一組 2200 張合成合成的地面香煙圖像組成。它專為訓練 CNN(卷積神經網(wǎng)絡)而設計。

水下垃圾檢測數(shù)據(jù)集
數(shù)據(jù)集下載鏈接:http://suo.nz/2RkRCH
該數(shù)據(jù)來自 J-EDI 海洋垃圾數(shù)據(jù)集。構成該數(shù)據(jù)集的視頻在質量、深度、場景中的對象和使用的相機方面差異很大。它們包含許多不同類型的海洋垃圾的圖像,這些圖像是從現(xiàn)實世界環(huán)境中捕獲的,提供了處于不同衰減、遮擋和過度生長狀態(tài)的各種物體。此外,水的清晰度和光的質量因視頻而異。這些視頻經過處理以提取 5,700 張圖像,這些圖像構成了該數(shù)據(jù)集,所有圖像都在垃圾實例、植物和動物等生物對象以及 ROV 上標有邊界框。

垃圾分類數(shù)據(jù)集
數(shù)據(jù)集下載鏈接:http://suo.nz/2YR4Ho
該數(shù)據(jù)集包含來自 12 個不同類別的生活垃圾的 15,150 張圖像;紙、紙板、生物、金屬、塑料、綠色玻璃、棕色玻璃、白色玻璃、衣服、鞋子、電池和垃圾。
Kaggle 垃圾分類圖片數(shù)據(jù)集
數(shù)據(jù)集下載鏈接:http://suo.nz/36mRLb
該數(shù)據(jù)集是圖片數(shù)據(jù),分為訓練集85%(Train)和測試集15%(Test)。其中O代表Organic(有機垃圾),R代表Recycle(可回收)

生活垃圾數(shù)據(jù)集
數(shù)據(jù)集下載鏈接:http://suo.nz/3dT4PS
大約9000多張獨特的圖片。該數(shù)據(jù)集由印度國內常見垃圾對象的圖像組成。圖像是在各種照明條件、天氣、室內和室外條件下拍攝的。該數(shù)據(jù)集可用于制作垃圾/垃圾檢測模型、環(huán)保替代建議、碳足跡生成等。
垃圾溢出數(shù)據(jù)集
數(shù)據(jù)集下載鏈接:http://suo.nz/2fJocH
SpotGarbage垃圾識別數(shù)據(jù)集
數(shù)據(jù)集下載鏈接:http://suo.nz/2nfBho
圖像中的垃圾(GINI)數(shù)據(jù)集是SpotGarbage引入的一個數(shù)據(jù)集,包含2561張圖像,956張圖像包含垃圾,其余的是在各種視覺屬性方面與垃圾非常相似的非垃圾圖像。
5.目標跟蹤
Temple Color 128
數(shù)據(jù)集下載鏈接:http://suo.nz/2dKEEL
本數(shù)據(jù)集包含一大組 128 種顏色序列,帶有基本事實和挑戰(zhàn)因素注釋(例如,遮擋)
NfS高幀率視頻數(shù)據(jù)集
數(shù)據(jù)集下載鏈接:http://suo.nz/34o8df
第一個更高幀率的視頻數(shù)據(jù)集(稱為極品飛車 - NfS)和視覺對象跟蹤基準。該數(shù)據(jù)集包含 100 個視頻(380K 幀),這些視頻是使用現(xiàn)在常見的更高幀率 (240 FPS) 攝像機從現(xiàn)實世界場景中捕獲的。所有幀都用軸對齊的邊界框進行注釋,所有序列都用九個視覺屬性手動標記——例如遮擋、快速運動、背景雜亂等。
VOT2020
數(shù)據(jù)集下載鏈接:http://suo.nz/2W7iD5
PathTrack 數(shù)據(jù)集
數(shù)據(jù)集下載鏈接:http://suo.nz/2OFhXy
用于多目標跟蹤 (MOT)。PathTrack 數(shù)據(jù)集包含 720 個視頻序列中的 15,000 多個人的軌跡。
ALOV300++跟蹤數(shù)據(jù)集
數(shù)據(jù)集下載鏈接:http://suo.nz/2dKDTl
ALOV++,Amsterdam Library of Ordinary Videos for tracking 是一個物體追蹤視頻數(shù)據(jù),旨在對不同的光線、通透度、泛著條件、背景雜亂程度、焦距下的相似物體的追蹤。
6.口罩識別檢測
SF-MASK
數(shù)據(jù)集下載鏈接:http://suo.nz/2E6ADA
從監(jiān)控錄像中對有面具和無面具的人臉進行分類是最困難的任務之一,數(shù)據(jù)集SF-MASK來解決這些問題,該數(shù)據(jù)集適用于小尺寸人臉、部分隱藏的人臉、各種人臉方向和各種面具類型等。SF-MASK是通過收集已經發(fā)布的面具相關數(shù)據(jù)集而構建的。同時,通過分析現(xiàn)有數(shù)據(jù)集中缺失的數(shù)據(jù)和補充缺失的數(shù)據(jù),使其更加完整。
口罩檢測視頻數(shù)據(jù)集
數(shù)據(jù)集下載鏈接:http://suo.nz/2wAnAv
一個實時視頻/圖像數(shù)據(jù)集,其中包含在大學環(huán)境中行走的多個主題(帶/不帶面具)。每個帶注釋的幀都包含多個具有唯一標識、邊界框和類/標簽信息的實例(即人)。數(shù)據(jù)集和注釋可用于訓練、驗證和測試基于深度學習和計算機視覺的口罩檢測算法。以下是數(shù)據(jù)集的詳細信息:視頻總幀數(shù):4357 邊界框總數(shù):21941 帶遮罩的盒子 (MW):8306 不帶遮罩的盒子 (NM):13635 圖像幀:此文件夾包含 4357 個視頻幀 (.png)。
口罩佩戴數(shù)據(jù)集
數(shù)據(jù)集下載鏈接:http://suo.nz/2p4avO
該Mask Wearing數(shù)據(jù)集是戴各種口罩的人和不戴口罩的人的物體檢測數(shù)據(jù)集。這些圖像最初由臺灣伊甸社會福利基金會的 Cheng Hsun Teng 收集,并由 Roboflow 團隊重新標記。
口罩檢測數(shù)據(jù)集
數(shù)據(jù)集下載鏈接:http://suo.nz/2ojy0l
數(shù)據(jù)集由 2 個文件夾中的 7553 張 RGB 圖像組成,分別是 with_mask 和 without_mask。圖像被命名為標簽 with_mask 和 without_mask。戴口罩的人臉圖像為3725張,不戴口罩的人臉圖像為3828張。
MDMFR口罩數(shù)據(jù)集
數(shù)據(jù)集下載鏈接:http://suo.nz/2gNkVE
MDMFR 數(shù)據(jù)集由兩個主要集合組成,1) 面罩檢測和 2) 蒙面面部識別。我們的 MDMFR 數(shù)據(jù)集中有 6006 張圖像。面罩檢測集合包含兩類人臉圖像,即蒙面和未蒙面。檢測數(shù)據(jù)庫包含 3174 個帶掩碼和 2832 個不帶掩碼(未掩碼)的圖像。
RMFD口罩遮擋人臉數(shù)據(jù)集
數(shù)據(jù)集下載鏈接:http://suo.nz/2ojy0v
7.自動駕駛
ExDark圖像數(shù)據(jù)集
下載地址:http://suo.nz/2lidoI
Exclusively Dark (ExDARK) 數(shù)據(jù)集是 7,363 張從極低光環(huán)境到黃昏(即 10 種不同條件)的低光圖像的集合,具有 12 個對象類(類似于 PASCAL VOC),在圖像類級別和局部對象邊界上進行了注釋盒子。
Nexet車輛檢測數(shù)據(jù)集
下載地址:http://suo.nz/2sKekn
50000張帶標注的訓練圖片
41190張測試圖片
圖片來自77個國家
Udacity 自動駕駛汽車數(shù)據(jù)集
下載地址:http://suo.nz/2Agrp4
該數(shù)據(jù)集包含 11 個類別的 97,942 個標簽和 15,000 張圖像。有 1,720 個空樣本(沒有標簽的圖像)。
所有圖像均為 1920x1200(下載大小約為 3.1 GB)。本數(shù)據(jù)集還提供了一個降采樣到 512x512(下載大小約 580 MB)的版本,適用于大多數(shù)常見的機器學習模型(包括 YOLO v3、Mask R-CNN、SSD 和 mobilenet)。
WoodScape
下載地址:http://suo.nz/2HMEtL
WoodScape 包含四個環(huán)視攝像頭和九項任務,包括分割、深度估計、3D 邊界框檢測和新型污染檢測。為超過 10,000 張圖像提供實例級別的 40 個類的語義注釋。
BDD100K
下載地址:http://suo.nz/2OCU68
UCB的全天候全光照大型數(shù)據(jù)集,包含1,100小時的HD錄像、GPS/IMU、時間戳信息,100,000張圖片的2D bounding box標注,10,000張圖片的語義分割和實例分割標注、駕駛決策標注和路況標注。官方推薦使用此數(shù)據(jù)集的十個自動駕駛任務:圖像標注、道路檢測、可行駛區(qū)域分割、交通參與物檢測、語義分割、實例分割、多物體檢測追蹤、多物體分割追蹤、域適應和模仿學習。
Linkopings交通標志數(shù)據(jù)集
下載地址:http://suo.nz/2W97aP
超過 20,000 張圖像 ,其中 20% 已標記。
包含 3488個 交通標志。
從超過 350 公里的瑞典道路上 記錄的公路和城市序列。
非洲地區(qū)交通標志數(shù)據(jù)集
下載地址:http://suo.nz/2WTJGi
該數(shù)據(jù)集已特別針對非洲地區(qū)進行了改進。兩個開源數(shù)據(jù)集僅用于提取非洲地區(qū)使用的交通標志。該數(shù)據(jù)集包含來自所有類別的 76 個類,例如 監(jiān)管、警告、指南和信息標志。該數(shù)據(jù)集總共包含 19,346 張圖像和每個類別至少 200 個實例。
8.衛(wèi)星圖像
水體衛(wèi)星圖像的圖像
數(shù)據(jù)集下載地址:http://suo.nz/2ksvWY
Sentinel-2 衛(wèi)星拍攝的水體圖像集。每張圖片都帶有一個黑白mask,其中白色代表水,黑色代表除水之外的其他東西。這些掩模是通過計算 NWDI(歸一化水差指數(shù))生成的,該指數(shù)經常用于檢測和測量衛(wèi)星圖像中的植被,但使用更大的閾值來檢測水體。
城市航拍圖像分割數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://suo.nz/2cWiSh
此數(shù)據(jù)集包含用于檢查和準備航空影像分割數(shù)據(jù)集的腳本。該數(shù)據(jù)集包含一組不同的衛(wèi)星圖像,這些圖像用目標城市的建筑物、道路和背景標簽進行了注釋。

游泳池和汽車衛(wèi)星圖像檢測
數(shù)據(jù)集下載地址:http://suo.nz/3b5ZtQ
人工月球景觀數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://suo.nz/33zMp9
由于月球圖像的稀缺性和缺乏注釋,通常很難對其進行任何類型的機器學習實驗。該數(shù)據(jù)集的目標是為公眾提供人造而逼真的月球景觀樣本,可用于訓練巖石檢測算法。這些經過訓練的算法可以在實際的月球圖片或其他巖石地形圖片上進行測試。該數(shù)據(jù)集目前包含 9,766 個巖石月球景觀的真實渲染圖,以及它們的分段等價物(3 類是天空、較小的巖石和較大的巖石)。還提供了所有較大巖石和經過處理、清理后的地面實況圖像的邊界框表。

馬薩諸塞州道路數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://suo.nz/32Pa9O
馬薩諸塞州道路數(shù)據(jù)集由1171幅馬薩諸塞州的航空圖像組成。與建筑數(shù)據(jù)一樣,每個圖像的大小為1500×1500像素,占地2.25平方公里。

UC Merced Land-Use
數(shù)據(jù)集下載地址:http://suo.nz/2IXmvN
這是一個用于研究目的的 21 類土地利用圖像數(shù)據(jù)集。以下每個類別都有 100 張圖像:
農業(yè) 飛機 棒球鉆石 海灘 建筑物 叢林 密集住宅 森林 高速公路 高爾夫球場 港口 路口 中型住宅 移動房屋公園 立交橋 停車場 河 跑道 稀疏住宅 儲油罐 網(wǎng)球場
每個圖像的尺寸為 256x256 像素。
這些圖像是從美國地質勘探局國家地圖城市區(qū)域圖像集中針對全國各個城市地區(qū)的大圖像中手動提取的。此公共領域圖像的像素分辨率為 1 英尺。

Indian Pines
數(shù)據(jù)集下載地址:http://suo.nz/2JHZ1g
這一場景由AVIRIS傳感器采集位于印第安納州西北部的 Indian Pines 測試場上空,由 145×145 像素和 224 個光譜反射帶組成,波長范圍為 0.4–2.5 10^(-6) 米。該場景是一個較大場景的子集。印度松樹場景包含三分之二的農業(yè)和三分之一的森林或其他天然多年生植被。有兩條主要的雙車道高速公路、一條鐵路線,以及一些低密度住房、其他建筑結構和較小的道路。由于該場景是在 6 月份拍攝的,因此一些農作物(玉米、大豆)正處于生長早期階段,覆蓋率不到 5%??捎玫幕臼聦嵄恢付槭鶄€類別,并且并非全部都是相互排斥的。還通過去除覆蓋吸水區(qū)域的譜帶,將譜帶數(shù)量減少到 200:[104-108]、[150-163]、220。

KSC
數(shù)據(jù)集下載地址:http://suo.nz/2Rec5X
KSC數(shù)據(jù)集是于1996年3月份在美國佛羅里達州肯尼迪太空中心進行成像,截取512×614大小進行標注的高光譜數(shù)據(jù)集。它是由機載可是紅外成像光譜儀(AVIRIS)攝,AVIRIS的波長范圍是400-2500nm??臻g分辨率為18米,在去除吸水帶以及低信噪比波段后,實際用于訓練的波段是176個。研究區(qū)域有13中地物類型,包括Scrub、Willow swamp、Cabbage palm hammock、Slash pine等。

Washington DC
數(shù)據(jù)集下載地址:http://suo.nz/2YJZ9K
Washington DC數(shù)據(jù)集是由Hydice傳感器獲取的一幅華盛頓購物中心上空的航空高光譜影像,數(shù)據(jù)包含了從 0.4 -2.4 μm可見光和近紅外波段范圍的共191個波段,數(shù)據(jù)大小為1280×307。地物類別包括街道,草地,水,碎石小路,樹木,陰影和屋頂。

BigEarthNet
數(shù)據(jù)集下載地址:https://bigearth.net/
使用Sentinel-2圖像補丁構建BigEarthNet(現(xiàn)在稱為BigEarthNet-S2,以前稱為BigEarthNet),初步選擇了2017年6月至2018年5月期間在歐洲10個國家(奧地利、比利時、芬蘭、愛爾蘭、科索沃、立陶宛、盧森堡、葡萄牙、塞爾維亞、瑞士)。所有圖塊均通過 Sentinel-2 Level 2A 產品生成和格式化工具 (sen2cor v2.5.5) 進行了大氣校正。然后,它們被分為 590,326 個不重疊的圖像塊。每個圖像塊都由 2018 年 CORINE 土地覆蓋數(shù)據(jù)庫 (CLC 2018) 提供的多個土地覆蓋類別(即多標簽)進行注釋。BigEarthNet中的標簽屬于2018年首次發(fā)布的標簽。
9.農業(yè)相關
DeepWeeds 雜草類型分類數(shù)據(jù)集
下載鏈接:http://suo.nz/2OmaTQ
數(shù)據(jù)集包含 17,509 張圖像,這些圖像捕捉了八種原產于澳大利亞的不同雜草以及鄰近的植物群。選定的雜草品種是昆士蘭州牧草地的本地品種。它們包括:“中國蘋果”、“蛇草”、“馬纓丹”、“刺金合歡”、“暹羅草”、“白花菊”、“橡膠藤”和“帕金森屬植物”。這些圖像是從昆士蘭以下地點的雜草侵擾中收集的:“Black River”、“Charters Towers”、“Cluden”、“Douglas”、“Hervey Range”、“Kelso”、“McKinlay”和“Paluma”。

仙人掌航拍圖片數(shù)據(jù)集
下載鏈接:http://suo.nz/2VSnYx
在此數(shù)據(jù)集中,展示了 16,000 多個用于植物識別或分類的柱狀仙人掌 (Neobuxbaumia tetetzo) 示例。
農作物圖像分類(小麥、水稻、甘蔗、玉米等)
下載鏈接:http://suo.nz/33oB1C
數(shù)據(jù)集(作物圖像)包含每種農業(yè)作物(玉米、小麥、黃麻、水稻和甘蔗)的 40 多張圖像數(shù)據(jù)集(kag2)包含每類作物圖像的 159 多張增強圖像。增強包括水平翻轉、旋轉、水平平移、垂直平移。

5種不同的水稻圖像數(shù)據(jù)集
下載鏈接:http://suo.nz/349aVN
使用了 Arborio、Basmati、Ipsala、Jasmine 和 Karacadag 水稻品種。
數(shù)據(jù)集(1) 有75K 幅圖像,包括每個水稻品種的15K 幅圖像。數(shù)據(jù)集(2)有 12 個形態(tài)特征、4 個形狀特征和 90 個顏色特征。

玉米葉感染數(shù)據(jù)集
下載鏈接:http://suo.nz/3aZ0xg
收集了部分被秋粘蟲等害蟲感染的玉米葉片圖像。有 Healthy 和 Infected 文件夾,每個文件夾都包含各自的圖像。此外,還使用 VoTT 為受感染的圖像準備了注釋文件。

打架識別相關
監(jiān)控攝像頭下的打架檢測
數(shù)據(jù)集下載鏈接:http://suo.nz/39IbxQ
該數(shù)據(jù)集是從包含打架實例的 Youtube 視頻中收集的。此外,還包括一些來自常規(guī)監(jiān)控攝像機視頻的非打架序列。
總共有300個視頻,150個打架+150個非打架
視頻時長 2 秒
示例中僅包含與打架相關的部分
此外,由于任務是通過監(jiān)控攝像頭檢測打斗,因此首選沒有背景運動的視頻作為樣本。此外,還包括各種打斗場景,例如用物體撞擊、踢打、拳擊、摔跤。示例中的環(huán)境也各不相同,例如咖啡館、街道、公共汽車等。

UBI-Fight異常事件檢測數(shù)據(jù)集
數(shù)據(jù)集下載鏈接:http://suo.nz/3aoBUh
UBI-Fights 數(shù)據(jù)集是一個獨特的全新大型數(shù)據(jù)集,涉及特定的異常檢測并仍然在打斗場景中提供廣泛的多樣性,該數(shù)據(jù)集包含 80 小時的視頻,在幀級別進行了完全注釋。由 1000 個視頻組成,其中 216 個視頻包含打斗事件,784 個是正常的日常生活場景。刪除所有可能干擾學習過程的不必要的視頻片段(例如,視頻介紹、新聞等) 。

曲棍球比賽檢測數(shù)據(jù)集
數(shù)據(jù)集下載鏈接:http://suo.nz/2ceViI
該數(shù)據(jù)集中包含 1000 個序列,分為兩組:打斗和非打斗。

打架識別圖像數(shù)據(jù)集
數(shù)據(jù)集下載鏈接:http://suo.nz/2jL8np
該數(shù)據(jù)集是為“打斗探測器”項目創(chuàng)建的,該項目檢測靜止圖像中的打斗,然后將打斗探測器移動到上下文中具有時間維度的下一級視頻檢測。打斗數(shù)據(jù)集是從視頻數(shù)據(jù)集 HMDB51 數(shù)據(jù)集創(chuàng)建的。

真實街頭斗毆視頻數(shù)據(jù)集
數(shù)據(jù)集下載鏈接:http://suo.nz/2rhiQO
該數(shù)據(jù)集包含從 youtube 視頻中收集的 1000 個暴力視頻和 1000 個非暴力視頻,數(shù)據(jù)集中的暴力視頻包含多種環(huán)境和條件下的許多真實街頭斗毆情況。數(shù)據(jù)集中的非暴力視頻也是從許多不同的人類行為中收集的,如運動、飲食、步行等。

人臉
FePh面部表情數(shù)據(jù)集
數(shù)據(jù)集下載鏈接:http://suo.nz/2zIouL
手語背景下帶注釋的序列化面部表情數(shù)據(jù)集,其中包含從公共電視臺 PHOENIX 的每日新聞和天氣預報中提取的 3000 多張面部圖像。與大多數(shù)當前現(xiàn)有的面部表情數(shù)據(jù)集不同,F(xiàn)ePh 提供具有不同頭部姿勢、方向和運動的序列化半模糊面部圖像。

不平衡面部表情數(shù)據(jù)集
數(shù)據(jù)集下載鏈接:http://suo.nz/2OKM2R
圖像大小保持 96x96,并使用改進后的標簽。源數(shù)據(jù)集被分成兩個子集——訓練和測試。train.csv 和 test.csv 文件分別包含訓練和測試子集的標簽到文件名的映射。類別有:憤怒、蔑視、厭惡、恐懼、快樂、中性、悲傷和驚訝。

FER-2013
數(shù)據(jù)集下載鏈接:http://suo.nz/2WgZ7y
數(shù)據(jù)由 48x48 像素的人臉灰度圖像組成。人臉已自動注冊,因此人臉或多或少居中,并且在每張圖像中占據(jù)大致相同的空間訓練集包含 28,709 個示例,公共測試集包含 3,589 個示例。

FANE:面部表情和情緒數(shù)據(jù)集
數(shù)據(jù)集下載鏈接:http://suo.nz/2X1BD1
FANE 是一個圖像數(shù)據(jù)集,用于對野外圖像中的面部表情和情緒進行分類。數(shù)據(jù)集中有九個類別??偣灿?6,913 張圖片。圖像是從多個來源收集的,包括其他面部表情數(shù)據(jù)集,以及主要通過網(wǎng)絡抓取的互聯(lián)網(wǎng)。使用手動注釋和預訓練模型對圖像進行標記。

小鼠面部表情數(shù)據(jù)集
數(shù)據(jù)集下載鏈接:http://suo.nz/34xOHI
老鼠在三種情緒狀態(tài)(中性、疼痛和發(fā)癢)下的面部圖像。