60+開源數(shù)據(jù)集資源大合集(醫(yī)學(xué)圖像、衛(wèi)星圖像、語義分割、自動駕駛、圖像分類等)
1.醫(yī)學(xué)圖像
瘧疾細胞圖像數(shù)據(jù)集
下載鏈接:http://suo.nz/2VQTUt

皮膚癌 MNIST:HAM10000
下載鏈接:http://suo.nz/33n6Xy
該數(shù)據(jù)集收集了來自不同人群的皮膚鏡圖像,通過不同的方式獲取和存儲。最終數(shù)據(jù)集包含 10015 張皮膚鏡圖像,可用作學(xué)術(shù)機器學(xué)習(xí)目的的訓(xùn)練集。案例包括色素病變領(lǐng)域所有重要診斷類別的代表性集合:光化性角化病和上皮內(nèi)癌/鮑溫氏病 (akiec)、基底細胞癌 (bcc),超過50%的病變是通過組織病理學(xué)(histo)證實的,其余病例的ground truth要么是后續(xù)檢查(follow_up),要么是專家共識(consensus),要么是活體共聚焦顯微鏡(confocal)證實. 數(shù)據(jù)集包括具有多個圖像的病變,可以通過 HAM10000_metadata 文件中的 lesion_id 列進行跟蹤。

乳房組織病理學(xué)圖像
下載鏈接:http://suo.nz/347Jt1
原始數(shù)據(jù)集包含以 40 倍掃描的 162 個完整的乳腺癌 (BCa) 標(biāo)本幻燈片圖像。從中提取了 277,524 個大小為 50 x 50 的補丁(198,738 個 IDC 負值和 78,786 個 IDC 正值)。每個補丁的文件名格式為:u_xX_yY_classC.png — > example 10253_idx5_x1351_y1101_class0.png。其中 u 是患者 ID (10253_idx5),X 是裁剪此補丁的 x 坐標(biāo),Y 是裁剪此補丁的 y 坐標(biāo),C 表示類,其中 0 是非 IDC 和1 是數(shù)據(jù)中心。

胸部 X 光圖像(肺炎)
下載鏈接:http://suo.nz/3aXYPg
數(shù)據(jù)集分為 3 個文件夾(train、test、val)并包含每個圖像類別(肺炎/正常)的子文件夾。有 5,863 張 X 射線圖像 (JPEG) 和 2 個類別(肺炎/正常)。胸部 X 光圖像(前后位)選自廣州市婦女兒童醫(yī)療中心 1 至 5 歲兒科患者的回顧性隊列。

白內(nèi)障數(shù)據(jù)集
下載鏈接:http://suo.nz/2cOidH
用于白內(nèi)障檢測的白內(nèi)障和正常眼睛圖像數(shù)據(jù)集。
惡性與良性皮膚癌
下載鏈接:http://suo.nz/2kkvio
該數(shù)據(jù)集包含良性皮膚痣和惡性皮膚痣圖像的平衡數(shù)據(jù)集。數(shù)據(jù)由兩個文件夾組成,每個文件夾包含兩種痣的 1800 張圖片 (224x244)。
2.語義分割
高分二號 (GF-2) 衛(wèi)星圖像大型土地覆蓋數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://suo.nz/2dPkdv
GID 是具有高分二號 (GF-2) 衛(wèi)星圖像的大型土地覆蓋數(shù)據(jù)集。這個新的數(shù)據(jù)集被命名為高分影像數(shù)據(jù)集(GID),由于其覆蓋面大、分布廣、空間分辨率高等特點,與現(xiàn)有的土地覆蓋數(shù)據(jù)集相比具有優(yōu)勢。GID 由兩部分組成:大規(guī)模分類集和精細土地覆蓋分類集。大規(guī)模分類集包含 150 個像素級帶注釋的 GF-2 圖像,精細分類集由 30,000 個多尺度圖像塊加上 10 個像素級帶注釋的 GF-2 圖像組成。分別基于 5 個類別的訓(xùn)練圖像和驗證圖像收集并重新標(biāo)記 15 個類別的訓(xùn)練數(shù)據(jù)和驗證數(shù)據(jù)。

DADA-seg
數(shù)據(jù)集下載地址:http://suo.nz/3bZ3qm
DADA-seg 是一個按像素標(biāo)注的事故數(shù)據(jù)集,其中包含交通事故的各種關(guān)鍵場景。

Dark Zurich
數(shù)據(jù)集下載地址:http://suo.nz/34sQlF
Dark Zurich 是一個圖像數(shù)據(jù)集,包含在夜間、黃昏和白天拍攝的總共 8779 張圖像,以及每張圖像的相機各自的 GPS 坐標(biāo)。這些 GPS 注釋用于構(gòu)建一天中的跨時間對應(yīng)關(guān)系,即,將每個夜間或黎明圖像與其白天對應(yīng)物相匹配。
斯坦福背景數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://suo.nz/2WWDgY
斯坦福背景數(shù)據(jù)集是 Gould 等人引入的新數(shù)據(jù)集。(ICCV 2009)用于評估幾何和語義場景理解的方法。該數(shù)據(jù)集包含 715 張圖像,這些圖像選自現(xiàn)有的公共數(shù)據(jù)集:LabelMe 、 MSRC、 PASCAL VOC 和Geometric Context。我們的選擇標(biāo)準(zhǔn)是圖像是戶外場景,像素大約為 320 x 240,至少包含一個前景物體,并且地平線位于圖像內(nèi)(不需要可見)。

CIHP人體解析數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://suo.nz/2ll7hi
Crowd Instance-level Human Parsing (CIHP) 數(shù)據(jù)集包含 38,280 張多人圖像,這些圖像具有精細的注釋、高外觀可變性和復(fù)雜性。該數(shù)據(jù)集可用于人體部分分割任務(wù)。

WoodScape自動駕駛魚眼數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://suo.nz/2sRklZ
WoodScape 包含四個環(huán)視攝像頭和九項任務(wù),包括分割、深度估計、3D 邊界框檢測和新型污染檢測。為超過 10,000 張圖像提供實例級別的 40 個類的語義注釋。
3.圖像分類
FruitNet水果分類/識別數(shù)據(jù)集
下載鏈接:http://suo.nz/2Cfo4y
需要高質(zhì)量的水果圖像來解決水果分類和識別問題。要構(gòu)建機器學(xué)習(xí)模型,整潔干凈的數(shù)據(jù)集是基本要求。為了這個目標(biāo),我們創(chuàng)建了名為“FruitNet”的六種流行印度水果的數(shù)據(jù)集。該數(shù)據(jù)集包含 6 種不同類別水果的 14700 多張經(jīng)過處理的格式的高質(zhì)量圖像。圖像分為 3 個子文件夾 1) 優(yōu)質(zhì)水果 2) 劣質(zhì)水果和 3) 混合質(zhì)量水果。每個子文件夾包含 6 個水果圖像,即蘋果、香蕉、番石榴、酸橙、橙子和石榴。使用具有高端分辨率相機的手機來捕捉圖像。這些圖像是在不同的背景和不同的光照條件下拍攝的。建議的數(shù)據(jù)集可用于訓(xùn)練,水果分類或重組模型的測試和驗證。
衛(wèi)星圖像分類
下載鏈接:http://suo.nz/2D00yp
衛(wèi)星圖像分類數(shù)據(jù)集-RSI-CB256,該數(shù)據(jù)集有 4 個不同的類別,混合了傳感器和谷歌地圖快照
intel 自然風(fēng)光圖像分類數(shù)據(jù)集
下載鏈接:http://suo.nz/2KwdmY
這是世界各地自然風(fēng)光的圖像數(shù)據(jù)。
內(nèi)容:此數(shù)據(jù)包含分布在 6 個類別下的大約 25,000 張大小為 150x150 的圖像。{'建筑物'-> 0, '森林'-> 1, '冰川'-> 2, '山'-> 3, '海'-> 4, '街道'-> 5}
建筑遺產(chǎn)元素圖像數(shù)據(jù)集
下載鏈接:http://suo.nz/2RmsZl
Architectural Heritage Elements Dataset (AHE) 是一個圖像數(shù)據(jù)集,用于開發(fā)深度學(xué)習(xí)算法和建筑遺產(chǎn)圖像分類中的特定技術(shù)。該數(shù)據(jù)集包含 10235 張圖像,分為 10 個類別:祭壇:829 張圖像;后殿:514 張圖片;鐘樓:1059張圖片;欄目:1919張圖片;圓頂(內(nèi)部):616 張圖像;圓頂(外部):1177 張圖像;飛扶壁:407張圖片;Gargoyle(和 Chimera):1571 張圖像;彩色玻璃:1033 幅圖像;保險庫:1110 張圖像。
貝殼或鵝卵石:圖像分類數(shù)據(jù)集
下載鏈接:http://suo.nz/2YSG42
數(shù)據(jù)集包含兩個類:貝殼或卵石。該數(shù)據(jù)集可用于二元分類任務(wù),以確定某個圖像是貝殼還是鵝卵石。
板球-足球-棒球分類
數(shù)據(jù)集下載鏈接:http://suo.nz/33juP6
該數(shù)據(jù)集包含 252 張打板球、踢足球和打棒球的圖像。主文件夾中有 3 個子文件夾 (1) cricket (2) football (3) baseball (cricket-football-baseball)。

花卉數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://suo.nz/2fGKVt
該數(shù)據(jù)集包含 4242 張花卉圖像。數(shù)據(jù)收集基于數(shù)據(jù)flicr、google images、yandex images。此數(shù)據(jù)集可用于從照片中識別植物。數(shù)據(jù)圖片會分為五類:洋甘菊、郁金香、玫瑰、向日葵、蒲公英。每個種類大約有800張照片。照片分辨率不高,約為 320x240 像素。照片不會縮小到單一尺寸,它們有不同的比例。
90種動物圖像數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://suo.nz/2ncY0a
在這個數(shù)據(jù)集中有 90 個不同類別的 5400 張動物圖像。此數(shù)據(jù)集是從 Google 圖片創(chuàng)建的:https://images.google.com/。所有照片將按照其所屬類別存放于各自的文件夾下。動物類別包括:羚羊,獾,蝙蝠,熊,蜜蜂,甲蟲,野牛,公豬,蝴蝶,貓 毛蟲,黑猩猩等。該數(shù)據(jù)集中的圖像大小不固定,可能需要后續(xù)的處理。

衣服數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://suo.nz/2uJaOJ
衣服數(shù)據(jù)集總共收集了 20 種衣服的 5,000 張圖像。該數(shù)據(jù)集是根據(jù)公共領(lǐng)域許可 (CC0) 發(fā)布的。我們使用了三種不同的方式來收集數(shù)據(jù)集:Toloka——眾包平臺;社交媒體上的網(wǎng)絡(luò)眾包計劃;Tagias——一家專門從事數(shù)據(jù)收集的公司。標(biāo)簽是使用 IPython 小部件手動完成的,同時我們使用簡單的神經(jīng)網(wǎng)絡(luò)糾正了標(biāo)簽錯誤。
數(shù)據(jù)集包含 20 個類,包括T 恤(1011 件),長袖(699 件),褲子(692 件),鞋子(431 件)襯衫(378 件),連衣裙(357 件),外套(312 件),短褲(308 件),帽子(171 件),裙子(155 件),西裝外套(109 件)等。
商標(biāo)數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://suo.nz/2CfnTq
在這項工作中,我們構(gòu)建了一個大規(guī)模的 logo 數(shù)據(jù)集 Logo-2K+,它涵蓋了來自真實世界 logo 圖像的各種 logo 類別。我們生成的徽標(biāo)數(shù)據(jù)集包含 167,140 張圖像,具有 10 個根類別和 2,341 個類別。

食物圖像數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://suo.nz/2D00oT
該數(shù)據(jù)集包含完整 food-101 數(shù)據(jù)的許多不同子集。為了給圖像分析制作一個比 CIFAR10 或 MNIST 更簡單的訓(xùn)練集,該數(shù)據(jù)包括圖像的大規(guī)??s小版本,以實現(xiàn)快速測試。數(shù)據(jù)已被重新格式化為 HDF5,特別是 Keras HDF5Matrix,這樣可以輕松讀取它們。

4.垃圾分類、水下垃圾/口罩垃圾/煙頭垃圾檢測
AquaTrash垃圾識別數(shù)據(jù)集
數(shù)據(jù)集下載鏈接:http://suo.nz/2CdMGi
該數(shù)據(jù)集包含 369 張用于深度學(xué)習(xí)的垃圾圖像??偣灿?470 個邊界框。共有 4 類 {(0: glass), (1:paper), (2:metal), (3:plastic)}

口罩垃圾檢測
數(shù)據(jù)集下載鏈接:http://suo.nz/2CYpbL
這個數(shù)據(jù)集是一個極具挑戰(zhàn)性的集合,包含從 1200 多個城市和農(nóng)村地區(qū)捕獲和眾包的 7000 多張原始 Masks 圖像,其中每張圖像都由DC Labs 的計算機視覺專業(yè)人員手動審查和驗證。
數(shù)據(jù)集大?。?000+ 捕獲者:超過 1200 多個眾包貢獻者 分辨率:99% 圖像高清及以上(1920x1080 及以上) 地點:拍攝于印度 900 多個城市 多樣性:各種照明條件,如白天、夜晚、不同的距離、觀察點等 使用設(shè)備:2020-2021 年使用手機拍攝 用途:口罩檢測、口罩隔離、垃圾口罩檢測等

煙頭垃圾數(shù)據(jù)集
數(shù)據(jù)集下載鏈接:http://suo.nz/2KuC0k
該數(shù)據(jù)集由一組 2200 張合成合成的地面香煙圖像組成。它專為訓(xùn)練 CNN(卷積神經(jīng)網(wǎng)絡(luò))而設(shè)計。

水下垃圾檢測數(shù)據(jù)集
數(shù)據(jù)集下載鏈接:http://suo.nz/2RkRCH
該數(shù)據(jù)來自 J-EDI 海洋垃圾數(shù)據(jù)集。構(gòu)成該數(shù)據(jù)集的視頻在質(zhì)量、深度、場景中的對象和使用的相機方面差異很大。它們包含許多不同類型的海洋垃圾的圖像,這些圖像是從現(xiàn)實世界環(huán)境中捕獲的,提供了處于不同衰減、遮擋和過度生長狀態(tài)的各種物體。此外,水的清晰度和光的質(zhì)量因視頻而異。這些視頻經(jīng)過處理以提取 5,700 張圖像,這些圖像構(gòu)成了該數(shù)據(jù)集,所有圖像都在垃圾實例、植物和動物等生物對象以及 ROV 上標(biāo)有邊界框。

垃圾分類數(shù)據(jù)集
數(shù)據(jù)集下載鏈接:http://suo.nz/2YR4Ho
該數(shù)據(jù)集包含來自 12 個不同類別的生活垃圾的 15,150 張圖像;紙、紙板、生物、金屬、塑料、綠色玻璃、棕色玻璃、白色玻璃、衣服、鞋子、電池和垃圾。
Kaggle 垃圾分類圖片數(shù)據(jù)集
數(shù)據(jù)集下載鏈接:http://suo.nz/36mRLb
該數(shù)據(jù)集是圖片數(shù)據(jù),分為訓(xùn)練集85%(Train)和測試集15%(Test)。其中O代表Organic(有機垃圾),R代表Recycle(可回收)

生活垃圾數(shù)據(jù)集
數(shù)據(jù)集下載鏈接:http://suo.nz/3dT4PS
大約9000多張獨特的圖片。該數(shù)據(jù)集由印度國內(nèi)常見垃圾對象的圖像組成。圖像是在各種照明條件、天氣、室內(nèi)和室外條件下拍攝的。該數(shù)據(jù)集可用于制作垃圾/垃圾檢測模型、環(huán)保替代建議、碳足跡生成等。

垃圾溢出數(shù)據(jù)集
數(shù)據(jù)集下載鏈接:http://suo.nz/2fJocH

SpotGarbage垃圾識別數(shù)據(jù)集
數(shù)據(jù)集下載鏈接:http://suo.nz/2nfBho
圖像中的垃圾(GINI)數(shù)據(jù)集是SpotGarbage引入的一個數(shù)據(jù)集,包含2561張圖像,956張圖像包含垃圾,其余的是在各種視覺屬性方面與垃圾非常相似的非垃圾圖像。

5.目標(biāo)跟蹤
Temple Color 128
數(shù)據(jù)集下載鏈接:http://suo.nz/2dKEEL
本數(shù)據(jù)集包含一大組 128 種顏色序列,帶有基本事實和挑戰(zhàn)因素注釋(例如,遮擋)
NfS高幀率視頻數(shù)據(jù)集
數(shù)據(jù)集下載鏈接:http://suo.nz/34o8df
第一個更高幀率的視頻數(shù)據(jù)集(稱為極品飛車 - NfS)和視覺對象跟蹤基準(zhǔn)。該數(shù)據(jù)集包含 100 個視頻(380K 幀),這些視頻是使用現(xiàn)在常見的更高幀率 (240 FPS) 攝像機從現(xiàn)實世界場景中捕獲的。所有幀都用軸對齊的邊界框進行注釋,所有序列都用九個視覺屬性手動標(biāo)記——例如遮擋、快速運動、背景雜亂等。
VOT2020
數(shù)據(jù)集下載鏈接:http://suo.nz/2W7iD5
PathTrack 數(shù)據(jù)集
數(shù)據(jù)集下載鏈接:http://suo.nz/2OFhXy
用于多目標(biāo)跟蹤 (MOT)。PathTrack 數(shù)據(jù)集包含 720 個視頻序列中的 15,000 多個人的軌跡。
ALOV300++跟蹤數(shù)據(jù)集
數(shù)據(jù)集下載鏈接:http://suo.nz/2dKDTl
ALOV++,Amsterdam Library of Ordinary Videos for tracking 是一個物體追蹤視頻數(shù)據(jù),旨在對不同的光線、通透度、泛著條件、背景雜亂程度、焦距下的相似物體的追蹤。
6.口罩識別檢測
SF-MASK
數(shù)據(jù)集下載鏈接:http://suo.nz/2E6ADA
從監(jiān)控錄像中對有面具和無面具的人臉進行分類是最困難的任務(wù)之一,數(shù)據(jù)集SF-MASK來解決這些問題,該數(shù)據(jù)集適用于小尺寸人臉、部分隱藏的人臉、各種人臉方向和各種面具類型等。SF-MASK是通過收集已經(jīng)發(fā)布的面具相關(guān)數(shù)據(jù)集而構(gòu)建的。同時,通過分析現(xiàn)有數(shù)據(jù)集中缺失的數(shù)據(jù)和補充缺失的數(shù)據(jù),使其更加完整。
口罩檢測視頻數(shù)據(jù)集
數(shù)據(jù)集下載鏈接:http://suo.nz/2wAnAv
一個實時視頻/圖像數(shù)據(jù)集,其中包含在大學(xué)環(huán)境中行走的多個主題(帶/不帶面具)。每個帶注釋的幀都包含多個具有唯一標(biāo)識、邊界框和類/標(biāo)簽信息的實例(即人)。數(shù)據(jù)集和注釋可用于訓(xùn)練、驗證和測試基于深度學(xué)習(xí)和計算機視覺的口罩檢測算法。以下是數(shù)據(jù)集的詳細信息:視頻總幀數(shù):4357 邊界框總數(shù):21941 帶遮罩的盒子 (MW):8306 不帶遮罩的盒子 (NM):13635 圖像幀:此文件夾包含 4357 個視頻幀 (.png)。
口罩佩戴數(shù)據(jù)集
數(shù)據(jù)集下載鏈接:http://suo.nz/2p4avO
該Mask Wearing數(shù)據(jù)集是戴各種口罩的人和不戴口罩的人的物體檢測數(shù)據(jù)集。這些圖像最初由臺灣伊甸社會福利基金會的 Cheng Hsun Teng 收集,并由 Roboflow 團隊重新標(biāo)記。
口罩檢測數(shù)據(jù)集
數(shù)據(jù)集下載鏈接:http://suo.nz/2ojy0l
數(shù)據(jù)集由 2 個文件夾中的 7553 張 RGB 圖像組成,分別是 with_mask 和 without_mask。圖像被命名為標(biāo)簽 with_mask 和 without_mask。戴口罩的人臉圖像為3725張,不戴口罩的人臉圖像為3828張。
MDMFR口罩數(shù)據(jù)集
數(shù)據(jù)集下載鏈接:http://suo.nz/2gNkVE
MDMFR 數(shù)據(jù)集由兩個主要集合組成,1) 面罩檢測和 2) 蒙面面部識別。我們的 MDMFR 數(shù)據(jù)集中有 6006 張圖像。面罩檢測集合包含兩類人臉圖像,即蒙面和未蒙面。檢測數(shù)據(jù)庫包含 3174 個帶掩碼和 2832 個不帶掩碼(未掩碼)的圖像。
RMFD口罩遮擋人臉數(shù)據(jù)集
數(shù)據(jù)集下載鏈接:http://suo.nz/2ojy0v
7.自動駕駛
ExDark圖像數(shù)據(jù)集
下載地址:http://suo.nz/2lidoI
Exclusively Dark (ExDARK) 數(shù)據(jù)集是 7,363 張從極低光環(huán)境到黃昏(即 10 種不同條件)的低光圖像的集合,具有 12 個對象類(類似于 PASCAL VOC),在圖像類級別和局部對象邊界上進行了注釋盒子。
Nexet車輛檢測數(shù)據(jù)集
下載地址:http://suo.nz/2sKekn
50000張帶標(biāo)注的訓(xùn)練圖片
41190張測試圖片
圖片來自77個國家
Udacity 自動駕駛汽車數(shù)據(jù)集
下載地址:http://suo.nz/2Agrp4
該數(shù)據(jù)集包含 11 個類別的 97,942 個標(biāo)簽和 15,000 張圖像。有 1,720 個空樣本(沒有標(biāo)簽的圖像)。
所有圖像均為 1920x1200(下載大小約為 3.1 GB)。本數(shù)據(jù)集還提供了一個降采樣到 512x512(下載大小約 580 MB)的版本,適用于大多數(shù)常見的機器學(xué)習(xí)模型(包括 YOLO v3、Mask R-CNN、SSD 和 mobilenet)。
WoodScape
下載地址:http://suo.nz/2HMEtL
WoodScape 包含四個環(huán)視攝像頭和九項任務(wù),包括分割、深度估計、3D 邊界框檢測和新型污染檢測。為超過 10,000 張圖像提供實例級別的 40 個類的語義注釋。
BDD100K
下載地址:http://suo.nz/2OCU68
UCB的全天候全光照大型數(shù)據(jù)集,包含1,100小時的HD錄像、GPS/IMU、時間戳信息,100,000張圖片的2D bounding box標(biāo)注,10,000張圖片的語義分割和實例分割標(biāo)注、駕駛決策標(biāo)注和路況標(biāo)注。官方推薦使用此數(shù)據(jù)集的十個自動駕駛?cè)蝿?wù):圖像標(biāo)注、道路檢測、可行駛區(qū)域分割、交通參與物檢測、語義分割、實例分割、多物體檢測追蹤、多物體分割追蹤、域適應(yīng)和模仿學(xué)習(xí)。
Linkopings交通標(biāo)志數(shù)據(jù)集
下載地址:http://suo.nz/2W97aP
超過 20,000 張圖像 ,其中 20% 已標(biāo)記。
包含 3488個 交通標(biāo)志。
從超過 350 公里的瑞典道路上 記錄的公路和城市序列。
非洲地區(qū)交通標(biāo)志數(shù)據(jù)集
下載地址:http://suo.nz/2WTJGi
該數(shù)據(jù)集已特別針對非洲地區(qū)進行了改進。兩個開源數(shù)據(jù)集僅用于提取非洲地區(qū)使用的交通標(biāo)志。該數(shù)據(jù)集包含來自所有類別的 76 個類,例如 監(jiān)管、警告、指南和信息標(biāo)志。該數(shù)據(jù)集總共包含 19,346 張圖像和每個類別至少 200 個實例。
8.衛(wèi)星圖像
水體衛(wèi)星圖像的圖像
數(shù)據(jù)集下載地址:http://suo.nz/2ksvWY
Sentinel-2 衛(wèi)星拍攝的水體圖像集。每張圖片都帶有一個黑白mask,其中白色代表水,黑色代表除水之外的其他東西。這些掩模是通過計算 NWDI(歸一化水差指數(shù))生成的,該指數(shù)經(jīng)常用于檢測和測量衛(wèi)星圖像中的植被,但使用更大的閾值來檢測水體。
城市航拍圖像分割數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://suo.nz/2cWiSh
此數(shù)據(jù)集包含用于檢查和準(zhǔn)備航空影像分割數(shù)據(jù)集的腳本。該數(shù)據(jù)集包含一組不同的衛(wèi)星圖像,這些圖像用目標(biāo)城市的建筑物、道路和背景標(biāo)簽進行了注釋。
游泳池和汽車衛(wèi)星圖像檢測
數(shù)據(jù)集下載地址:http://suo.nz/3b5ZtQ
人工月球景觀數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://suo.nz/33zMp9
由于月球圖像的稀缺性和缺乏注釋,通常很難對其進行任何類型的機器學(xué)習(xí)實驗。該數(shù)據(jù)集的目標(biāo)是為公眾提供人造而逼真的月球景觀樣本,可用于訓(xùn)練巖石檢測算法。這些經(jīng)過訓(xùn)練的算法可以在實際的月球圖片或其他巖石地形圖片上進行測試。該數(shù)據(jù)集目前包含 9,766 個巖石月球景觀的真實渲染圖,以及它們的分段等價物(3 類是天空、較小的巖石和較大的巖石)。還提供了所有較大巖石和經(jīng)過處理、清理后的地面實況圖像的邊界框表。
馬薩諸塞州道路數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://suo.nz/32Pa9O
馬薩諸塞州道路數(shù)據(jù)集由1171幅馬薩諸塞州的航空圖像組成。與建筑數(shù)據(jù)一樣,每個圖像的大小為1500×1500像素,占地2.25平方公里。
9.農(nóng)業(yè)相關(guān)
DeepWeeds 雜草類型分類數(shù)據(jù)集
下載鏈接:http://suo.nz/2OmaTQ
數(shù)據(jù)集包含 17,509 張圖像,這些圖像捕捉了八種原產(chǎn)于澳大利亞的不同雜草以及鄰近的植物群。選定的雜草品種是昆士蘭州牧草地的本地品種。它們包括:“中國蘋果”、“蛇草”、“馬纓丹”、“刺金合歡”、“暹羅草”、“白花菊”、“橡膠藤”和“帕金森屬植物”。這些圖像是從昆士蘭以下地點的雜草侵擾中收集的:“Black River”、“Charters Towers”、“Cluden”、“Douglas”、“Hervey Range”、“Kelso”、“McKinlay”和“Paluma”。

仙人掌航拍圖片數(shù)據(jù)集
下載鏈接:http://suo.nz/2VSnYx
在此數(shù)據(jù)集中,展示了 16,000 多個用于植物識別或分類的柱狀仙人掌 (Neobuxbaumia tetetzo) 示例。
農(nóng)作物圖像分類(小麥、水稻、甘蔗、玉米等)
下載鏈接:http://suo.nz/33oB1C
數(shù)據(jù)集(作物圖像)包含每種農(nóng)業(yè)作物(玉米、小麥、黃麻、水稻和甘蔗)的 40 多張圖像數(shù)據(jù)集(kag2)包含每類作物圖像的 159 多張增強圖像。增強包括水平翻轉(zhuǎn)、旋轉(zhuǎn)、水平平移、垂直平移。

5種不同的水稻圖像數(shù)據(jù)集
下載鏈接:http://suo.nz/349aVN
使用了 Arborio、Basmati、Ipsala、Jasmine 和 Karacadag 水稻品種。
數(shù)據(jù)集(1) 有75K 幅圖像,包括每個水稻品種的15K 幅圖像。數(shù)據(jù)集(2)有 12 個形態(tài)特征、4 個形狀特征和 90 個顏色特征。

玉米葉感染數(shù)據(jù)集
下載鏈接:http://suo.nz/3aZ0xg
收集了部分被秋粘蟲等害蟲感染的玉米葉片圖像。有 Healthy 和 Infected 文件夾,每個文件夾都包含各自的圖像。此外,還使用 VoTT 為受感染的圖像準(zhǔn)備了注釋文件。