小目標檢測、圖像分類、圖像識別等開源數據集匯總
編輯丨極市平臺
寵物圖像數據集
數據集下載地址:http://m6z.cn/5TAgdC
一個包含 37 個類別的寵物數據集,每個類別大約有 200 張圖像。這些圖像在比例、姿勢和照明方面有很大的變化。所有圖像都有相關的品種、頭部 ROI 和像素級三元圖分割的地面實況注釋。

街景門牌號 (SVHN) 數據集
數據集下載地址:http://m6z.cn/5ExMWb
SVHN 是一個真實世界的圖像數據集,用于開發(fā)機器學習和對象識別算法,對數據預處理和格式化的要求最低。它可以被視為與MNIST風格相似(例如,圖像是經過裁剪的小數字),但包含一個數量級的更多標記數據(超過 600,000 個數字圖像),并且來自一個更難、未解決的現實世界問題(識別自然場景圖像中的數字和數字)。SVHN 是從谷歌街景圖像中的門牌號獲得的。

3D MNIST 數字識別圖像數據
數據集下載地址:http://m6z.cn/5SUfEd
該數據集的目的是提供一種簡單的方法來開始處理 3D 計算機視覺問題,例如 3D 形狀識別。

文檔影印和內容數據
數據集下載地址:http://m6z.cn/6nF67S
MediaTeam Oulu Document 數據集是一個文檔掃描圖像和文檔內容數據集,包含 500篇 1975年之前的文檔信息。

貓咪數據集
數據集下載地址:http://m6z.cn/5TAgbw
CAT 數據集包括超過 9,000 張貓圖像。對于每張圖像,貓的頭部都有九個點的注釋,眼睛兩個,嘴巴一個,耳朵六個。

CBCL 街道場景數據
數據集下載地址:http://m6z.cn/5TAgeA
StreetScenes Challenge Framework 是用于對象檢測的圖像、注釋、軟件和性能測量的集合。每張圖像都是從馬薩諸塞州波士頓及其周邊地區(qū)的 DSC-F717 相機拍攝的。然后用圍繞 9 個對象類別的每個示例的多邊形手動標記每個圖像,包括 [汽車、行人、自行車、建筑物、樹木、天空、道路、人行道和商店]。這些圖像的標記是在仔細檢查下完成的,以確保對象總是以相同的方式標記,關于遮擋和其他常見的圖像變換。

小目標檢測數據集
數據集下載地址:http://m6z.cn/616t6R
從Internet(例如YouTube或Google)上的圖像/視頻收集的四個小物體數據集,包括4種類型的圖像,可用于小物體目標檢測的研究。
數據集包含四類:
fly:飛行數據集,包含600個視頻幀,平均每幀86±39個物體(648×72 @ 30 fps)。32張圖像用于訓練(1:6:187),50張圖像用于測試(301:6:600)。
honeybee:蜜蜂數據集,包含118張圖像,每張圖像平均有28±6個蜜蜂(640×480)。數據集被平均分配用于訓練和測試集。僅前32張圖像用于訓練。
seagull:海鷗數據集,包含三個高分辨率圖像(624×964),每個圖像平均有866±107個海鷗。第一張圖片用于訓練,其余圖片用于測試。
fish:魚數據集,包含387幀視頻數據,平均每幀56±9條魚(300×410 @ 30 fps)。32張圖像進行訓練(1:3:94),65張圖像進行測試(193:3:387)。
斯坦福狗狗數據集
數據集下載地址:http://m6z.cn/6nF6kM
斯坦福狗數據集包含來自世界各地的 120 種狗的圖像。該數據集是使用 ImageNet 中的圖像和注釋構建的,用于細粒度圖像分類任務。
該數據集的內容:
類別數:120
圖片數量:20,580
注釋:類標簽、邊界框

標注魚類數據集
數據集下載地址:http://m6z.cn/616t8X
野生圖像數據集中的標記魚類由 NOAA Fisheries(國家海洋漁業(yè)服務局)提供,以鼓勵對無約束水下圖像的自動圖像分析算法進行開發(fā)、測試和性能評估。
該數據集包括魚類、無脊椎動物和海床的圖像,這些圖像是使用部署在遠程操作車輛 (ROV) 上的攝像系統收集的,用于漁業(yè)調查。

Stanford 汽車圖片數據
數據集下載地址:http://m6z.cn/616wop
Cars 數據集包含 196 類汽車的 16,185 張圖像。數據分為 8,144 個訓練圖像和 8,041 個測試圖像,其中每個類別大致按 50-50 分割。課程通常在品牌、型號、年份級別,例如 2012 Tesla Model S 或 2012 BMW M3 coupe。
