手機站首頁散文詩歌雜文隨筆日記小小說

散文網 » 生活 »日常 » 小目標檢測、圖像分類、圖像識別等開源數據集匯總

小目標檢測、圖像分類、圖像識別等開源數據集匯總

2022-03-28 09:57 作者:極市平臺 0人讀過 | 我要投稿

編輯丨極市平臺

寵物圖像數據集

數據集下載地址：http://m6z.cn/5TAgdC

一個包含 37 個類別的寵物數據集，每個類別大約有 200 張圖像。這些圖像在比例、姿勢和照明方面有很大的變化。所有圖像都有相關的品種、頭部 ROI 和像素級三元圖分割的地面實況注釋。

街景門牌號 (SVHN) 數據集

數據集下載地址：http://m6z.cn/5ExMWb

SVHN 是一個真實世界的圖像數據集，用于開發(fā)機器學習和對象識別算法，對數據預處理和格式化的要求最低。它可以被視為與MNIST風格相似（例如，圖像是經過裁剪的小數字），但包含一個數量級的更多標記數據（超過 600,000 個數字圖像），并且來自一個更難、未解決的現實世界問題（識別自然場景圖像中的數字和數字）。SVHN 是從谷歌街景圖像中的門牌號獲得的。

3D MNIST 數字識別圖像數據

數據集下載地址：http://m6z.cn/5SUfEd

該數據集的目的是提供一種簡單的方法來開始處理 3D 計算機視覺問題，例如 3D 形狀識別。

文檔影印和內容數據

數據集下載地址：http://m6z.cn/6nF67S

MediaTeam Oulu Document 數據集是一個文檔掃描圖像和文檔內容數據集，包含 500篇 1975年之前的文檔信息。

貓咪數據集

數據集下載地址：http://m6z.cn/5TAgbw

CAT 數據集包括超過 9,000 張貓圖像。對于每張圖像，貓的頭部都有九個點的注釋，眼睛兩個，嘴巴一個，耳朵六個。

CBCL 街道場景數據

數據集下載地址：http://m6z.cn/5TAgeA

StreetScenes Challenge Framework 是用于對象檢測的圖像、注釋、軟件和性能測量的集合。每張圖像都是從馬薩諸塞州波士頓及其周邊地區(qū)的 DSC-F717 相機拍攝的。然后用圍繞 9 個對象類別的每個示例的多邊形手動標記每個圖像，包括 [汽車、行人、自行車、建筑物、樹木、天空、道路、人行道和商店]。這些圖像的標記是在仔細檢查下完成的，以確保對象總是以相同的方式標記，關于遮擋和其他常見的圖像變換。

小目標檢測數據集

數據集下載地址：http://m6z.cn/616t6R

從Internet（例如YouTube或Google）上的圖像/視頻收集的四個小物體數據集，包括4種類型的圖像，可用于小物體目標檢測的研究。

數據集包含四類：

fly：飛行數據集，包含600個視頻幀，平均每幀86±39個物體（648×72 @ 30 fps）。32張圖像用于訓練（1：6：187），50張圖像用于測試（301：6：600）。
honeybee：蜜蜂數據集，包含118張圖像，每張圖像平均有28±6個蜜蜂（640×480）。數據集被平均分配用于訓練和測試集。僅前32張圖像用于訓練。
seagull：海鷗數據集，包含三個高分辨率圖像（624×964），每個圖像平均有866±107個海鷗。第一張圖片用于訓練，其余圖片用于測試。
fish：魚數據集，包含387幀視頻數據，平均每幀56±9條魚（300×410 @ 30 fps）。32張圖像進行訓練（1：3：94），65張圖像進行測試（193：3：387）。

斯坦福狗狗數據集

數據集下載地址：http://m6z.cn/6nF6kM

斯坦福狗數據集包含來自世界各地的 120 種狗的圖像。該數據集是使用 ImageNet 中的圖像和注釋構建的，用于細粒度圖像分類任務。

該數據集的內容：

類別數：120
圖片數量：20,580
注釋：類標簽、邊界框

標注魚類數據集

數據集下載地址：http://m6z.cn/616t8X

野生圖像數據集中的標記魚類由 NOAA Fisheries（國家海洋漁業(yè)服務局）提供，以鼓勵對無約束水下圖像的自動圖像分析算法進行開發(fā)、測試和性能評估。

該數據集包括魚類、無脊椎動物和海床的圖像，這些圖像是使用部署在遠程操作車輛 (ROV) 上的攝像系統收集的，用于漁業(yè)調查。

Stanford 汽車圖片數據

數據集下載地址：http://m6z.cn/616wop

Cars 數據集包含 196 類汽車的 16,185 張圖像。數據分為 8,144 個訓練圖像和 8,041 個測試圖像，其中每個類別大致按 50-50 分割。課程通常在品牌、型號、年份級別，例如 2012 Tesla Model S 或 2012 BMW M3 coupe。

標簽：