80+開源數(shù)據(jù)集資源匯總(包含目標檢測、醫(yī)學影像、關鍵點檢測、工業(yè)檢測等方向)
數(shù)據(jù)集下載匯總鏈接:https://www.cvmart.net/dataSets數(shù)據(jù)集將會不斷更新,歡迎大家持續(xù)關注!
小目標檢測
AI-TOD航空圖像數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://m6z.cn/5MjlYkAI-TOD 在 28,036 張航拍圖像中包含 8 個類別的 700,621 個對象實例。與現(xiàn)有航拍圖像中的目標檢測數(shù)據(jù)集相比,AI-TOD 中目標的平均大小約為 12.8 像素,遠小于其他數(shù)據(jù)集。

iSAID航空圖像大規(guī)模數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://m6z.cn/6nUrYe現(xiàn)有的 Earth Vision 數(shù)據(jù)集要么適用于語義分割,要么適用于對象檢測。iSAID 是第一個用于航空圖像實例分割的基準數(shù)據(jù)集。這個大規(guī)模和密集注釋的數(shù)據(jù)集包含 2,806 張高分辨率圖像的 15 個類別的 655,451 個對象實例。iSAID 的顯著特征如下:(a) 大量具有高空間分辨率的圖像,(b) 十五個重要且常見的類別,(c) 每個類別的大量實例,(d) 每個類別的大量標記實例圖像,這可能有助于學習上下文信息,(e) 巨大的對象尺度變化,通常在同一圖像內包含小、中和大對象,(f) 圖像內具有不同方向的對象的不平衡和不均勻分布,描繪真實-生活空中條件,(g)幾個小尺寸物體,外觀模糊,只能通過上下文推理來解決,(h)由專業(yè)注釋者執(zhí)行的精確實例級注釋,由符合良好規(guī)范的專家注釋者交叉檢查和驗證定義的指導方針。

TinyPerson數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://m6z.cn/6vqF3T在 TinyPerson 中有 1610 個標記圖像和 759 個未標記圖像(兩者主要來自同一視頻集),總共有 72651 個注釋。

Deepscores 數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://m6z.cn/5xgYdYDeepScores 數(shù)據(jù)集的目標是推進小物體識別的最新技術,并將物體識別問題置于場景理解的背景下。DeepScores 包含高質量的樂譜圖像,分為 300 0 000 張書面音樂,其中包含不同形狀和大小的符號。擁有近一億個小對象,這使得我們的數(shù)據(jù)集不僅獨一無二,而且是最大的公共數(shù)據(jù)集。DeepScores 帶有用于對象分類、檢測和語義分割的基本事實。因此,DeepScores 總體上對計算機視覺提出了相關挑戰(zhàn),超出了光學音樂識別 (OMR) 研究的范圍。

密集行人檢測數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://m6z.cn/6nUs1CWiderPerson 數(shù)據(jù)集是野外行人檢測基準數(shù)據(jù)集,其圖像選自廣泛的場景,不再局限于交通場景。我們選擇了 13,382 張圖像并標記了大約 400K 帶有各種遮擋的注釋。我們隨機選擇 8000/1000/4382 圖像作為訓練、驗證和測試子集。與 CityPersons 和 WIDER FACE 數(shù)據(jù)集類似,我們不發(fā)布測試圖像的邊界框基本事實。用戶需要提交最終的預測文件,我們將進行評估。

加州理工學院行人檢測數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://m6z.cn/5N3Yk7加州理工學院行人數(shù)據(jù)集由大約 10 小時的 640x480 30Hz 視頻組成,該視頻取自在城市環(huán)境中通過常規(guī)交通行駛的車輛。注釋了大約 250,000 幀(在 137 個大約分鐘長的片段中),總共 350,000 個邊界框和 2300 個獨特的行人。注釋包括邊界框和詳細的遮擋標簽之間的時間對應關系。

NWPU VHR-10衛(wèi)星圖像數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://m6z.cn/5UAbEWNWPU VHR-10 Dataset 是一個用于空間物體檢測的 10 級地理遙感數(shù)據(jù)集,其擁有 650 張包含目標的圖像和 150 張背景圖像,共計 800 張,目標種類包括飛機、艦船、油罐、棒球場、網(wǎng)球場、籃球場、田徑場、港口、橋梁和汽車共計 10 個類別。該數(shù)據(jù)集由西北工業(yè)大學于 2014 年發(fā)布,相關論文有《Multi-class geospatial object detection and geographic imageclassification based on collection of part detectors》、《A survey on objectdetection in optical remote sensing images》和《Learningrotation-invariant convolutional neural networks for object detection in VHRoptical remote sensing images》。

Inria 航空影像數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://m6z.cn/6nUs6sInria 航空影像標注解決了遙感中的一個核心主題:航空影像的自動像素級標注(論文鏈接)。數(shù)據(jù)集特點:
覆蓋面積 810 平方公里(405 平方公里用于訓練,405 平方公里用于測試)
空間分辨率為 0.3 m 的航空正射校正彩色圖像
兩個語義類的地面實況數(shù)據(jù):構建和非構建(僅針對訓練子集公開披露)
這些圖像涵蓋了不同的城市住區(qū),從人口稠密的地區(qū)(例如,舊金山的金融區(qū))到高山城鎮(zhèn)(例如,奧地利蒂羅爾的 Lienz)。

RSOD遙感圖像數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://m6z.cn/5EN96H它是一個開放的遙感圖像目標檢測數(shù)據(jù)集。數(shù)據(jù)集包括飛機、油箱、游樂場和立交橋。此數(shù)據(jù)集的格式為PASCAL VOC。數(shù)據(jù)集包括4個文件,每個文件用于一種對象。
飛機數(shù)據(jù)集,446張圖片中有4993架飛機。
操場,189張圖片中的191個操場。
天橋,176張圖片中的180座天橋。
油箱,165張圖片中的1586個油箱。
小目標檢測數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://m6z.cn/616t6R從Internet(例如YouTube或Google)上的圖像/視頻收集的四個小物體數(shù)據(jù)集,包括4種類型的圖像,可用于小物體目標檢測的研究。數(shù)據(jù)集包含四類:
fly:飛行數(shù)據(jù)集,包含600個視頻幀,平均每幀86±39個物體(648×72 @ 30 fps)。32張圖像用于訓練(1:6:187),50張圖像用于測試(301:6:600)。
honeybee:蜜蜂數(shù)據(jù)集,包含118張圖像,每張圖像平均有28±6個蜜蜂(640×480)。數(shù)據(jù)集被平均分配用于訓練和測試集。僅前32張圖像用于訓練。
seagull:海鷗數(shù)據(jù)集,包含三個高分辨率圖像(624×964),每個圖像平均有866±107個海鷗。第一張圖片用于訓練,其余圖片用于測試。
fish:魚數(shù)據(jù)集,包含387幀視頻數(shù)據(jù),平均每幀56±9條魚(300×410 @ 30 fps)。32張圖像進行訓練(1:3:94),65張圖像進行測試(193:3:387)。

目標檢測開源數(shù)據(jù)集
COCO2017數(shù)據(jù)集
COCO2017是2017年發(fā)布的COCO數(shù)據(jù)集的一個版本,主要用于COCO在2017年后持有的物體檢測任務、關鍵點檢測任務和全景分割任務。

火焰和煙霧圖像數(shù)據(jù)集
數(shù)據(jù)集鏈接:http://m6z.cn/6fzn0f該數(shù)據(jù)集由早期火災和煙霧的圖像數(shù)據(jù)集組成。數(shù)據(jù)集由在真實場景中使用手機拍攝的早期火災和煙霧圖像組成。大約有7000張圖像數(shù)據(jù)。圖像是在各種照明條件(室內和室外場景)、天氣等條件下拍攝的。該數(shù)據(jù)集非常適合早期火災和煙霧探測。數(shù)據(jù)集可用于火災和煙霧識別、檢測、早期火災和煙霧、異常檢測等。數(shù)據(jù)集還包括典型的家庭場景,如垃圾焚燒、紙塑焚燒、田間作物焚燒、家庭烹飪等。本文僅含100張左右。

DOTA航拍圖像數(shù)據(jù)集
數(shù)據(jù)集鏈接:http://m6z.cn/6vIKlJDOTA是用于航空圖像中目標檢測的大型數(shù)據(jù)集。它可以用于開發(fā)和評估航空圖像中的目標探測器。這些圖像是從不同的傳感器和平臺收集的。每個圖像的大小在800×800到20000×20000像素之間,包含顯示各種比例、方向和形狀的對象。DOTA圖像中的實例由航空圖像解釋專家通過任意(8 d.o.f.)四邊形進行注釋。

AITEX數(shù)據(jù)集
數(shù)據(jù)集鏈接:http://m6z.cn/5DdJL1該數(shù)據(jù)庫由七個不同織物結構的245張4096 x 256像素圖像組成。數(shù)據(jù)庫中有140個無缺陷圖像,每種類型的織物20個,除此之外,有105幅紡織行業(yè)中常見的不同類型的織物缺陷(12種缺陷)圖像。圖像的大尺寸允許用戶使用不同的窗口尺寸,從而增加了樣本數(shù)量。

T-LESS數(shù)據(jù)集
數(shù)據(jù)集鏈接:http://m6z.cn/5wnucm該數(shù)據(jù)集采集的目標為工業(yè)應用、紋理很少的目標,同時缺乏區(qū)別性的顏色,且目標具有對稱性和互相關性,數(shù)據(jù)集由三個同步的傳感器獲得,一個結構光傳感器,一個RGBD sensor,一個高分辨率RGBsensor,從每個傳感器分別獲得了3.9w訓練集和1w測試集,此外為每個目標創(chuàng)建了2個3D model,一個是CAD手工制作的另一個是半自動重建的。訓練集圖片的背景大多是黑色的,而測試集的圖片背景很多變,會包含不同光照、遮擋等等變換(之所以這么做作者說是為了使任務更具有挑戰(zhàn)性)。同時作者解釋了本數(shù)據(jù)集的優(yōu)勢在于:1.大量跟工業(yè)相關的目標;2.訓練集都是在可控的環(huán)境下抓取的;3.測試集有大量變換的視角;4.圖片是由同步和校準的sensor抓取的;5.準確的6D pose標簽;6.每個目標有兩種3D模型;
H2O 行人交互檢測數(shù)據(jù)集
數(shù)據(jù)集鏈接:http://m6z.cn/6fzmQfH2O由V-COCO數(shù)據(jù)集中的10301張圖像組成,其中添加了3635張圖像,這些圖像主要包含人與人之間的互動。所有的H2O圖像都用一種新的動詞分類法進行了注釋,包括人與物和人與人之間的互動。該分類法由51個動詞組成,分為5類:
描述主語一般姿勢的動詞
與主語移動方式有關的動詞
與賓語互動的動詞
描述人與人之間互動的動詞
涉及力量或暴力的互動動詞

SpotGarbage垃圾識別數(shù)據(jù)集
數(shù)據(jù)集鏈接:http://m6z.cn/5ZMmRG圖像中的垃圾(GINI)數(shù)據(jù)集是SpotGarbage引入的一個數(shù)據(jù)集,包含2561張圖像,956張圖像包含垃圾,其余的是在各種視覺屬性方面與垃圾非常相似的非垃圾圖像。

NAO自然界對抗樣本數(shù)據(jù)集
數(shù)據(jù)集鏈接:http://m6z.cn/5KJWJANAO包含7934張圖像和9943個對象,這些圖像未經修改,代表了真實世界的場景,但會導致最先進的檢測模型以高置信度錯誤分類。與標準MSCOCO驗證集相比,在NAO上評估時,EfficientDet-D7的平均精度(mAP)下降了74.5%。

Labelme 圖像數(shù)據(jù)集
數(shù)據(jù)集鏈接:http://m6z.cn/5Sg9NXLabelme Dataset 是用于目標識別的圖像數(shù)據(jù)集,涵蓋 1000 多個完全注釋和 2000 個部分注釋的圖像,其中部分注釋圖像可以被用于訓練標記算法 ,測試集擁有來自于世界不同地方拍攝的圖像,這可以保證圖片在續(xù)聯(lián)和測試之間會有較大的差異。該數(shù)據(jù)集由麻省理工學院 –計算機科學和人工智能實驗室于 2007 年發(fā)布,相關論文有《LabelMe: a database and web-based tool for image annotation》。

印度車輛數(shù)據(jù)集
數(shù)據(jù)集鏈接:http://m6z.cn/6uxAIx該數(shù)據(jù)集包括小眾印度車輛的圖像,如Autorikshaw、Tempo、卡車等。該數(shù)據(jù)集由用于分類和目標檢測的小眾印度車輛圖像組成。據(jù)觀察,這些小眾車輛(如autorickshaw、tempo、trucks等)上幾乎沒有可用的數(shù)據(jù)集。這些圖像是在白天、晚上和晚上的不同天氣條件下拍攝的。該數(shù)據(jù)集具有各種各樣的照明、距離、視點等變化。該數(shù)據(jù)集代表了一組非常具有挑戰(zhàn)性的利基類車輛圖像。該數(shù)據(jù)集可用于駕駛員輔助系統(tǒng)、自動駕駛等的圖像識別和目標檢測。

Seeing 3D chairs椅子檢測模型
數(shù)據(jù)集鏈接:http://m6z.cn/5DdK0v椅子數(shù)據(jù)集包含大約1000個不同三維椅子模型的渲染圖像。

SUN09場景理解數(shù)據(jù)集
數(shù)據(jù)集鏈接:http://m6z.cn/60wX8rSUN09數(shù)據(jù)集包含12000個帶注釋的圖像,其中包含200多個對象類別。它由自然、室內和室外圖像組成。每個圖像平均包含7個不同的注釋對象,每個對象的平均占用率為圖像大小的5%。對象類別的頻率遵循冪律分布。發(fā)布者使用 397 個采樣良好的類別進行場景識別,并以此搭配最先進的算法建立新的性能界限。
該數(shù)據(jù)集由普林斯頓視覺與機器人實驗室于 2014 年發(fā)布,相關論文有《SUN Database: Large-scale Scene Recognition from Abbey to Zoo》、《SUN Database: Exploring a Large Collection of Scene Categories》。
Unsplash圖片檢索數(shù)據(jù)集數(shù)據(jù)集鏈接:http://m6z.cn/5wnuoM使用迄今為止公開共享的全球最大的開放檢索信息數(shù)據(jù)集。Unsplash數(shù)據(jù)集由250000多名貢獻攝影師創(chuàng)建,并包含了數(shù)十億次照片搜索的信息和對應的照片信息。由于Unsplash數(shù)據(jù)集中包含廣泛的意圖和語義,它為研究和學習提供了新的機會。

HICO-DET人物交互檢測數(shù)據(jù)集
數(shù)據(jù)集鏈接:http://m6z.cn/5DdK6DHICO-DET是一個用于檢測圖像中人-物交互(HOI)的數(shù)據(jù)集。它包含47776幅圖像(列車組38118幅,測試組9658幅),600個HOI類別,由80個賓語類別和117個動詞類別構成。HICO-DET提供了超過150k個帶注釋的人類對象對。V-COCO提供了10346張圖像(2533張用于培訓,2867張用于驗證,4946張用于測試)和16199人的實例。
上??萍即髮W人群統(tǒng)計數(shù)據(jù)集
數(shù)據(jù)集鏈接:http://m6z.cn/5Sgafn上海科技數(shù)據(jù)集是一個大規(guī)模的人群統(tǒng)計數(shù)據(jù)集。它由1198張帶注釋的群組圖像組成。數(shù)據(jù)集分為兩部分,A部分包含482張圖像,B部分包含716張圖像。A部分分為訓練和測試子集,分別由300和182張圖像組成。B部分分為400和316張圖像組成的序列和測試子集。群組圖像中的每個人都有一個靠近頭部中心的點進行注釋??偟膩碚f,該數(shù)據(jù)集由33065名帶注釋的人組成。A部分的圖像是從互聯(lián)網(wǎng)上收集的,而B部分的圖像是在上海繁忙的街道上收集的。
生活垃圾數(shù)據(jù)集
數(shù)據(jù)集鏈接:http://m6z.cn/6n5Adu大約9000多張獨特的圖片。該數(shù)據(jù)集由印度國內常見垃圾對象的圖像組成。圖像是在各種照明條件、天氣、室內和室外條件下拍攝的。該數(shù)據(jù)集可用于制作垃圾/垃圾檢測模型、環(huán)保替代建議、碳足跡生成等。
RMFD口罩遮擋人臉數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://m6z.cn/61z9Fv當前大多數(shù)高級人臉識別方法都是基于深度學習而設計的,深度學習取決于大量人臉樣本。但是,目前尚沒有公開可用的口罩遮擋人臉識別數(shù)據(jù)集。為此,這項工作提出了三種類型的口罩遮擋人臉數(shù)據(jù)集,包括口罩遮擋人臉檢測數(shù)據(jù)集(MFDD),真實口罩遮擋人臉識別數(shù)據(jù)集(RMFRD)和模擬口罩遮擋人臉識別數(shù)據(jù)集(SMFRD)?;谶@些數(shù)據(jù)集,可以開發(fā)口罩遮擋人臉的各種應用。本項目開發(fā)的多粒度口罩遮擋人臉識別模型可達到95%的準確性,超過了行業(yè)報告的結果。
GTSRB德國交通標志數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://m6z.cn/5wJJLA德國交通標志基準測試是在 2011 年國際神經網(wǎng)絡聯(lián)合會議 (IJCNN) 上舉辦的多類單圖像分類挑戰(zhàn)賽。我們誠邀相關領域的研究人員參與:該比賽旨在參與者無需特殊領域知識。我們的基準測試具有以下屬性:
單圖像、多類分類問題
40多個分類
總共超過 50,000 張圖片
逼真的大型數(shù)據(jù)庫
VOC2005車輛數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://m6z.cn/5U2X4u該數(shù)據(jù)集中含有自行車、摩托車、汽車、貨車的圖像數(shù)據(jù),可用于CNN模型以實現(xiàn)車輛識別和車輛分類,其中自行車、摩托車、汽車數(shù)據(jù)來自2005 PASCAL視覺類挑戰(zhàn)賽(VOC2005)所使用的數(shù)據(jù)的篩選處理結果,貨車圖片來自網(wǎng)絡收集,后期通過篩選處理得到。在本數(shù)據(jù)中,訓練數(shù)據(jù)集與測試數(shù)據(jù)集占比約為5:1。
Winegrape檢測數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://m6z.cn/5TikF9WGISD(Wine Grape Instance Segmentation Dataset)是為了提供圖像和注釋來研究對象檢測和實例分割,用于葡萄栽培中基于圖像的監(jiān)測和現(xiàn)場機器人技術。它提供了來自五種不同葡萄品種的實地實例。這些實例顯示了葡萄姿勢、光照和焦點的變化,包括遺傳和物候變化,如形狀、顏色和緊實度??赡艿挠猛景ǚ艑拰嵗指顔栴}:分類(圖像中是否有葡萄?)、語義分割(圖像中的“葡萄像素”是什么?)、對象檢測(圖像中的葡萄在哪里?)、和計數(shù)(每個簇有多少漿果?)。
全球小麥檢測數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://m6z.cn/5wJK64檢測小麥穗是一項重要任務,可以估計相關性狀,包括穗種群密度和穗特征,如衛(wèi)生狀況、大小、成熟階段和芒的存在。本數(shù)據(jù)集包含 4,700 張高分辨率 RGB 圖像和 190,000 個標記的小麥頭,這些小麥頭采集自世界各地不同生長階段的不同基因型的多個國家。
Linkopings交通標志數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://m6z.cn/68ldS0通過記錄超過 350 公里的瑞典高速公路和城市道路的序列,創(chuàng)建了一個數(shù)據(jù)集。一個 1.3 兆像素的彩色攝像機,一個點灰色變色龍,被放置在一輛汽車的儀表板上,從前窗向外看。攝像頭略微指向右側,以便盡可能多地覆蓋相關標志。該鏡頭的焦距為 6.5 毫米,視野約為 41 度。高速公路上的典型速度標志大約為 90 cm 寬,如果要在大約 30 m 的距離處檢測到它們,則對應于大約 50 像素的大小??偣灿涗浟顺^ 20 000 幀,其中每五幀被手動標記。每個標志的標簽包含標志類型(人行橫道、指定車道右側、禁止站立或停車、優(yōu)先道路、讓路、50 公里/小時或 30 公里/小時)、能見度狀態(tài)(遮擋、模糊或可見)和道路狀態(tài)(是否標志是在正在行駛的道路上或在小路上)。
防護裝備-頭盔和背心檢測
數(shù)據(jù)集下載地址:http://m6z.cn/61zarT包含 774 個眾包圖像和 698 個網(wǎng)絡挖掘圖像。眾包和網(wǎng)絡挖掘的圖像分別包含 2,496 和 2,230 個工人實例。
加州理工學院相機陷阱數(shù)據(jù)集
數(shù)據(jù)集鏈接:https://beerys.github.io/CaltechCameraTraps/該數(shù)據(jù)集包含來自美國西南部 140 個攝像頭位置的 243,100 張圖像,帶有 21 個動物類別的標簽(加上空白),主要是在物種級別(例如,最常見的標簽是負鼠、浣熊和土狼),以及 大約 66,000 個邊界框注釋。大約 70% 的圖像被標記為空。
水下垃圾檢測數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://m6z.cn/6nnDQK該數(shù)據(jù)來自 J-EDI 海洋垃圾數(shù)據(jù)集。構成該數(shù)據(jù)集的視頻在質量、深度、場景中的對象和使用的相機方面差異很大。它們包含許多不同類型的海洋垃圾的圖像,這些圖像是從現(xiàn)實世界環(huán)境中捕獲的,提供了處于不同衰減、遮擋和過度生長狀態(tài)的各種物體。此外,水的清晰度和光的質量因視頻而異。這些視頻經過處理以提取 5,700 張圖像,這些圖像構成了該數(shù)據(jù)集,所有圖像都在垃圾實例、植物和動物等生物對象以及 ROV 上標有邊界框。
醫(yī)學影像
3D-IRCADB 臟器分割數(shù)據(jù)集
數(shù)據(jù)集鏈接:http://m6z.cn/6x5OSn3D-IRCADb-01 數(shù)據(jù)庫由 10 名女性和 10 名男性 75% 的肝腫瘤患者的 3D CT 掃描組成。20個文件夾對應20個不同的患者,可以單獨下載也可以聯(lián)合下載。下表提供了圖像信息,例如肝臟大?。▽挾取⑸疃?、高度)或根據(jù) Couninaud 分割的腫瘤位置。它還表明肝臟分割軟件可能遇到的主要困難是由于與鄰近器官的接觸、肝臟的非典型形狀或密度,甚至圖像中的偽影。
FASCICLE 小腿肌肉超聲數(shù)據(jù)集
數(shù)據(jù)集鏈接:http://m6z.cn/631rexFAscicle 小腿肌肉超聲數(shù)據(jù)集是一個由 812 幅小腿肌肉超聲圖像組成的數(shù)據(jù)集,用于分析肌肉弱點并預防受傷。該數(shù)據(jù)集在文章 AW-Net:B 型超聲圖像上的自動肌肉結構分析以預防傷害中進行了介紹。它結合了由 Ryan Cunningham 等人發(fā)表的兩篇文章“使用卷積、殘差和反卷積神經網(wǎng)絡從 B 模式超聲圖像中估計全區(qū)域骨骼肌纖維方向”提供的數(shù)據(jù)集。和 Neil Cronin 發(fā)表的“使用深度學習對肌肉骨骼超聲圖像進行自動分析”,并附有補充注釋。該 zip 文件包含兩個數(shù)據(jù)集,分別分為兩個由其作者命名的文件夾。每個數(shù)據(jù)集的每個圖像都有一個匹配的分束分割掩碼和一個可按名稱識別的腱膜分割掩碼。
腫瘤數(shù)據(jù)集
數(shù)據(jù)集鏈接:http://m6z.cn/5zCyGj這一數(shù)據(jù)集是通過仔細注釋幾名患有不同器官腫瘤并在多家醫(yī)院被診斷出的患者的組織圖像獲得的。該數(shù)據(jù)集是通過從TCGA存檔下載以 40 倍放大倍率捕獲的 H&E 染色組織圖像創(chuàng)建的。H&E 染色是增強組織切片對比度的常規(guī)方案,通常用于腫瘤評估(分級、分期等)。考慮到多個器官和患者的細胞核外觀的多樣性,以及多家醫(yī)院采用的豐富染色方案,訓練數(shù)據(jù)集將能夠開發(fā)出開箱即用的穩(wěn)健且可推廣的細胞核分割技術。
結直腸腺癌組織學圖像數(shù)據(jù)集
數(shù)據(jù)集鏈接:http://m6z.cn/6axBLk該數(shù)據(jù)集包含 100 張 H&E 染色的結直腸腺癌組織學圖像。出于檢測目的,在中心/周圍共標記了 29,756 個原子核。其中,有 22,444 個細胞核也具有相關的類別標簽,即上皮細胞、炎癥細胞、成纖維細胞和其他細胞核。
淋巴結切片的組織病理學數(shù)據(jù)集
數(shù)據(jù)集鏈接:http://m6z.cn/6axBNq本數(shù)據(jù)集由從淋巴結切片的組織病理學掃描中提取的 327.680 張彩色圖像 (96 x 96px) 組成。每個圖像都帶有一個二進制標簽,表示存在轉移組織。PCam 為機器學習模型提供了新的基準:大于 CIFAR10,小于 imagenet,可在單個 GPU 上訓練。
m2caiSeg腹腔鏡圖像數(shù)據(jù)集
數(shù)據(jù)集鏈接:http://m6z.cn/5yW8q0m2caiSeg是根據(jù)真實世界外科手術的內窺鏡視頻源創(chuàng)建的。數(shù)據(jù)由 307 張圖像組成,每張圖像都針對場景中存在的器官和不同的手術器械進行了注釋。

血細胞圖像數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://m6z.cn/5zdTDb該數(shù)據(jù)集包含 12,500 張帶有細胞類型標簽 (CSV) 的增強血細胞圖像 (JPEG)。4 種不同細胞類型中的每一種都有大約 3,000 張圖像,這些圖像被分組到 4 個不同的文件夾中(根據(jù)細胞類型)。細胞類型是嗜酸性粒細胞、淋巴細胞、單核細胞和中性粒細胞。

腦腫瘤 MRI 數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://m6z.cn/63iHcV該數(shù)據(jù)集包含7022張人腦 MRI 圖像,分為 4 類:膠質瘤-腦膜瘤-無腫瘤和垂體。注意這個數(shù)據(jù)集中的圖像大小是不同的。您可以在預處理并去除多余的邊距后將圖像調整為所需的大小。

糖尿病性黃斑水腫的OCT圖像數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://m6z.cn/6xn7cp使用杜克企業(yè)數(shù)據(jù)統(tǒng)一內容瀏覽器搜索引擎追溯識別杜克眼科中心醫(yī)學視網(wǎng)膜實踐中的患者,并使用與他們就診相關的 DME (ICD-9 362.07) 計費代碼。然后,一名眼科醫(yī)生使用標準 Spectralis(Heidelberg Engineering,Heidelberg,Germany)61 線體積掃描協(xié)議確定了 6 名臨床成像的患者,這些患者具有嚴重的 DME 病理學和不同的圖像質量。

身體部位X射線圖像數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://m6z.cn/5yth1K本數(shù)據(jù)集收集了來自身體各部位的X光圖片

眼病深度學習數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://m6z.cn/5yth3m712張片狀角膜潰瘍的眼部染色圖像

皮膚病數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://m6z.cn/6pQW7A23類皮膚病的圖像數(shù)據(jù),圖像總數(shù)約為 19,500 張,其中大約 15,500 張已在訓練集中分割,其余在測試集中分割。
心臟病發(fā)作分析和預測數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://m6z.cn/6ikH8v本數(shù)據(jù)集含有303名心臟病患者的數(shù)據(jù)。

膝關節(jié) X 射線圖像數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://m6z.cn/6aOU5G該數(shù)據(jù)集包括從知名醫(yī)院和診斷中心收集的 1650 張膝關節(jié)電子 X 射線圖像。X 射線圖像是使用 PROTEC PRS 500E X 射線機獲取的。原始圖像是 8 位灰度圖像。每個 X 射線膝關節(jié) X 射線圖像均由 2 位醫(yī)學專家根據(jù) Kellgren 和 Lawrence 等級手動注釋/標記。

關鍵點檢測
手部姿勢關鍵點檢測數(shù)據(jù)集
數(shù)據(jù)集下載鏈接:http://u3v.cn/6d3lZV數(shù)據(jù)集由序列構成。在每個序列中,您都可以找到組成它的幀。一個幀由4個彩色圖像、4組投影在每個圖像平面中的2D關節(jié)、4個邊界框、1組Leap Motion Controller提供的3D點和4組重新投影到每個相機坐標幀的3D點組成。

動物姿勢數(shù)據(jù)集
數(shù)據(jù)集下載鏈接:http://u3v.cn/6kDLfr該數(shù)據(jù)集提供了五個類別的動物姿勢注釋:狗、貓、牛、馬、羊,在4,000 多張圖像中總共有6,000多個實例。此外,該數(shù)據(jù)集還包含其他7 個動物類別的邊界框注釋。在論文中查找詳細信息。一共標注了 20 個關鍵點:兩只眼睛、喉嚨、鼻子、馬肩隆、兩個耳根、尾根、四個肘部、四個膝蓋、四個爪子。

電影人物關節(jié)關鍵點數(shù)據(jù)集
數(shù)據(jù)集下載鏈接:http://u3v.cn/5tW5zx該數(shù)據(jù)集從流行的好萊塢電影中自動收集了5003個圖像數(shù)據(jù)。這些圖像是通過在30部電影的每10幀上運行一個最先進的人檢測器獲得的。然后,被高度自信地檢測到的人(大約2萬名候選人)被送往眾包市場亞馬遜機械土耳其公司(Amazon Mechanical Turk),以獲得地面真實標簽。每幅圖片都由五名特克斯人以0.01美元的價格標注,以標注10個上身關節(jié)。在每個圖像中取五個標記的中位數(shù),以對離群值注釋保持穩(wěn)健。
MPIIGaze Dataset
數(shù)據(jù)集下載鏈接:http://u3v.cn/5BsiEeMPIIGaze數(shù)據(jù)集包含在三個多月的日常筆記本電腦使用過程中從15名參與者收集的213659張圖像。在外觀和照明方面,數(shù)據(jù)集比現(xiàn)有的數(shù)據(jù)集變化更大。

人體足部關鍵點數(shù)據(jù)集
數(shù)據(jù)集下載鏈接:http://u3v.cn/5IYvIV現(xiàn)有的人體姿勢數(shù)據(jù)集包含有限的身體部位類型。MPII 數(shù)據(jù)集標注了腳踝、膝蓋、臀部、肩膀、肘部、手腕、頸部、軀干和頭頂,而 COCO 還包括一些面部關鍵點。對于這兩個數(shù)據(jù)集,足部注釋僅限于腳踝位置。然而,圖形應用程序(例如頭像重定向或 3D 人體形狀重建)需要足部關鍵點,例如大腳趾和腳跟。在沒有足部信息的情況下,這些方法會遇到諸如糖果包裝效果、地板穿透和足部滑冰等問題。為了解決這些問題,COCO 數(shù)據(jù)集中的一小部分腳實例使用 Clickworker 平臺進行標記。它分為來自 COCO 訓練集的 14K 注釋和來自驗證集的 545 個注釋??偣矘擞浟?6 個英尺關鍵點??紤]足部關鍵點的 3D 坐標而不是表面位置。例如,對于確切的腳趾位置,數(shù)據(jù)集標記了指甲和皮膚連接之間的區(qū)域,并且還通過標記腳趾的中心而不是表面來考慮深度。
人群姿態(tài)數(shù)據(jù)集
數(shù)據(jù)集下載鏈接:http://u3v.cn/65x8MQ多人姿態(tài)估計是許多計算機視覺任務的基礎,近年來取得了重大進展。然而,以前很少有方法研究擁擠場景中的姿態(tài)估計問題,而在許多場景中,這仍然是一個具有挑戰(zhàn)性和不可避免的問題。此外,目前的基準無法對此類案件進行適當評估。在本文中,我們提出了一種新的有效方法來解決人群中的姿勢估計問題,并提出了一個新的數(shù)據(jù)集來更好地評估算法。

圖像去噪
PolyU數(shù)據(jù)集
數(shù)據(jù)集下載地址:https://sourl.cn/rMsdE8大多數(shù)以前的圖像去噪方法都集中在加性高斯白噪聲(AWGN)上。然而,隨著計算機視覺技術的進步,現(xiàn)實世界中的噪聲圖像去噪問題也隨之而來。為了在實現(xiàn)并發(fā)真實世界圖像去噪數(shù)據(jù)集的同時促進對該問題的研究,作者們構建了一個新的基準數(shù)據(jù)集,其中包含不同自然場景的綜合真實世界噪聲圖像。這些圖像是由不同的相機在不同的相機設置下拍攝的。

FMD(熒光顯微鏡去噪)數(shù)據(jù)集
數(shù)據(jù)集下載地址:https://sourl.cn/Wyqrui熒光顯微鏡使現(xiàn)代生物學取得了巨大的發(fā)展。由于其固有的微弱信號,熒光顯微鏡不僅比攝影噪聲大得多,而且還呈現(xiàn)出泊松-高斯噪聲,其中泊松噪聲或散粒噪聲是主要的噪聲源。為了獲得干凈的熒光顯微鏡圖像,非常需要有專門設計用于對熒光顯微鏡圖像進行降噪的有效降噪算法和數(shù)據(jù)集。雖然存在這樣的算法,但沒有這樣的數(shù)據(jù)集可用。在本文中,我們通過構建專用于泊松-高斯去噪的數(shù)據(jù)集 - 熒光顯微鏡去噪 (FMD) 數(shù)據(jù)集來填補這一空白。該數(shù)據(jù)集由 12,000 個真實熒光顯微鏡圖像組成,這些圖像使用商業(yè)共焦、雙光子、寬視野顯微鏡和代表性生物樣本,如細胞、斑馬魚和小鼠腦組織。

SIDD智能手機圖像去噪數(shù)據(jù)集
數(shù)據(jù)集下載地址:https://sourl.cn/jdpJZ6該數(shù)據(jù)集包含以下智能手機在不同光照條件下拍攝的 160 對噪聲/真實圖像:GP: Google Pixel?IP: iPhone 7?S6: Samsung Galaxy S6?Edge N6: Motorola Nexus 6?G4: LG G4

SIDD-small數(shù)據(jù)集
數(shù)據(jù)集下載地址:https://sourl.cn/kaYGxd一個小型版本的數(shù)據(jù)集,它由代表 160 個場景實例的160 個圖像對(噪聲和ground-truth)組成。

Super Resolution Benchmarks
數(shù)據(jù)集下載地址:https://sourl.cn/Bp6QZs來自于AIM 2022 壓縮圖像和視頻超分辨率挑戰(zhàn)賽”中的前 5 名解決方案工作:Swin2SR: SwinV2 Transformer for Compressed Image Super-Resolution and Restoration

工業(yè)檢測數(shù)據(jù)集
坑洼檢測數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://m6z.cn/5wJJTa本數(shù)據(jù)集匯總了700個在坑洼處帶有3K +注釋的圖像,用于從道路圖像中檢測坑洼,檢測道路地形和坑洼。
天池鋁型材表面缺陷數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://m6z.cn/61EksR大賽數(shù)據(jù)集里有1萬份來自實際生產中有瑕疵的鋁型材監(jiān)測影像數(shù)據(jù),每個影像包含一個或多種瑕疵。供機器學習的樣圖會明確標識影像中所包含的瑕疵類型。

Kylberg 紋理數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://m6z.cn/61Ekw5在布匹的實際生產過程中,由于各方面因素的影響,會產生污漬、破洞、毛粒等瑕疵,為保證產品質量,需要對布匹進行瑕疵檢測。布匹疵點檢驗是紡織行業(yè)生產和質量管理的重要環(huán)節(jié),目前人工檢測易受主觀因素影響,缺乏一致性;并且檢測人員在強光下長時間工作對視力影響極大。由于布匹疵點種類繁多、形態(tài)變化多樣、觀察識別難道大,導致布匹疵點智能檢測是困擾行業(yè)多年的技術瓶頸。本數(shù)據(jù)涵蓋了紡織業(yè)中布匹的各類重要瑕疵,每張圖片含一個或多種瑕疵。數(shù)據(jù)包括包括素色布和花色布兩類,其中,素色布數(shù)據(jù)約8000張;花色布數(shù)據(jù)約12000張。
東北大學帶鋼表面缺陷數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://m6z.cn/5U87us數(shù)據(jù)集收集了夾雜、劃痕、壓入氧化皮、裂紋、麻點和斑塊6種缺陷,每種缺陷300張,圖像尺寸為200×200。數(shù)據(jù)集包括分類和目標檢測兩部分,不過目標檢測的標注中有少量錯誤,需要注意。

Severstal 帶鋼缺陷數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://m6z.cn/61EkBp該數(shù)據(jù)集中提供了四種類型的帶鋼表面缺陷。訓練集共有12568張,測試集5506張。圖像尺寸為1600×256。
UCI 帶鋼缺陷數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://m6z.cn/61EkUh該數(shù)據(jù)集包含了7種帶鋼缺陷類型。這個數(shù)據(jù)集不是圖像數(shù)據(jù),而是帶鋼缺陷的28種特征數(shù)據(jù),可用于機器學習項目。鋼板故障的7種類型:裝飾、Z_劃痕、K_劃痕、污漬、骯臟、顛簸、其他故障。

DAGM 2007數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://m6z.cn/5F5eQV該數(shù)據(jù)集主要針對紋理背景上的雜項缺陷,為較弱監(jiān)督的訓練數(shù)據(jù)。包含十個數(shù)據(jù)集,前六個為訓練數(shù)據(jù)集,后四個為測試數(shù)據(jù)集。每個數(shù)據(jù)集均包含以灰度8位PNG格式保存的1000個“無缺陷”圖像和150個“有缺陷”圖像,每個數(shù)據(jù)集由不同的紋理模型和缺陷模型生成?!盁o缺陷”圖像顯示的背景紋理沒有缺陷,“無缺陷”圖像的背景紋理上恰好有一個標記的缺陷。所有數(shù)據(jù)集已隨機分為大小相等的訓練和測試子數(shù)據(jù)集。弱標簽以橢圓形表示,大致表示缺陷區(qū)域。
磁瓦缺陷數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://m6z.cn/5F5eSd中國科學院自動所一個課題組收集的數(shù)據(jù)集,是“Saliency of magnetic tile surface defects”這篇論文的數(shù)據(jù)集。收集了6種常見磁瓦缺陷的圖像,并做了語義分割的標注。
RSDDs鐵軌表面缺陷數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://m6z.cn/61EkKLRSDDs數(shù)據(jù)集包含兩種類型的數(shù)據(jù)集:第一種是從快車道捕獲的I型RSDDs數(shù)據(jù)集,其中包含67個具有挑戰(zhàn)性的圖像。第二個是從普通/重型運輸軌道捕獲的II型RSDDs數(shù)據(jù)集,其中包含128個具有挑戰(zhàn)性的圖像。兩個數(shù)據(jù)集的每幅圖像至少包含一個缺陷,并且背景復雜且噪聲很大。RSDDs數(shù)據(jù)集中的這些缺陷已由一些專業(yè)的人類觀察員在軌道表面檢查領域進行了標記。
KTH-TIPS 紋理圖像數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://m6z.cn/61EkMHKTH-TIPS 是一個紋理圖像數(shù)據(jù)集,在不同的光照、角度和尺度下拍攝的不同材質表面紋理圖片。類型包括砂紙、鋁箔、發(fā)泡膠、海綿、燈芯絨、亞麻、棉、黑面包、橙皮和餅干共10類。
印刷電路板(PCB)瑕疵數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://m6z.cn/5U87Ji這是一個公共的合成PCB數(shù)據(jù)集,由北京大學發(fā)布,其中包含1386張圖像以及6種缺陷(缺失孔,鼠咬壞,開路,短路,雜散,偽銅),用于檢測,分類和配準任務。
MIO-TCD車輛分類數(shù)據(jù)集
數(shù)據(jù)集下載鏈接:http://suo.nz/2wf2fh該數(shù)據(jù)集包含總共 786,702 張圖像,其中分類數(shù)據(jù)集中有 648,959 張圖像,定位數(shù)據(jù)集中有 137,743 張圖像,這些圖像是在一天中的不同時間和一年中的不同時期由部署在加拿大和美國的數(shù)千個交通攝像頭采集的。這些圖像已被選中以涵蓋廣泛的挑戰(zhàn),并且代表了當今在城市交通場景中捕獲的典型視覺數(shù)據(jù)。每個運動物體都經過近200人的仔細識別,可以對各種算法進行定量比較和排名。該數(shù)據(jù)集旨在提供嚴格的基準測試工具,用于訓練和測試現(xiàn)有算法和新算法,用于交通場景中移動車輛的分類和定位。數(shù)據(jù)集分為兩部分:“分類挑戰(zhàn)數(shù)據(jù)集”和“定位挑戰(zhàn)數(shù)據(jù)集”。
時尚產品圖片數(shù)據(jù)集
數(shù)據(jù)集下載鏈接:http://suo.nz/2DKP2W每個產品都由類似42431的ID標識??梢栽趕tyles.csv中找到所有產品的映射,從images/42431.jpg獲取該產品的圖像,并從styles/42431.json獲取完整的元數(shù)據(jù)。
水稻病害數(shù)據(jù)集
數(shù)據(jù)集下載鏈接:http://suo.nz/2KB4Fj用于檢測不同的水稻病害,2K+ 圖像主要涵蓋 3 種疾病——褐斑病、Hispa 和葉瘟病。
火災檢測數(shù)據(jù)集
數(shù)據(jù)集下載鏈接:http://suo.nz/2S7hIo檢測圖像中是否存在火災,含有來自不同場景的 500 多張圖像。
天氣和日光類型分類數(shù)據(jù)集
數(shù)據(jù)集下載鏈接:http://suo.nz/2ZziE3用于圖像分類的多類天氣數(shù)據(jù)集 (MWD) 是題為“使用異構集成方法從靜態(tài)圖像進行多類天氣識別”的研究論文,中使用的一個有價值的數(shù)據(jù)集。該數(shù)據(jù)集通過提取用于識別不同天氣條件的各種特征,為室外天氣分析提供了一個平臺。1000 多張圖像,具有 5 種以上的不同類別——日出、雨天、多云、傍晚、夜晚等。
安全帽佩戴數(shù)據(jù)集
數(shù)據(jù)集下載鏈接:http://suo.nz/2M6i3r該數(shù)據(jù)集中有 5000 張圖像和 5000 個注釋。原始數(shù)據(jù)集包含三個類別(人、頭部和頭盔),共有 2501 個標簽。此外,原始數(shù)據(jù)集沒有完全標記。我們在結果中的數(shù)據(jù)集上添加了三個新標簽,新標簽由六個類別(頭盔、帶頭盔的頭部、帶頭盔的人、頭部、不帶頭盔的人和面部)組成,共有 75578 個標簽。
SHWD安全帽佩戴檢測數(shù)據(jù)集
數(shù)據(jù)集下載鏈接:http://suo.nz/2TCswQSHWD 提供了用于安全頭盔佩戴和人頭檢測的數(shù)據(jù)集。它包括7581張圖像,其中9044個人體安全頭盔佩戴對象(正面)和111514個正常頭部對象(未佩戴或負面)。
摩托車頭盔檢測數(shù)據(jù)集
數(shù)據(jù)集下載鏈接:http://suo.nz/318FBxHELMET 數(shù)據(jù)集包含 2016 年在緬甸 12 個觀測點錄制的 910 個摩托車交通視頻剪輯。每個視頻剪輯的持續(xù)時間為 10 秒,以 10fps 的幀速率和 1920x1080 的分辨率記錄。該數(shù)據(jù)集包含 10,006 輛摩托車,超過了現(xiàn)有數(shù)據(jù)集中可用的摩托車數(shù)量。數(shù)據(jù)集中的 91,000 個帶注釋幀中的每輛摩托車都用邊界框進行注釋,并且提供每輛摩托車的騎手人數(shù)以及特定位置的頭盔使用數(shù)據(jù)。
安全帽和安全背心(反光衣)圖像數(shù)據(jù)集
數(shù)據(jù)集下載鏈接:http://suo.nz/38ESGe數(shù)據(jù)集中只有一個文件夾。文件名以 pos 開頭:圖像包含安全帽或安全背心。文件名以 neg 開頭:圖像既不包含安全帽也不包含安全背心。
垃圾分類數(shù)據(jù)集
數(shù)據(jù)集下載鏈接:http://suo.nz/3gb5Jj該數(shù)據(jù)集包含來自 12 個不同類別的生活垃圾的 15,150 張圖像;紙、紙板、生物、金屬、塑料、綠色玻璃、棕色玻璃、白色玻璃、衣服、鞋子、電池和垃圾。
塑料-紙張-垃圾袋合成圖像數(shù)據(jù)集
數(shù)據(jù)集下載鏈接:http://suo.nz/2i1p7K該數(shù)據(jù)集包含塑料袋、紙袋和垃圾袋的合成圖像。Bag Classes 文件夾分別包含每個圖像類的 5000 張圖像,而 ImageClassesCombined 文件夾包含所有組合的類的注釋圖像。注釋采用 COCO 格式。
垃圾溢出數(shù)據(jù)集
數(shù)據(jù)集下載鏈接:http://suo.nz/2iM1Dd

垃圾溢出數(shù)據(jù)集,來源印度街區(qū)。
YOLO格式的頭盔/頭部檢測數(shù)據(jù)集
數(shù)據(jù)集下載鏈接:http://suo.nz/2pChfA