20+開源數(shù)據(jù)資源分類匯總(關(guān)鍵點(diǎn)檢測(cè)、圖像去噪/分割、人群計(jì)數(shù)等)
關(guān)鍵點(diǎn)檢測(cè)
手部姿勢(shì)關(guān)鍵點(diǎn)檢測(cè)數(shù)據(jù)集
數(shù)據(jù)集下載鏈接:http://u3v.cn/6d3lZV數(shù)據(jù)集由序列構(gòu)成。在每個(gè)序列中,您都可以找到組成它的幀。一個(gè)幀由4個(gè)彩色圖像、4組投影在每個(gè)圖像平面中的2D關(guān)節(jié)、4個(gè)邊界框、1組Leap Motion Controller提供的3D點(diǎn)和4組重新投影到每個(gè)相機(jī)坐標(biāo)幀的3D點(diǎn)組成。
動(dòng)物姿勢(shì)數(shù)據(jù)集
數(shù)據(jù)集下載鏈接:http://u3v.cn/6kDLfr該數(shù)據(jù)集提供了五個(gè)類別的動(dòng)物姿勢(shì)注釋:狗、貓、牛、馬、羊,在4,000 多張圖像中總共有6,000多個(gè)實(shí)例。此外,該數(shù)據(jù)集還包含其他7 個(gè)動(dòng)物類別的邊界框注釋。在論文中查找詳細(xì)信息。一共標(biāo)注了 20 個(gè)關(guān)鍵點(diǎn):兩只眼睛、喉嚨、鼻子、馬肩隆、兩個(gè)耳根、尾根、四個(gè)肘部、四個(gè)膝蓋、四個(gè)爪子。
電影人物關(guān)節(jié)關(guān)鍵點(diǎn)數(shù)據(jù)集
數(shù)據(jù)集下載鏈接:http://u3v.cn/5tW5zx該數(shù)據(jù)集從流行的好萊塢電影中自動(dòng)收集了5003個(gè)圖像數(shù)據(jù)。這些圖像是通過在30部電影的每10幀上運(yùn)行一個(gè)最先進(jìn)的人檢測(cè)器獲得的。然后,被高度自信地檢測(cè)到的人(大約2萬名候選人)被送往眾包市場(chǎng)亞馬遜機(jī)械土耳其公司(Amazon Mechanical Turk),以獲得地面真實(shí)標(biāo)簽。每幅圖片都由五名特克斯人以0.01美元的價(jià)格標(biāo)注,以標(biāo)注10個(gè)上身關(guān)節(jié)。在每個(gè)圖像中取五個(gè)標(biāo)記的中位數(shù),以對(duì)離群值注釋保持穩(wěn)健。
MPIIGaze Dataset
數(shù)據(jù)集下載鏈接:http://u3v.cn/5BsiEeMPIIGaze數(shù)據(jù)集包含在三個(gè)多月的日常筆記本電腦使用過程中從15名參與者收集的213659張圖像。在外觀和照明方面,數(shù)據(jù)集比現(xiàn)有的數(shù)據(jù)集變化更大。
人體足部關(guān)鍵點(diǎn)數(shù)據(jù)集
數(shù)據(jù)集下載鏈接:http://u3v.cn/5IYvIV現(xiàn)有的人體姿勢(shì)數(shù)據(jù)集包含有限的身體部位類型。MPII 數(shù)據(jù)集標(biāo)注了腳踝、膝蓋、臀部、肩膀、肘部、手腕、頸部、軀干和頭頂,而 COCO 還包括一些面部關(guān)鍵點(diǎn)。對(duì)于這兩個(gè)數(shù)據(jù)集,足部注釋僅限于腳踝位置。然而,圖形應(yīng)用程序(例如頭像重定向或 3D 人體形狀重建)需要足部關(guān)鍵點(diǎn),例如大腳趾和腳跟。在沒有足部信息的情況下,這些方法會(huì)遇到諸如糖果包裝效果、地板穿透和足部滑冰等問題。為了解決這些問題,COCO 數(shù)據(jù)集中的一小部分腳實(shí)例使用 Clickworker 平臺(tái)進(jìn)行標(biāo)記。它分為來自 COCO 訓(xùn)練集的 14K 注釋和來自驗(yàn)證集的 545 個(gè)注釋??偣矘?biāo)記了 6 個(gè)英尺關(guān)鍵點(diǎn)??紤]足部關(guān)鍵點(diǎn)的 3D 坐標(biāo)而不是表面位置。例如,對(duì)于確切的腳趾位置,數(shù)據(jù)集標(biāo)記了指甲和皮膚連接之間的區(qū)域,并且還通過標(biāo)記腳趾的中心而不是表面來考慮深度。
人群姿態(tài)數(shù)據(jù)集
數(shù)據(jù)集下載鏈接:http://u3v.cn/65x8MQ多人姿態(tài)估計(jì)是許多計(jì)算機(jī)視覺任務(wù)的基礎(chǔ),近年來取得了重大進(jìn)展。然而,以前很少有方法研究擁擠場(chǎng)景中的姿態(tài)估計(jì)問題,而在許多場(chǎng)景中,這仍然是一個(gè)具有挑戰(zhàn)性和不可避免的問題。此外,目前的基準(zhǔn)無法對(duì)此類案件進(jìn)行適當(dāng)評(píng)估。在本文中,我們提出了一種新的有效方法來解決人群中的姿勢(shì)估計(jì)問題,并提出了一個(gè)新的數(shù)據(jù)集來更好地評(píng)估算法。
圖像去噪
PolyU數(shù)據(jù)集
數(shù)據(jù)集下載地址:https://sourl.cn/rMsdE8大多數(shù)以前的圖像去噪方法都集中在加性高斯白噪聲(AWGN)上。然而,隨著計(jì)算機(jī)視覺技術(shù)的進(jìn)步,現(xiàn)實(shí)世界中的噪聲圖像去噪問題也隨之而來。為了在實(shí)現(xiàn)并發(fā)真實(shí)世界圖像去噪數(shù)據(jù)集的同時(shí)促進(jìn)對(duì)該問題的研究,作者們構(gòu)建了一個(gè)新的基準(zhǔn)數(shù)據(jù)集,其中包含不同自然場(chǎng)景的綜合真實(shí)世界噪聲圖像。這些圖像是由不同的相機(jī)在不同的相機(jī)設(shè)置下拍攝的。
FMD(熒光顯微鏡去噪)數(shù)據(jù)集
數(shù)據(jù)集下載地址:https://sourl.cn/Wyqrui熒光顯微鏡使現(xiàn)代生物學(xué)取得了巨大的發(fā)展。由于其固有的微弱信號(hào),熒光顯微鏡不僅比攝影噪聲大得多,而且還呈現(xiàn)出泊松-高斯噪聲,其中泊松噪聲或散粒噪聲是主要的噪聲源。為了獲得干凈的熒光顯微鏡圖像,非常需要有專門設(shè)計(jì)用于對(duì)熒光顯微鏡圖像進(jìn)行降噪的有效降噪算法和數(shù)據(jù)集。雖然存在這樣的算法,但沒有這樣的數(shù)據(jù)集可用。在本文中,我們通過構(gòu)建專用于泊松-高斯去噪的數(shù)據(jù)集 - 熒光顯微鏡去噪 (FMD) 數(shù)據(jù)集來填補(bǔ)這一空白。該數(shù)據(jù)集由 12,000 個(gè)真實(shí)熒光顯微鏡圖像組成,這些圖像使用商業(yè)共焦、雙光子、寬視野顯微鏡和代表性生物樣本,如細(xì)胞、斑馬魚和小鼠腦組織。
SIDD智能手機(jī)圖像去噪數(shù)據(jù)集
數(shù)據(jù)集下載地址:https://sourl.cn/jdpJZ6該數(shù)據(jù)集包含以下智能手機(jī)在不同光照條件下拍攝的 160 對(duì)噪聲/真實(shí)圖像:GP: Google Pixel?IP: iPhone 7?S6: Samsung Galaxy S6?Edge N6: Motorola Nexus 6?G4: LG G4
SIDD-small數(shù)據(jù)集
數(shù)據(jù)集下載地址:https://sourl.cn/kaYGxd一個(gè)小型版本的數(shù)據(jù)集,它由代表 160 個(gè)場(chǎng)景實(shí)例的160 個(gè)圖像對(duì)(噪聲和ground-truth)組成。
Super Resolution Benchmarks
數(shù)據(jù)集下載地址:https://sourl.cn/Bp6QZs來自于AIM 2022 壓縮圖像和視頻超分辨率挑戰(zhàn)賽”中的前 5 名解決方案工作:Swin2SR: SwinV2 Transformer for Compressed Image Super-Resolution and Restoration
行人檢測(cè)
SCUT FIR行人檢測(cè)數(shù)據(jù)集
數(shù)據(jù)集下載地址:https://sourl.cn/4VK3BnSCUT FIR Pedestrian Datasets 是一個(gè)大型遠(yuǎn)紅外行人檢測(cè)數(shù)據(jù)集。它由大約 11 小時(shí)長的圖像序列(?幀)組成,速度為 25 Hz,以低于 80 km/h 的速度在不同的交通場(chǎng)景中行駛。圖像序列來自中國廣州市中心、郊區(qū)、高速公路和校園 4 種場(chǎng)景下的 11 個(gè)路段。該數(shù)據(jù)集注釋了 211,011 幀,總共 477,907 個(gè)邊界框,圍繞 7,659 個(gè)獨(dú)特的行人。
JHU-CROWD++
數(shù)據(jù)集下載地址:https://sourl.cn/mgxHEY包含 4,372 張圖像和 151 萬條注釋的綜合數(shù)據(jù)集。與現(xiàn)有數(shù)據(jù)集相比,所提出的數(shù)據(jù)集是在各種不同的場(chǎng)景和環(huán)境條件下收集的。此外,該數(shù)據(jù)集提供了相對(duì)豐富的注釋集,如點(diǎn)、近似邊界框、模糊級(jí)別等。
CIHP人體解析數(shù)據(jù)集
數(shù)據(jù)集下載地址:https://sourl.cn/W3Tm2JCrowd Instance-level Human Parsing (CIHP) 數(shù)據(jù)集包含 38,280 張多人圖像,這些圖像具有精細(xì)的注釋、高外觀可變性和復(fù)雜性。該數(shù)據(jù)集可用于人體部分分割任務(wù)。
AHU-Crowd人群數(shù)據(jù)集
數(shù)據(jù)集下載地址:https://sourl.cn/XFJDCh人群數(shù)據(jù)集是從各種來源獲得的,例如 UCF 和數(shù)據(jù)驅(qū)動(dòng)的人群數(shù)據(jù)集,以評(píng)估所提出的框架。序列多樣,代表了朝圣、車站、馬拉松、集會(huì)和體育場(chǎng)等各種場(chǎng)景中公共空間的密集人群。此外,這些序列具有不同的視野、分辨率,并表現(xiàn)出多種運(yùn)動(dòng)行為,涵蓋了明顯和微妙的不穩(wěn)定性。
AudioVisual 人群計(jì)數(shù)
數(shù)據(jù)集下載地址:https://sourl.cn/wfd7wD一個(gè)用于人群計(jì)數(shù)的新數(shù)據(jù)集,該數(shù)據(jù)集由中國不同位置的大約 2000 個(gè)帶注釋的圖像令牌組成,每個(gè)圖像對(duì)應(yīng)一個(gè) 1 秒的音頻剪輯和一個(gè)密度圖。圖像處于不同的照明條件下。
UCF-CC-50
數(shù)據(jù)集下載地址:http://c.nxw.so/9LYoK該數(shù)據(jù)集包含極其密集人群的圖像。圖像主要是從 FLICKR 收集的。
北京BRT數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://c.nxw.so/c1PV9該數(shù)據(jù)集包含 1,280 張圖像和 16,795 個(gè)標(biāo)記的行人,用于人群分析。該數(shù)據(jù)集使用 720 張圖像進(jìn)行訓(xùn)練,使用 560 張圖像進(jìn)行測(cè)試。
名為 frame 的文件夾包含人群圖像。
名為 ground_truth 的文件夾包含ground_truth。例如,'1-20170325134657.jpg'對(duì)應(yīng)于'1-20170325134657.mat',以及這張圖片中第i個(gè)人的真實(shí)位置,其中每一行是位置[x,y]
圖像分割
天空?qǐng)D像數(shù)據(jù)集
數(shù)據(jù)集下載鏈接:http://suo.nz/1ykW0LSky 數(shù)據(jù)集包含 60 張帶有地面實(shí)況的圖像,用于天空分割。它基于 R. Fergus 15/02/03 的 Caltech Airplanes Side 數(shù)據(jù)集。選擇數(shù)據(jù)集中包含天空區(qū)域的那些圖像,并為它們創(chuàng)建地面實(shí)況。原始數(shù)據(jù)集圖像名稱保持不變。
CO-SKEL數(shù)據(jù)集
數(shù)據(jù)集下載鏈接:http://suo.nz/1FR95s該數(shù)據(jù)集由分類骨架和分割掩碼組成,用于評(píng)估協(xié)同骨架化方法。
CAD-120 affordance數(shù)據(jù)集
數(shù)據(jù)集下載鏈接:http://suo.nz/1NnlU1包含9916個(gè)對(duì)象實(shí)例的3090幅圖像的逐像素注釋。
Intrinsic Images in the Wild
數(shù)據(jù)集下載鏈接:http://suo.nz/1UTwnq“Intrinsic Images in the Wild”,這是一個(gè)用于評(píng)估室內(nèi)場(chǎng)景固有圖像分解的大規(guī)模公共數(shù)據(jù)集。作者們通過數(shù)百萬個(gè)眾包注釋創(chuàng)建了這個(gè)基準(zhǔn),這些注釋對(duì)每個(gè)場(chǎng)景中的點(diǎn)對(duì)的材料屬性進(jìn)行了相對(duì)比較。
具有細(xì)長部分的鳥類昆蟲數(shù)據(jù)集
數(shù)據(jù)集下載鏈接:http://suo.nz/22pJs7這些數(shù)據(jù)庫由 280 張具有g(shù)round truth的鳥類和昆蟲的公共圖像組成。
多品種果花檢測(cè)數(shù)據(jù)集
數(shù)據(jù)集下載鏈接:http://suo.nz/29RKnM該數(shù)據(jù)集包含四組花卉圖像,來自三種不同的樹種:蘋果、桃和梨,以及隨附的地面實(shí)況圖像。
OpenSurfaces數(shù)據(jù)集
數(shù)據(jù)集下載鏈接:http://suo.nz/1bI3Md包含從消費(fèi)者內(nèi)部照片中分割出來的數(shù)千個(gè)表面示例,并使用材料參數(shù)(反射率、材料名稱)、紋理信息(表面法線、校正紋理)進(jìn)行注釋和上下文信息(場(chǎng)景類別和對(duì)象名稱)。
陰影檢測(cè)/紋理分析數(shù)據(jù)集
數(shù)據(jù)集下載鏈接:http://suo.nz/1iyjoA一個(gè)用于陰影檢測(cè)和紋理分析的簡(jiǎn)單計(jì)算機(jī)視覺數(shù)據(jù)集,專門用于幫助測(cè)試移動(dòng)機(jī)器人的陰影檢測(cè)算法(和紋理分割算法)——即使用 活動(dòng)(移動(dòng))相機(jī)進(jìn)行陰影檢測(cè)。該數(shù)據(jù)集專注于紋理分析,因此每個(gè)圖像序列都包含在許多不同紋理表面前移動(dòng)的陰影。