最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

匯總了一些行人重識(shí)別數(shù)據(jù)集,挺全的

2023-04-24 13:45 作者:深度之眼官方賬號(hào)  | 我要投稿

來(lái)源:投稿 作者:AI浩

編輯:學(xué)姐

匯總了一些REID的數(shù)據(jù)集,幾乎涵蓋了所有的數(shù)據(jù)集。如果有缺少的歡迎留言補(bǔ)充。

文內(nèi)數(shù)據(jù)集學(xué)姐打包了一下,需要的同學(xué)自取

關(guān)注【學(xué)姐帶你玩AI】公眾號(hào),回復(fù)“REID”獲取

VIPeR數(shù)據(jù)集

VIPeR數(shù)據(jù)集包括632個(gè)行人的1264張圖像,每個(gè)行人有兩張圖像,采集自攝像頭a和攝像頭b. 每張圖像都調(diào)整為了128x48的大小。

該數(shù)據(jù)集的特點(diǎn)為視角和光照的多樣性。?

官方網(wǎng)站:https://vision.soe.ucsc.edu/node/178/

ETH1,2,3數(shù)據(jù)集

與其他數(shù)據(jù)集從多臺(tái)相機(jī)收集圖像不同,ETHZ從一個(gè)移動(dòng)的相機(jī)收集圖像。雖然視點(diǎn)方差比較小,但它確實(shí)有相當(dāng)大的光照方差、尺度方差和遮擋。

下載鏈接:https://homepages.dcc.ufmg.br/~william/datasets.html

QMUL iLIDS

介紹

QMUL iLIDS基于iLIDS MCTS的數(shù)據(jù)集,是一個(gè)在機(jī)場(chǎng)繁忙時(shí)候通過(guò)監(jiān)控系統(tǒng)中多個(gè)攝像頭收集到的數(shù)據(jù)集。幾乎每個(gè)ID(identity)都有從兩個(gè)無(wú)重疊(區(qū)域)的攝像頭拍攝的四幅圖像。該數(shù)據(jù)集具有嚴(yán)重遮擋和姿勢(shì)差異的場(chǎng)景。

采樣了119個(gè)人479張圖像。圖片大小:128*64。每個(gè)人平均有4個(gè)張圖像。有大的照明 改變和遮擋。

下載地址:http://www.eecs.qmul.ac.uk/~jason/data/i-LIDS_Pedestrian.tgz

GRID

QMUL地下再識(shí)別(GRID)數(shù)據(jù)集包含250個(gè)行人圖像對(duì)。每一對(duì)都包含兩張從不同視角看到的同一個(gè)體的圖像。所有的圖像都是從安裝在一個(gè)繁忙的地鐵站的8個(gè)不相交的攝像頭視圖中捕捉到的。旁邊的圖顯示了該站的每個(gè)相機(jī)視圖的快照和數(shù)據(jù)集中的樣本圖像。由于姿勢(shì)的變化,顏色,燈光的變化,數(shù)據(jù)集是具有挑戰(zhàn)性的;以及低空間分辨率造成的圖像質(zhì)量差。

有兩個(gè)文件夾:

文件夾“probe”包含在一個(gè)視圖中捕獲的250個(gè)探測(cè)圖像。

文件夾’gallery’包含250張?jiān)谄渌晥D中捕獲的探測(cè)的真實(shí)匹配圖像。此外,總共有775個(gè)圖像不屬于任何探測(cè)器。在交叉驗(yàn)證期間,這些額外的圖像應(yīng)該被視為測(cè)試集中的固定部分。

下載地址:http://personal.ie.cuhk.edu.hk/~ccloy/downloads_qmul_underground_reid.html

CAVIAR4ReID

該數(shù)據(jù)集由兩個(gè)視場(chǎng)重疊的監(jiān)控?cái)z像機(jī)采集的購(gòu)物中心多目標(biāo)跟蹤數(shù)據(jù)集CAVIAR中提取。在72個(gè)身份中,有50個(gè)擁有兩個(gè)攝像頭拍攝的圖像,其余22個(gè)只有一個(gè)攝像頭拍攝的圖像。每個(gè)標(biāo)識(shí)的圖像都經(jīng)過(guò)精心選擇,以使分辨率方差最大化。

下載地址:https://lorisbaz.github.io/caviar4reid.html

3DPeS

3DPeS數(shù)據(jù)集由8臺(tái)不重疊的戶外攝像機(jī)采集。雖然提供了原始視頻,但研究人員總是使用選定的快照來(lái)測(cè)試人的重識(shí)別算法。它具有三維環(huán)境模型和所有相機(jī)的校準(zhǔn)數(shù)據(jù)。在視頻序列中,只提供每個(gè)標(biāo)識(shí)的第一個(gè)出現(xiàn)幀的邊界框。 不同于iLIDS和PRID,它提供了完整的監(jiān)控視頻序列:提供了6個(gè)視頻對(duì)集合,15 幀/s,分辨率704*576。一共193個(gè)行人。

下載地址:http://www.openvisor.org/3dpes.asp

PRID2011

PRID數(shù)據(jù)集有攝像機(jī)A的385條軌跡和攝像機(jī)b的749條軌跡,其中只有200人出現(xiàn)在兩個(gè)攝像機(jī)中。該數(shù)據(jù)集還有一個(gè)單鏡頭版本,由隨機(jī)選擇的快照組成。有些軌跡沒(méi)有很好地同步,這意味著人可能會(huì)在連續(xù)的幀之間“跳躍”。

下載鏈接:https://www.tugraz.at/institute/icg/research/team-bischof/lrs/downloads/PRID11/

V47

V47數(shù)據(jù)集采用兩個(gè)視野重疊的室內(nèi)攝像機(jī)采集。每個(gè)身份都有兩個(gè)不同的方向(向內(nèi)和向外),并在幾個(gè)不同的視角中被捕捉到。

Wang, S.M., Lewandowski, M., Annesley, J. and Orwell, J. (2011) Re-identification of pedestrians with variable occlusion and scale. In: IEEE International Conference on Computer Vision (ICCV);

WARD

這個(gè)數(shù)據(jù)集是用三個(gè)不重疊的相機(jī)收集的。每個(gè)身份在每個(gè)相機(jī)中都有幾個(gè)圖像。

Martinel, N., & Micheloni, C. (2012, June). Re-identify people in wide area camera network. In 2012 IEEE computer society conference on computer vision and pattern recognition workshops (pp. 31-36). IEEE.

下載鏈接 https://github.com/iN1k1/CVPR2012/tree/master/toolbox/Datasets

SAIVT-Softbio

SAIVT-SoftBio數(shù)據(jù)庫(kù)包含一組8個(gè)監(jiān)控?cái)z像頭捕捉到的152個(gè)行人的多攝像頭序列集合。該數(shù)據(jù)庫(kù)為人員再檢測(cè)任務(wù)提供了一個(gè)具有挑戰(zhàn)性和現(xiàn)實(shí)的測(cè)試平臺(tái),并可免費(fèi)下載。

Bialkowski, Alina, Denman, Simon, Lucey, Patrick, Sridharan, Sridha, & Fookes, Clinton B. (2012) A database for person re-identification in multi-camera surveillance networks. In Proceedings of the 2012 International Conference on Digital Image Computing Techniques and Applications (DICTA 12), IEEE, Esplanade Hotel, Fremantle, WA, pp. 1-8.

下載鏈接 https://data.researchdatafinder.qut.edu.au/dataset/saivt-soft-biometric

CUHK01

CUHK01數(shù)據(jù)集包含來(lái)自每個(gè)攝像機(jī)的每個(gè)身份的兩個(gè)圖像。該數(shù)據(jù)集具有一對(duì)不相交的相機(jī),并且該數(shù)據(jù)集的圖像質(zhì)量相對(duì)較好。

971個(gè)身份,3884個(gè)圖像,手動(dòng)裁剪。2個(gè)視角,view A 主要捕獲人的正面和背面,view B捕獲側(cè)面。每個(gè)人有4張圖像,每個(gè)視角下有2張圖像。

W. Li, R. Zhao and X. Wang, “Human Reidentification with Transferred Metric Learning” in Proceedings of Asian Conference on Computer Vision (ACCV) 2012.

CUHK02

CUHK02是CUHK01的擴(kuò)展數(shù)據(jù)集。除了CUHK01中的相機(jī)對(duì)外,它還有四個(gè)相機(jī)對(duì)設(shè)置。

1816個(gè)身份,7264個(gè)圖像,手動(dòng)裁剪。取自5個(gè)不同的戶外camera對(duì),共1816人。5個(gè)camera對(duì)分別有971,306,107,193,239人,大小160*60. 每個(gè)人在每個(gè)攝像機(jī)下的不同時(shí)間內(nèi)取兩張圖片。大多數(shù)人都有負(fù)重(背包,手提包,皮帶包,行李)。

W. Li and X. Wang, “Locally Aligned Feature Transforms across Views” in Proceedings of IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR) 2013.

下載鏈接 http://www.ee.cuhk.edu.hk/~xgwang/CUHK_identification.html

CUHK03

CUHK03是第一個(gè)大到足以進(jìn)行深度學(xué)習(xí)的人物再識(shí)別數(shù)據(jù)集。它提供了從可變形零件模型(DPM)中檢測(cè)到的邊界框和手動(dòng)標(biāo)記。對(duì)于這個(gè)數(shù)據(jù)集,人員檢測(cè)質(zhì)量相對(duì)較好。

測(cè)試協(xié)議:

CUHK-03的測(cè)試協(xié)議有兩種。

第一種為舊的版本(參考文獻(xiàn)[1], 即數(shù)據(jù)集的出處 ),參見數(shù)據(jù)集中的’testsets’測(cè)試協(xié)議。具體地說(shuō),即隨機(jī)選出100個(gè)行人作為測(cè)試集,1160個(gè)行人作為訓(xùn)練集,100個(gè)行人作為驗(yàn)證集(這里總共1360個(gè)行人而不是1467個(gè),這是因?yàn)閷?shí)驗(yàn)中沒(méi)有用到攝像頭組pair 4和5的數(shù)據(jù)),重復(fù)二十次。這種測(cè)試協(xié)議是single-shot setting.

第二種測(cè)試協(xié)議(參考文獻(xiàn)[2] )類似于Market-1501,它將數(shù)據(jù)集分為包含767個(gè)行人的訓(xùn)練集和包含700個(gè)行人的測(cè)試集。在測(cè)試階段,我們隨機(jī)選擇一張圖像作為query,剩下的作為gallery,這樣的話,對(duì)于每個(gè)行人,有多個(gè)ground truth在gallery中。(新測(cè)試協(xié)議可以參考這里)

下載鏈接 Google Drive:

https://drive.google.com/file/d/0BxJeH3p7Ln48djNVVVJtUXh6bXc/edit?usp=sharing

RAiD

作為一個(gè)相對(duì)較新的發(fā)布的數(shù)據(jù)集,RAiD保證每個(gè)身份在所有四個(gè)不重疊的攝像機(jī)中都有圖像。由于兩個(gè)攝像頭在室內(nèi),另外兩個(gè)在室外,照明差異相當(dāng)大。每個(gè)身份的圖像以跟蹤的方式收集,但順序并不總是一致的。

Das, A., Chakraborty, A., & Roy-Chowdhury, A. K. (2014, September). Consistent re-identification in a camera network. In European Conference on Computer Vision (pp. 330-345). Springer International Publishing.

下載鏈接 https://cs-people.bu.edu/dasabir/raid.php

iLIDS-VID

iLIDS-VID數(shù)據(jù)集涉及在公共開放空間中的兩個(gè)不相交的攝像機(jī)視圖中觀察到的300個(gè)不同的行人。包含兩個(gè)版本:基于靜態(tài)圖像(參見名為“ILIDS-VID \ images”的文件夾)和基于圖像序列(參見名為“ILIDS-VID \ sequences”的文件夾)。

取自監(jiān)控航空接站大廳,從2個(gè)不相交攝像機(jī)創(chuàng)建該數(shù)據(jù)集。隨機(jī)為300個(gè)人采樣了600個(gè)視頻,每人有來(lái)自兩個(gè)視覺(jué)的一對(duì)視頻。每個(gè)視頻有23~192幀,平均73幀。相似的衣服、光照和視覺(jué)改變,復(fù)雜的背景和嚴(yán)重的遮擋,很具挑戰(zhàn)性。

Wang, T., Gong, S., Zhu, X., & Wang, S. (2016). Person Re-Identification by Discriminative Selection in Video Ranking.

MPR Drone

MPR是由飛行的無(wú)人機(jī)在室內(nèi)和室外環(huán)境中收集行人重識(shí)別數(shù)據(jù)集。由于它只有一個(gè)攝像頭,所以作者在原論文中提出了三種不同類型的評(píng)價(jià)實(shí)驗(yàn)。所有的行人檢測(cè)都是通過(guò)Piotr Dollar工具箱中的金字塔特征檢測(cè)得到的。它有兩個(gè)子數(shù)據(jù)集。數(shù)據(jù)集01已經(jīng)被標(biāo)記了113610次檢測(cè)。數(shù)據(jù)集02提供數(shù)據(jù)集01的原始幀數(shù)據(jù)。

Layne, R., Hospedales, T. M., & Gong, S. (2014, September). Investigating Open-World Person Re-identification Using a Drone. In European Conference on Computer Vision (pp. 225-240). Springer International Publishing.

HDA Person Dataset

HDA數(shù)據(jù)集是一個(gè)多攝像機(jī)高分辨率圖像序列數(shù)據(jù)集,用于高分辨率監(jiān)控研究。在一個(gè)典型的室內(nèi)辦公場(chǎng)景中,在繁忙時(shí)間(午餐時(shí)間),在30分鐘內(nèi)同時(shí)記錄了18個(gè)攝像頭(包括VGA、HD和全高清分辨率),涉及80多人。在當(dāng)前版本(v1.1)中,有13個(gè)攝像頭已經(jīng)被完全標(biāo)記。

Figueira, D., Taiana, M., Nambiar, A., Nascimento, J., & Bernardino, A. (2014, September). The hda+ data set for research on fully automated re-identification systems. In European Conference on Computer Vision (pp. 241-255). Springer International Publishing.

下載地址 http://vislab.isr.ist.utl.pt/hda-dataset/

Shinpuhkan Dataset

Shinpuhkan數(shù)據(jù)集最初是為了測(cè)試多攝像機(jī)跟蹤方法而創(chuàng)建的。每個(gè)人在每個(gè)攝像頭中有多個(gè)不同方向的軌跡。每個(gè)標(biāo)識(shí)總共有86個(gè)帶注釋的tracklet。與其他傳統(tǒng)的re-id數(shù)據(jù)集相比,該數(shù)據(jù)集的圖像質(zhì)量較好。

Kawanishi, Y., Wu, Y., Mukunoki, M., & Minoh, M. (2014). Shinpuhkan2014: A multi-camera pedestrian dataset for tracking people across multiple cameras. In 20th Korea-Japan Joint Workshop on Frontiers of Computer Vision (Vol. 5, p. 6).

下載鏈接 http://www.mm.media.kyoto-u.ac.jp/en/datasets/shinpuhkan/

CASIA Gait Database B

CASIA數(shù)據(jù)集創(chuàng)建于2005年,最初用于測(cè)試步態(tài)識(shí)別算法。2015年,Liu等人利用該數(shù)據(jù)集測(cè)試了一種基于步態(tài)的人物再識(shí)別算法。這個(gè)數(shù)據(jù)集是由11個(gè)攝像頭在0到180度的不同視角下重疊收集的。每個(gè)身份也會(huì)改變衣服和攜帶條件。不提供邊界框,而是給出原始視頻幀和每幀的輪廓。

數(shù)據(jù)集B中的視頻文件名格式為‘xxx-mm-nn-ttt.avi’格式的,

Xxx:主題編號(hào),001到124。

Mm:行走狀態(tài),可以是’nm’(正常),‘cl’(穿著外套)或’bg’(背著包)。

神經(jīng)網(wǎng)絡(luò):序號(hào)。

Ttt:視角,可以是’000’,‘018’,…,“180”。

下載地址 http://www.cbsr.ia.ac.cn/english/Gait%20Databases.asp

Market1501

介紹

2015年,論文 Person Re-Identification Meets Image Search 提出了 Market 1501 數(shù)據(jù)集,現(xiàn)在 Market 1501 數(shù)據(jù)集已經(jīng)成為行人重識(shí)別領(lǐng)域最常用的數(shù)據(jù)集之一。

數(shù)據(jù)庫(kù)中常見的缺點(diǎn)有:

數(shù)據(jù)庫(kù)規(guī)模小(圖片少) 攝像頭個(gè)數(shù)少(一般為兩個(gè)) 行人身份較少 每個(gè)身份的query只有一個(gè) 圖片均為手動(dòng)標(biāo)記的完美圖片,缺乏實(shí)際性 針對(duì)以上種種問(wèn)題,創(chuàng)立了Market1501:

1501個(gè)身份 6個(gè)攝像頭 32668張圖片 DPM檢測(cè)器代替手工框出行人 500K張干擾圖片 每一個(gè)身份有多個(gè)query 每一個(gè)query平均對(duì)應(yīng)14.8個(gè)gallery Market 1501 的行人圖片采集自清華大學(xué)校園的 6 個(gè)攝像頭,一共標(biāo)注了 1501 個(gè)行人。其中,751 個(gè)行人標(biāo)注用于訓(xùn)練集,750 個(gè)行人標(biāo)注用于測(cè)試集,訓(xùn)練集和測(cè)試集中沒(méi)有重復(fù)的行人 ID,也就是說(shuō)出現(xiàn)在訓(xùn)練集中的 751 個(gè)行人均未出現(xiàn)在測(cè)試集中。

訓(xùn)練集:751 個(gè)行人,12936 張圖片 測(cè)試集:750 個(gè)行人,19732 張圖片 query 集:750 個(gè)行人,3368 張圖片。query 集的行人圖片都是手動(dòng)標(biāo)注的圖片,從 6 個(gè)攝像頭中為測(cè)試集中的每個(gè)行人選取一張圖片,構(gòu)成 query 集。測(cè)試集中的每個(gè)行人至多有 6 張圖片,query 集共有 3368 張圖片。 網(wǎng)絡(luò)模型訓(xùn)練時(shí),會(huì)用到訓(xùn)練集;測(cè)試模型好壞時(shí),會(huì)用到測(cè)試集和 query 集。此時(shí)測(cè)試集也被稱作 gallery 集。因此實(shí)際用到的子集為,訓(xùn)練集、gallery 集 和 query 集。

數(shù)據(jù)集結(jié)構(gòu)

Market 1501 包括以下幾個(gè)文件夾:

bounding_box_test 是測(cè)試集,包括 19732 張圖片。 bounding_box_train 是訓(xùn)練集,包括 12936 張圖片。 gt_bbox 是手工標(biāo)注的訓(xùn)練集和測(cè)試集圖片,包括 25259 張圖片,用來(lái)區(qū)分 “good” “junk” 和 “distractors” 圖片。 query 是待查找的圖片集,在 bounding_box_test 中實(shí)現(xiàn)查找。這些圖片是手動(dòng)繪制生成的。而 gallery 是通過(guò) DPM 檢測(cè)器生成的。 gt_query 是一些 Matlab 格式的文件,里面記錄了 “good” 和 “junk” 圖片的索引,主要被用來(lái)評(píng)估模型。

數(shù)據(jù)集命名規(guī)則

以圖片 0012_c4s1_000826_01.jpg 對(duì)數(shù)據(jù)集命名進(jìn)行說(shuō)明。

0012 是行人 ID,Market 1501 有 1501 個(gè)行人,故行人 ID 范圍為 0001-1501 c4 是攝像頭編號(hào)(camera 4),表明圖片采集自第4個(gè)攝像頭,一共有 6 個(gè)攝像頭 s1 是視頻的第一個(gè)片段(sequece1),一個(gè)視頻包含若干個(gè)片段 000826 是視頻的第 826 幀圖片,表明行人出現(xiàn)在該幀圖片中 01 代表第 826 幀圖片上的第一個(gè)檢測(cè)框,DPM 檢測(cè)器可能在一幀圖片上生成多個(gè)檢測(cè)框

PKU-Reid

與其他現(xiàn)代re-id數(shù)據(jù)集相比,PKU-Reid數(shù)據(jù)集相對(duì)較小。這個(gè)數(shù)據(jù)集的主要特點(diǎn)是它在兩個(gè)不相交的攝像頭中從所有八個(gè)方向捕捉人的外觀。

PRW

PRW (Person Re-identification in The Wild)數(shù)據(jù)集是對(duì)Maretk1501數(shù)據(jù)集的擴(kuò)展。作者沒(méi)有只提供邊界框,而是發(fā)布了帶有注釋的完整幀。因此,可以評(píng)估不同的人探測(cè)器的影響。

Zheng, L., Zhang, H., Sun, S., Chandraker, M., & Tian, Q. (2016). Person Re-identification in the Wild. arXiv preprint arXiv:1604.02531.

Large scale person search

與PRW數(shù)據(jù)集類似,人物搜索數(shù)據(jù)集是具有全幀訪問(wèn)和大量標(biāo)記邊界框的大型數(shù)據(jù)集。它旨在模擬真實(shí)的人物搜索場(chǎng)景。因此,為了測(cè)試這個(gè)數(shù)據(jù)集,需要一個(gè)可靠的人員檢測(cè)器。為了使數(shù)據(jù)集更加困難,畫廊部分包括手持相機(jī)和電影的幀。此外,還釋放了兩個(gè)子集,即低分辨率子集和遮擋子集,以評(píng)估這些因素的影響。

Xiao, T., Li, S., Wang, B., Lin, L., & Wang, X. (2016). End-to-End Deep Learning for Person Search. arXiv preprint arXiv:1604.01850.

下載鏈接 http://www.ee.cuhk.edu.hk/~xgwang/PS/dataset.html

MARS

MARS(運(yùn)動(dòng)分析和再識(shí)別集)數(shù)據(jù)集是Market1501數(shù)據(jù)集的擴(kuò)展版本。這是第一個(gè)基于視頻的大規(guī)模人物重新識(shí)別數(shù)據(jù)集。因?yàn)樗械倪吔缈蚝蛙壽E小函數(shù)都是自動(dòng)生成的,所以它包含干擾,而且每個(gè)標(biāo)識(shí)可能有多個(gè)軌跡小函數(shù)。預(yù)先計(jì)算的深度特征也可以在網(wǎng)站上找到。

Zheng, L., Bie, Z., Sun, Y., Wang, J., Su, C., Wang, S., & Tian, Q. (2016, October). Mars: A video benchmark for large-scale person re-identification. In European Conference on Computer Vision (pp. 868-884). Springer International Publishing.

http://www.liangzheng.com.cn/Project/project_mars.html

DukeMTMC-reID/DukeMTMC4ReID

DukeMTMC數(shù)據(jù)集是一個(gè)大規(guī)模的重標(biāo)記多目標(biāo)多攝像頭跟蹤數(shù)據(jù)集。總共有超過(guò)2700人在8個(gè)攝像頭中被貼上了獨(dú)特的身份標(biāo)簽。隨著對(duì)所有信息(全幀,幀級(jí)地面真相,校準(zhǔn)信息等)的訪問(wèn),這個(gè)數(shù)據(jù)集有很多潛力?;诎l(fā)布的訓(xùn)練驗(yàn)證集,創(chuàng)建兩個(gè)re-id擴(kuò)展數(shù)據(jù)集。關(guān)鍵的區(qū)別在于生成邊界框的方式。DukeMTMC-reID直接使用手動(dòng)標(biāo)記的地面真相,而DukeMTMC4ReID采用Doppia作為人探測(cè)器。

P-DukeMTMC-reID 遮擋行人數(shù)據(jù)集

P-DukeMTMC-reID 是一個(gè)遮擋行人數(shù)據(jù)集。該數(shù)據(jù)集是從 DukeMTMC-reID dataset 中人工挑選出來(lái)的。P-DukeMTMC-reID 數(shù)據(jù)集中,12,927 張圖像(665 個(gè)身份)用于訓(xùn)練,2,163 張圖像(634 個(gè)標(biāo)識(shí))用于查詢,圖庫(kù)集包含 9,053 個(gè)圖像。

Airport

該數(shù)據(jù)集是使用來(lái)自一個(gè)中型機(jī)場(chǎng)室內(nèi)監(jiān)控網(wǎng)絡(luò)的6個(gè)攝像頭的視頻創(chuàng)建的。這些攝像頭覆蓋了一個(gè)中央安檢檢查站區(qū)域和三個(gè)大廳的不同部分。每臺(tái)相機(jī)有768 × 432像素,以每秒30幀的速度拍攝視頻。從每個(gè)攝像頭收集了從早上8點(diǎn)到晚上8點(diǎn)長(zhǎng)達(dá)12小時(shí)的視頻。假設(shè)每個(gè)目標(biāo)人群在網(wǎng)絡(luò)上花費(fèi)的時(shí)間是有限的,每個(gè)長(zhǎng)視頻被隨機(jī)分成40個(gè)5分鐘長(zhǎng)的視頻片段。每個(gè)視頻剪輯然后通過(guò)一個(gè)原型端到端重新識(shí)別系統(tǒng)組成的自動(dòng)人檢測(cè)和跟蹤算法。

Karanam, S., Gou, M., Wu, Z., Rates-Borras, A., Camps, O., & Radke, R. J. (2018). IEEE Transactions on Pattern Analysis and Machine Intelligence, 2018. 官方地址: https://alert.northeastern.edu/transitioning-technology/alert-datasets/alert-airport-re-identification-dataset/

MSMT17

介紹

CVPR2018會(huì)議上,提出了一個(gè)新的更接近真實(shí)場(chǎng)景的大型數(shù)據(jù)集MSMT17,即Multi-Scene Multi-Time,涵蓋了多場(chǎng)景多時(shí)段。數(shù)據(jù)集采用了安防在校園內(nèi)的15個(gè)攝像頭網(wǎng)絡(luò),其中包含12個(gè)戶外攝像頭和3個(gè)室內(nèi)攝像頭。為了采集原始監(jiān)控視頻,在一個(gè)月里選擇了具有不同天氣條件的4天。每天采集3個(gè)小時(shí)的視頻,涵蓋了早上、中午、下午三個(gè)時(shí)間段。因此,總共的原始視頻時(shí)長(zhǎng)為180小時(shí)。

基于Faster RCNN作為行人檢測(cè)器,三位人工標(biāo)注員用了兩個(gè)月時(shí)間查看檢測(cè)到的包圍框和標(biāo)注行人標(biāo)簽。最終,得到4101個(gè)行人的126441個(gè)包圍框。和其它數(shù)據(jù)集的對(duì)比以及統(tǒng)計(jì)信息如下圖所示。

目錄結(jié)構(gòu)

評(píng)估協(xié)議

按照訓(xùn)練-測(cè)試為1:3的比例對(duì)數(shù)據(jù)集進(jìn)行隨機(jī)劃分,而不是像其他數(shù)據(jù)集一樣均等劃分。這樣做的目的是鼓勵(lì)高效率的訓(xùn)練策略,由于在真實(shí)應(yīng)用中標(biāo)注數(shù)據(jù)的昂貴。

最后,訓(xùn)練集包含1041個(gè)行人共32621個(gè)包圍框,而測(cè)試集包括3060個(gè)行人共93820個(gè)包圍框。對(duì)于測(cè)試集,11659個(gè)包圍框被隨機(jī)選出來(lái)作為query,而其它82161個(gè)包圍框作為gallery.

測(cè)試指標(biāo)為CMC曲線和mAP. 對(duì)于每個(gè)query, 可能存在多個(gè)正匹配。 論文鏈接:https://arxiv.org/pdf/1711.08565.pdf

下載鏈接 https://www.pkuvmc.com/publications/msmt17.html

RPIfield

RPIfield是一個(gè)重新識(shí)別數(shù)據(jù)集,它為每個(gè)人提供了明確的時(shí)間戳信息,從而幫助評(píng)估基于它們?cè)谟稍絹?lái)越多的候選人(其中一些人可能在很長(zhǎng)一段時(shí)間內(nèi)多次返回)填充的動(dòng)態(tài)圖庫(kù)上的時(shí)間性能的重新識(shí)別算法。

Zheng, Meng and Karanam, Srikrishna and Radke, Richard J. “RPIfield: A New Dataset for Temporally Evaluating Person Re-Identification.” CVPR Workshops (2018)

LPW

LPW 全稱 Labeled Pedestrian in the Wild,是一個(gè)行人檢測(cè)數(shù)據(jù)集。該數(shù)據(jù)集包含三個(gè)不同的場(chǎng)景,共 2,731 名行人,其中每一個(gè)行人圖片由 2 到 4 臺(tái)攝像機(jī)拍攝。 LPW 的顯著特征是:包含 7,694 個(gè) tracklets,超過(guò) 590,000 個(gè)圖像。

下載鏈接 https://liuyu.us/dataset/lpw/index.html

PKU Sketch-ReID

介紹

這個(gè)數(shù)據(jù)集包含200個(gè)人,每個(gè)人都有一幅素描和兩張照片。每個(gè)人的照片都是在白天由兩臺(tái)交叉視角相機(jī)拍攝的。原始圖像(或視頻幀)是手動(dòng)裁剪的,以確保每張照片都包含一個(gè)特定的人。所有人的速寫由5位藝術(shù)家繪制,每個(gè)藝術(shù)家都有自己的畫風(fēng)。

下載鏈接 https://www.pkuml.org/resources/pkusketchreid-dataset.html

ThermalWorld

這是一個(gè)具有熱彩色圖像對(duì)的跨模態(tài)re-id數(shù)據(jù)集。提供了像素級(jí)注釋。

下載鏈接 http://www.zefirus.org/articles/ee9462fb-befd-4679-9c26-acd551db8583/ https://github.com/vlkniaz/ThermalGAN

SYSU-30k 數(shù)據(jù)集

目前沒(méi)有公開發(fā)布的「弱監(jiān)督」行人重識(shí)別數(shù)據(jù)集。為了填補(bǔ)這個(gè)空白,研究者收集了一個(gè)新的大規(guī)模行人重識(shí)別數(shù)據(jù) SYSU-30k,為未來(lái)行人重識(shí)別研究提供了便利。他們從網(wǎng)上下載了許多電視節(jié)目視頻??紤]電視節(jié)目視頻的原因有兩個(gè):第一,電視節(jié)目中的行人通常是跨攝像機(jī)視角,它們是由多個(gè)移動(dòng)的攝像機(jī)捕捉得到并經(jīng)過(guò)后處理。因此,電視節(jié)目的行人識(shí)別是一個(gè)真實(shí)場(chǎng)景的行人重識(shí)別問(wèn)題;第二,電視節(jié)目中的行人非常適合標(biāo)注。在 SYSU-30k 數(shù)據(jù)集中,每一個(gè)視頻大約包含 30.5 個(gè)行人。

研究者最終共使用的原視頻共 1000 個(gè)。標(biāo)注人員利用弱標(biāo)注的方式對(duì)視頻進(jìn)行標(biāo)注。具體地,數(shù)據(jù)集被切成 84,930 個(gè)袋,然后標(biāo)注人員記錄每個(gè)袋包含的行人身份。他們采用 YOLO-v2 進(jìn)行行人檢測(cè)。三位標(biāo)注人員查看檢測(cè)得到的行人圖像,并花費(fèi) 20 天進(jìn)行標(biāo)注。最后,29,606,918(≈30M)個(gè)行人檢測(cè)框共 30,508(≈30k)個(gè)行人身份被標(biāo)注。研究者選擇 2,198 個(gè)行人身份作為測(cè)試集,剩下的行人身份作為訓(xùn)練集。訓(xùn)練集和測(cè)試集的行人身份沒(méi)有交疊。

SYSU-30k 數(shù)據(jù)集的一些樣例如下圖所示??梢钥吹?,SYSU-30k 數(shù)據(jù)集包含劇烈的光照變化(第 2,7,9 行)、遮擋(第 6,8 行)、低像素(第 2,7,9 行)、俯視拍攝的攝像機(jī)(第 2,5,6,8,9 行)和真實(shí)場(chǎng)景下復(fù)雜的背景(第 2-10 行)。

下載鏈接 論文地址:https://arxiv.org/pdf/1904.03845.pdf

代碼、模型和數(shù)據(jù)集:https://github.com/wanggrun/SYSU-30k

PETA 遠(yuǎn)距離行人識(shí)別數(shù)據(jù)集

PETA 全稱 The PEdes Trian Attribute dataset,是用于遠(yuǎn)距離識(shí)別行人屬性的圖像數(shù)據(jù)集。比如遠(yuǎn)距離識(shí)別性別和服裝風(fēng)格。該數(shù)據(jù)集包含了 8,705 個(gè)行人、65 個(gè)屬性(61 個(gè)二類屬性和 4 個(gè)多類屬性)和 19,000 張圖像。

需要文內(nèi)數(shù)據(jù)集合集的同學(xué)

關(guān)注【學(xué)姐帶你玩AI】公眾號(hào),回復(fù)“REID”獲取



匯總了一些行人重識(shí)別數(shù)據(jù)集,挺全的的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
铜山县| 上饶县| 化德县| 合肥市| 集安市| 广饶县| 安多县| 余干县| 四子王旗| 淮安市| 苍梧县| 大关县| 麻栗坡县| 汾西县| 博罗县| 北碚区| 峡江县| 涿鹿县| 西林县| 阿拉善左旗| 通江县| 青岛市| 兴城市| 阿坝县| 祁东县| 泰宁县| 普兰店市| 潜山县| 怀来县| 永德县| 漳浦县| 永吉县| 榕江县| 旅游| 通州市| 涪陵区| 廊坊市| 开化县| 弥渡县| 墨江| 龙州县|