行人重識別market1501數(shù)據(jù)集介紹及格式轉(zhuǎn)化匯總
來源:投稿 作者:AI浩
編輯:學(xué)姐
market1501數(shù)據(jù)集介紹
2015年,論文 Person Re-Identification Meets Image Search
提出了 Market 1501 數(shù)據(jù)集,現(xiàn)在 Market 1501 數(shù)據(jù)集已經(jīng)成為行人重識別領(lǐng)域最常用的數(shù)據(jù)集之一。
數(shù)據(jù)庫中常見的缺點(diǎn)有:
數(shù)據(jù)庫規(guī)模?。▓D片少)
攝像頭個數(shù)少(一般為兩個)
行人身份較少
每個身份的query只有一個
圖片均為手動標(biāo)記的完美圖片,缺乏實(shí)際性
針對以上種種問題,創(chuàng)立了Market1501:
1501個身份
6個攝像頭
32668張圖片
DPM檢測器代替手工框出行人
500K張干擾圖片
每一個身份有多個query
每一個query平均對應(yīng)14.8個gallery
Market 1501 的行人圖片采集自清華大學(xué)校園的 6 個攝像頭,一共標(biāo)注了 1501 個行人。其中,751 個行人標(biāo)注用于訓(xùn)練集,750 個行人標(biāo)注用于測試集,訓(xùn)練集和測試集中沒有重復(fù)的行人 ID,也就是說出現(xiàn)在訓(xùn)練集中的 751 個行人均未出現(xiàn)在測試集中。
訓(xùn)練集:751 個行人,12936 張圖片
測試集:750 個行人,19732 張圖片
query 集:750 個行人,3368 張圖片。query 集的行人圖片都是手動標(biāo)注的圖片,從 6 個攝像頭中為測試集中的每個行人選取一張圖片,構(gòu)成 query 集。測試集中的每個行人至多有 6 張圖片,query 集共有 3368 張圖片。
網(wǎng)絡(luò)模型訓(xùn)練時,會用到訓(xùn)練集;測試模型好壞時,會用到測試集和 query 集。此時測試集也被稱作 gallery 集。因此實(shí)際用到的子集為,訓(xùn)練集、gallery 集 和 query 集。
數(shù)據(jù)集結(jié)構(gòu)
Market 1501 包括以下幾個文件夾:
bounding_box_test 是測試集,包括 19732 張圖片。
bounding_box_train 是訓(xùn)練集,包括 12936 張圖片。
gt_bbox 是手工標(biāo)注的訓(xùn)練集和測試集圖片,包括 25259 張圖片,用來區(qū)分 “good” “junk” 和 “distractors” 圖片。
query 是待查找的圖片集,在 bounding_box_test 中實(shí)現(xiàn)查找。這些圖片是手動繪制生成的。而 gallery 是通過 DPM 檢測器生成的。
gt_query 是一些 Matlab 格式的文件,里面記錄了 “good” 和 “junk” 圖片的索引,主要被用來評估模型。
數(shù)據(jù)集命名規(guī)則
以圖片 0012_c4s1_000826_01.jpg 對數(shù)據(jù)集命名進(jìn)行說明。

0012 是行人 ID,Market 1501 有 1501 個行人,故行人 ID 范圍為 0001-1501
c4 是攝像頭編號(camera 4),表明圖片采集自第4個攝像頭,一共有 6 個攝像頭
s1 是視頻的第一個片段(sequece1),一個視頻包含若干個片段
000826 是視頻的第 826 幀圖片,表明行人出現(xiàn)在該幀圖片中
01 代表第 826 幀圖片上的第一個檢測框,DPM 檢測器可能在一幀圖片上生成多個檢測框
格式轉(zhuǎn)化
1、創(chuàng)建數(shù)據(jù)集文件夾
新建1_makedir.py,插入代碼:
運(yùn)行后就可以得到文件夾!

2、抽取market1501數(shù)據(jù)集
將market1501數(shù)據(jù)集放到目錄,如下圖:

新建2_mark1501.py,插入代碼:

抽取后的結(jié)果:

3、抽取CUHK03數(shù)據(jù)集
ID從1502開始,一共1467個不同ID的行人
兩個數(shù)據(jù)集的訓(xùn)練集加起來有2萬張了圖片,測試集有1.8萬張圖片,接下來就不在增加測試集的數(shù)據(jù)了。

4、抽取MSMT17數(shù)據(jù)集
訓(xùn)練集包含1041個行人共32621個包圍框,而測試集包括3060個行人共93820個包圍框。 數(shù)據(jù)集選擇用MSMT17V1(文末領(lǐng)數(shù)據(jù)集)

導(dǎo)入完成后id增加到了7069。

5、抽取viper數(shù)據(jù)集
viper數(shù)據(jù)集一共有1264張圖片, ID從007070到007943一共1467個不同ID的行人

新建腳本5_viper.py,插入代碼:
導(dǎo)入完成后,id為7943。

6、抽取prid 2011
PRID數(shù)據(jù)集有攝像機(jī)A的385條軌跡和攝像機(jī)b的749條軌跡,其中只有200人出現(xiàn)在兩個攝像機(jī)中。該數(shù)據(jù)集還有一個單鏡頭版本,由隨機(jī)選擇的快照組成。有些軌跡沒有很好地同步,這意味著人可能會在連續(xù)的幀之間“跳躍”。
導(dǎo)入prid2011之后,id為9077

7、抽取i-LIDS-VID數(shù)據(jù)集
導(dǎo)入i-LIDS-VID數(shù)據(jù)集后,id為9396

8、抽取GRID數(shù)據(jù)集
QMUL地下再識別(GRID)數(shù)據(jù)集包含250個行人圖像對。每一對都包含兩張從不同視角看到的同一個體的圖像。所有的圖像都是從安裝在一個繁忙的地鐵站的8個不相交的攝像頭視圖中捕捉到的。旁邊的圖顯示了該站的每個相機(jī)視圖的快照和數(shù)據(jù)集中的樣本圖像。由于姿勢的變化,顏色,燈光的變化,數(shù)據(jù)集是具有挑戰(zhàn)性的;以及低空間分辨率造成的圖像質(zhì)量差。

新建8_grid.py腳本,插入代碼:
共有9646個ID。

9、抽取DukeMTMC-reID數(shù)據(jù)集
DukeMTMC-reID的數(shù)據(jù)規(guī)模比較大,格式和CUHK03數(shù)據(jù)集一致。如下圖:

收取數(shù)據(jù)的代碼如下:
完成后,ID為16786。

運(yùn)行FastReid
將制作好的數(shù)據(jù)集,替換原來的的market1501數(shù)據(jù)集。 然后在market1501.py腳本修改如下代碼:

ID改為9646,相機(jī)最大是16,所以相機(jī)的id<=16。改完之后就可以運(yùn)行了。

參考文章:
https://blog.csdn.net/songwsx/article/details/102987787
關(guān)注【學(xué)姐帶你玩AI】回復(fù)“17”獲取完整MSMT17數(shù)據(jù)集