人體姿態(tài)估計相關開源數據集介紹及匯總
編輯丨極市平臺
KTH 多視圖足球數據集
數據集鏈接:http://m6z.cn/692agI
作者收集了一個帶有注釋關節(jié)的足球運動員數據集,可用于多視圖重建。數據集包括:
771張足球運動員的照片
在 257 個時間實例中從 3 個視圖中獲取的圖像
14 個帶注釋的身體關節(jié)

賓夕法尼亞動作數據集
數據集鏈接:http://m6z.cn/692akK
Penn Action Dataset(賓夕法尼亞大學)包含 15 個不同動作的 2326 個視頻序列以及每個序列的人類聯合注釋。

BBC姿態(tài)數據集
數據集鏈接:http://m6z.cn/5xr6Xq
BBC Pose 包含 20 個視頻(每個視頻長度為 0.5 小時至 1.5 小時),由 BBC 錄制,并配有手語翻譯。這 20 個視頻分為 10 個用于訓練的視頻、5 個用于驗證的視頻和 5 個用于測試的視頻。

Poser 數據集
數據集鏈接:http://m6z.cn/6gynqz
Poser 數據集是用于姿態(tài)估計的數據集,由 1927 個訓練圖像和 418 個測試圖像組成。這些圖像是綜合生成的,并調整為單峰預測。這些圖像是使用 Poser 軟件包生成的。

野外 3D 姿勢數據集
數據集鏈接:http://m6z.cn/5xr6Z2
“野外 3D 姿勢數據集”是野外第一個具有準確 3D 姿勢用于評估的數據集。雖然存在戶外其他數據集,但它們都僅限于較小的記錄量。3DPW 是第一個包含從移動電話攝像頭拍攝的視頻片段的技術。
數據集包括:
60 個視頻序列。
2D 姿勢注釋。
使用我們的方法獲得的 3D 姿勢。我們的方法利用了視頻和 IMU,盡管場景很復雜,但姿勢非常準確。
序列中每一幀的相機姿勢。
3D 身體掃描和 3D 人物模型(可重新調整和重新塑造)。每個序列都包含其對應的模型。
18 個不同服裝款式的 3D 模型。

V-COCO數據集
數據集鏈接:http://m6z.cn/5UGaii
V-COCO是一個基于 COCO 的數據集,用于人機交互檢測。V-COCO 提供 10,346 張圖像(2,533 張用于訓練,2,867 張用于驗證,4,946 張用于測試)和 16,199 個人物實例。每個人都有 29 個動作類別的注釋,并且沒有包括對象在內的交互標簽。

宜家 ASM 數據集
數據集鏈接:http://m6z.cn/692aos
宜家 ASM 數據集是裝配任務的多模式和多視圖視頻數據集,可對人類活動進行豐富的分析和理解。它包含 371 個家具組件樣本及其真實注釋。每個樣本包括 3 個 RGB 視圖、一個深度流、原子動作、人體姿勢、對象片段、對象跟蹤和外部相機校準。

立體人體姿勢估計數據集
數據集鏈接:http://m6z.cn/62cnp5
這是一個立體圖像對數據集,適用于上身人的立體人體姿態(tài)估計。SHPED 由 630 個立體圖像對(即 1260 個圖像)組成,分為 42 個視頻片段,每個片段 15 幀。這些剪輯是從 26 個立體視頻中提取的,這些視頻是從 YouTube 獲得的,標簽為 yt3d:enable = true。此外,SHPED 包含 1470 條火柴人上身注釋,對應于 49 個人根據這些條件:直立位置、所有上身部分幾乎可見以及身體的非側面視點。

AIST++ 舞蹈動作數據集
數據集鏈接:http://m6z.cn/5xr6M8
AIST++ 舞蹈動作數據集是從 AIST 舞蹈視頻數據庫構建的。對于多視圖視頻,設計了一個精心設計的管道來估計相機參數、3D 人體關鍵點和 3D 人體舞蹈動作序列:
它為 1010 萬張圖像提供 3D 人體關鍵點注釋和相機參數,涵蓋 9 個視圖中的 30 個不同主題。這些屬性使其成為具有 3D 人體關鍵點注釋的最大和最豐富的現有數據集。它還包含 1,408 個 3D 人類舞蹈動作序列,表示為關節(jié)旋轉以及根軌跡。舞蹈動作平均分布在 10 種舞蹈流派中,有數百種編舞。運動持續(xù)時間從 7.4 秒不等。至 48.0 秒。所有的舞蹈動作都有相應的音樂。

HiEve數據集
數據集鏈接:http://m6z.cn/6o4AAg
該數據集專注于在各種人群和復雜事件中進行非常具有挑戰(zhàn)性和現實性的以人為中心的分析任務,包括地鐵上下車、碰撞、戰(zhàn)斗和地震逃生。并且具有大規(guī)模和密集注釋的標簽,涵蓋了以人為中心的分析中的廣泛任務。
