手機站首頁散文詩歌雜文隨筆日記小小說

散文網 » 生活 »日常 » 人體姿態(tài)估計相關開源數據集介紹及匯總

人體姿態(tài)估計相關開源數據集介紹及匯總

2022-03-28 09:49 作者:極市平臺 0人讀過 | 我要投稿

編輯丨極市平臺

KTH 多視圖足球數據集

數據集鏈接：http://m6z.cn/692agI

作者收集了一個帶有注釋關節(jié)的足球運動員數據集，可用于多視圖重建。數據集包括：

771張足球運動員的照片
在 257 個時間實例中從 3 個視圖中獲取的圖像
14 個帶注釋的身體關節(jié)

賓夕法尼亞動作數據集

數據集鏈接：http://m6z.cn/692akK

Penn Action Dataset（賓夕法尼亞大學）包含 15 個不同動作的 2326 個視頻序列以及每個序列的人類聯合注釋。

BBC姿態(tài)數據集

數據集鏈接：http://m6z.cn/5xr6Xq

BBC Pose 包含 20 個視頻（每個視頻長度為 0.5 小時至 1.5 小時），由 BBC 錄制，并配有手語翻譯。這 20 個視頻分為 10 個用于訓練的視頻、5 個用于驗證的視頻和 5 個用于測試的視頻。

Poser 數據集

數據集鏈接：http://m6z.cn/6gynqz

Poser 數據集是用于姿態(tài)估計的數據集，由 1927 個訓練圖像和 418 個測試圖像組成。這些圖像是綜合生成的，并調整為單峰預測。這些圖像是使用 Poser 軟件包生成的。

野外 3D 姿勢數據集

數據集鏈接：http://m6z.cn/5xr6Z2

“野外 3D 姿勢數據集”是野外第一個具有準確 3D 姿勢用于評估的數據集。雖然存在戶外其他數據集，但它們都僅限于較小的記錄量。3DPW 是第一個包含從移動電話攝像頭拍攝的視頻片段的技術。

數據集包括：

60 個視頻序列。
2D 姿勢注釋。
使用我們的方法獲得的 3D 姿勢。我們的方法利用了視頻和 IMU，盡管場景很復雜，但姿勢非常準確。
序列中每一幀的相機姿勢。
3D 身體掃描和 3D 人物模型（可重新調整和重新塑造）。每個序列都包含其對應的模型。
18 個不同服裝款式的 3D 模型。

V-COCO數據集

數據集鏈接：http://m6z.cn/5UGaii

V-COCO是一個基于 COCO 的數據集，用于人機交互檢測。V-COCO 提供 10,346 張圖像（2,533 張用于訓練，2,867 張用于驗證，4,946 張用于測試）和 16,199 個人物實例。每個人都有 29 個動作類別的注釋，并且沒有包括對象在內的交互標簽。

宜家 ASM 數據集

數據集鏈接：http://m6z.cn/692aos

宜家 ASM 數據集是裝配任務的多模式和多視圖視頻數據集，可對人類活動進行豐富的分析和理解。它包含 371 個家具組件樣本及其真實注釋。每個樣本包括 3 個 RGB 視圖、一個深度流、原子動作、人體姿勢、對象片段、對象跟蹤和外部相機校準。

立體人體姿勢估計數據集

數據集鏈接：http://m6z.cn/62cnp5

這是一個立體圖像對數據集，適用于上身人的立體人體姿態(tài)估計。SHPED 由 630 個立體圖像對（即 1260 個圖像）組成，分為 42 個視頻片段，每個片段 15 幀。這些剪輯是從 26 個立體視頻中提取的，這些視頻是從 YouTube 獲得的，標簽為 yt3d:enable = true。此外，SHPED 包含 1470 條火柴人上身注釋，對應于 49 個人根據這些條件：直立位置、所有上身部分幾乎可見以及身體的非側面視點。

AIST++ 舞蹈動作數據集

數據集鏈接：http://m6z.cn/5xr6M8

AIST++ 舞蹈動作數據集是從 AIST 舞蹈視頻數據庫構建的。對于多視圖視頻，設計了一個精心設計的管道來估計相機參數、3D 人體關鍵點和 3D 人體舞蹈動作序列：

它為 1010 萬張圖像提供 3D 人體關鍵點注釋和相機參數，涵蓋 9 個視圖中的 30 個不同主題。這些屬性使其成為具有 3D 人體關鍵點注釋的最大和最豐富的現有數據集。它還包含 1,408 個 3D 人類舞蹈動作序列，表示為關節(jié)旋轉以及根軌跡。舞蹈動作平均分布在 10 種舞蹈流派中，有數百種編舞。運動持續(xù)時間從 7.4 秒不等。至 48.0 秒。所有的舞蹈動作都有相應的音樂。

HiEve數據集

數據集鏈接：http://m6z.cn/6o4AAg

該數據集專注于在各種人群和復雜事件中進行非常具有挑戰(zhàn)性和現實性的以人為中心的分析任務，包括地鐵上下車、碰撞、戰(zhàn)斗和地震逃生。并且具有大規(guī)模和密集注釋的標簽，涵蓋了以人為中心的分析中的廣泛任務。

標簽：