UT-Interaction 人类交互数据集包含 6 种人与人之间交互的视频(连续动作):握手、指向、拥抱、推、踢和打拳。该数据集提供了这些交互动作的 ground truth 标签,包括时间间隔 (time interval) 和 bounding box 。
UT-Interaction 总共有 20 个长度在 1 分钟左右的视频序列,每个视频至少包含一次交互动作执行,平均每个视频包括 8 次动作执行。视频中出现了数名参与者,服装超过 15 种。视频采用 720*480 分辨率,30fps ,人物在视频里的高度约为 200 像素。
做种 2
下载中 0
已完成 405
总下载 523