Ego4D 第一视角视频数据集

本站暂不支持该数据集下载,如需下载请访问上述「发布地址」进行下载(如可用)

Ego4D 是一个大规模的第一视角视频数据集。该数据集包含超过 3,025 个小时的视频,由来自 9 个国家的 73 个不同地点录制的视频组成,总录制人数达 855 人。

Ego4D 是目前最大的第一视角日常活动视频数据集。一些镜头还包括音频、有关参与者注视焦点位置的数据以及同一场景的多个视角。

该数据集还提出了新的基准挑战:

  • 情景记忆:我的 X 在哪里?
  • 手与物体交互:物体在交互过程中如何变化?
  • 视听日记:谁说了什么,什么时候说的?
  • 社会交互:谁在与谁交互?
  • 预测:接下来会发生什么?