Charades 数据集包含人们进行日常活动的真实视频。该数据集由 9,848 个平均长度为 30 秒的日常室内活动视频组成,涉及 15 种室内场景、 46 个对象类别的交互,包含 30 个动词及 157 个动作类别。
该数据集中的每个视频都带有标注:多个自定义文本描述、动作标签、动作间隔和交互对象类别。平均每个视频包含 6.8 个动作,由数百位用户在自己家中创建。向 267 个用户呈现一个句子,该句子包括固定词汇中的物体和动作,由他们录制视频来表演这个句子。
该数据集包含了 157 个动作类别的 66,500 个时间标注,46 个带有 41,104 个标签的对象类别,以及 27,847 个对视频的文字描述。在标准集中,有 7,986 个训练视频和 1,863 个验证视频。
做种 1
下载中 1
已完成 494
总下载 776