HACS 全称 Human Action Clips and Segments,是一个用于人体动作识别的视频数据集。
该数据集包含 200 个动作类别,与 ActivityNet-v1.3 数据集的分类相同。视频来源于 YouTube,大小为 504K,每个视频时长少于 4 分钟,平均长度为 2.6 分钟。作者采用基于均匀随机性和基于图像分类器一致性/不一致性的方法对时长为 2 秒,共 1.5M 的视频片段进行采样,大小 0.6M 的标注为阳性样本,大小 0.9M 的标注为阴性样本。该数据集包括 1.4M 的训练集、 50K 的验证集和 50K 的测试集,分别从 492K 、 6K 和 6K 的视频中采样。