HACS (Human Action Clips and Segments の正式名) は、人間の動作認識に使用されるビデオ データ セットです。
このデータセットには 200 のアクション カテゴリが含まれています。 アクティビティネット-v1.3 データセットの分類は同じです。ビデオは YouTube からのもので、サイズは 504K、各ビデオの長さは 4 分未満、平均長は 2.6 分です。著者は、一様なランダム性と画像分類子の一貫性/不一貫性に基づく方法を使用して、2 秒間の 1.5M ビデオ クリップをサンプリングしました。0.6M サイズはポジティブ サンプルとしてラベル付けされ、0.9M サイズはネガティブ サンプルとしてラベル付けされます。 。データセットには、1.4M のトレーニング セット、50K の検証セット、50K のテスト セットが含まれており、それぞれ 492K、6K、6K のビデオからサンプリングされています。