アクション認識

アクション認識は、コンピュータビジョンの分野におけるタスクで、ビデオや画像を通じて人間の行動を識別し分類することを目指しています。このタスクの目的は、ビデオや画像で行われている行動を事前に定義された行動カテゴリーに分類し、正確な行動検出と理解を達成することです。この技術は、ビデオ監視、ヒューマンコンピュータインタラクション、スポーツ分析などの応用において重要な価値を持っています。しかし、大規模なビデオデータセットの構築が困難であるため、現存する多くのアクション認識ベンチマークは比較的小規模で、通常1万本程度のビデオしか含んでいません。

アクション認識 | SOTA | HyperAI超神経