動画中の行動認識
ビデオにおける動作認識は、コンピュータビジョンとパターン認識の分野におけるタスクで、ビデオシーケンス内のヒューマンアクションを識別し分類することを目指しています。このタスクでは、動作の空間時間的な動的特徴を分析し、それらを走る、跳ぶ、泳ぐなどの事前に定義されたアクションカテゴリにマッピングすることで、ビデオコンテンツの知能的な理解と解析を実現します。監視、スポーツ分析、ヒューマンコンピュータインタラクションなどの分野で、動作認識は重要な応用価値を持っています。
Jester (Gesture Recognition)
CPNet Res34, 5 CP
UCF101
PKU-MMD
MMNet
Something-Something V2
Kinetics-400
Florence
Something-Something V1
AVA v2.2
YOWO+LFB*
FS-Something-Something V2-Small
ITANet
FS-Something-Something V2-Full
Sports-1M
THUMOS’14
Single-stream R-C3D (two-way buffer)
ActivityNet
LSTM + Pretrained on YT-8M
AVA v2.1
HMDB-51
Kinetics-600
Florence
miniSports
G-Blend
NTU RGB+D
2D-3D-Softargmax (RGB only)