Action Recognition In Videos 2
コンピュータビジョンは、機械が画像や動画を解釈し理解する技術です。その目的は、人間の視覚システムを模倣することで複雑なシーンの自動認識と分析を達成することにあります。この技術は医療画像診断、自動運転、セキュリティ監視などの分野で広く応用されており、効率性と精度を大幅に向上させ、知能化社会の発展に寄与しています。
ActivityNet
LSTM + Pretrained on YT-8M
AVA v2.1
AVA v2.2
YOWO+LFB*
FS-Something-Something V2-Full
FS-Something-Something V2-Small
ITANet
HMDB-51
Jester (Gesture Recognition)
CPNet Res34, 5 CP
Kinetics-400
Florence
Kinetics-600
Florence
miniSports
G-Blend
NTU RGB+D
2D-3D-Softargmax (RGB only)
PKU-MMD
MMNet
Something-Something V1
Something-Something V2
Sports-1M
THUMOS’14
Single-stream R-C3D (two-way buffer)
UCF101