Aktionserkennung in Videos
Die Aktionserkennung in Videos ist eine Aufgabe im Bereich der Computer Vision und Mustererkennung, die das Ziel verfolgt, menschliche Aktionen in Videosequenzen zu identifizieren und zu klassifizieren. Diese Aufgabe erreicht eine intelligente Verarbeitung und Analyse von Videoinhalten, indem sie die räumlich-zeitlichen dynamischen Merkmale von Aktionen analysiert und ihnen eine vordefinierte Kategorie von Aktionen zuordnet, wie zum Beispiel Laufen, Springen oder Schwimmen. Sie hat erheblichen Anwendungswert in Bereichen wie Überwachung, Sportanalyse und Mensch-Computer-Interaktion.
Jester (Gesture Recognition)
CPNet Res34, 5 CP
UCF101
PKU-MMD
MMNet
Something-Something V2
Kinetics-400
Florence
Something-Something V1
Sports-1M
FS-Something-Something V2-Full
FS-Something-Something V2-Small
ITANet
AVA v2.2
YOWO+LFB*
THUMOS’14
Single-stream R-C3D (two-way buffer)
ActivityNet
LSTM + Pretrained on YT-8M
AVA v2.1
miniSports
G-Blend
NTU RGB+D
2D-3D-Softargmax (RGB only)
HMDB-51
Kinetics-600
Florence