HyperAIHyperAI

Command Palette

Search for a command to run...

Eine bessere Baseline für AVA

Rohit Girdhar João Carreira Carl Doersch Andrew Zisserman

Zusammenfassung

Wir stellen ein einfaches Baseline-Modell für die Aktionserkennung im AVA-Datensatz vor. Das Modell basiert auf dem Faster R-CNN-Bounding-Box-Detektionsframework und wurde angepasst, um rein räumlich-zeitliche Merkmale zu verarbeiten – in unserem Fall ausschließlich von einem I3D-Modell, das auf Kinetics vortrainiert wurde. Dieses Modell erreicht einen durchschnittlichen AP von 21,9 % im Validierungsdatensatz von AVA v2.1, was eine Steigerung gegenüber den 14,5 % des besten RGB-raumzeitlichen Modells ist, das in der ursprünglichen AVA-Publikation verwendet wurde (das sowohl auf Kinetics als auch auf ImageNet vortrainiert war), und gegenüber den 11,3 % des öffentlich zugänglichen Baselines mit einem ResNet101-Bildmerkmalsextraktor, der auf ImageNet vortrainiert war. Unser endgültiges Modell erreicht Werte von 22,8 % / 21,9 % mAP in den Validierungs-/Testdatensätzen und übertrifft alle Einreichungen zur AVA-Herausforderung beim CVPR 2018.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp