HyperAIHyperAI

Command Palette

Search for a command to run...

Aktionstuben finden

Georgia Gkioxari; Jitendra Malik

Zusammenfassung

Wir behandeln das Problem der Aktionserkennung in Videos. Angeregt durch die neuesten Fortschritte im Bereich der Objekterkennung aus 2D-Bildern bauen wir Aktionenmodelle unter Verwendung reicher MerkmalsHierarchien, die aus Form- und kinematischen Hinweisen abgeleitet werden. Wir integrieren Erscheinungsbild und Bewegung auf zwei Arten. Erstens wählen wir aus den Bildregionenvorschlägen jene aus, die bewegungsintensiv sind und daher wahrscheinlicher eine Aktion enthalten. Dies führt zu einer erheblichen Reduzierung der Anzahl der zu verarbeitenden Regionen und ermöglicht schnelleren Berechnungen. Zweitens extrahieren wir räumlich-zeitliche Merkmalsrepräsentationen, um starke Klassifikatoren mit Hilfe von Faltungsneuronalen Netzen (Convolutional Neural Networks) zu erstellen. Wir verknüpfen unsere Vorhersagen, um zeitlich konsistente Erkennungen zu erzeugen, die wir als Aktionsröhren bezeichnen. Wir zeigen, dass unser Ansatz bei der Aktionserkennung anderen Techniken überlegen ist.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Aktionstuben finden | Paper | HyperAI