vor 6 Monaten

Zusammenfassung

Die meisten aktuell fortschrittlichsten Methoden zur Aktenerkennung basieren auf einer Zweistromarchitektur, die Erscheinungsbild und Bewegung unabhängig voneinander verarbeitet. In diesem Artikel argumentieren wir, dass die gemeinsame Berücksichtigung beider Modalitäten reichhaltige Informationen für die Aktenerkennung liefert. Wir stellen eine neuartige Darstellung vor, die die Bewegung semantischer Schlüsselpunkte elegant codiert. Hierbei verwenden wir menschliche Gelenke als diese Schlüsselpunkte und bezeichnen unsere Darstellung als Pose moTion – PoTion. Konkret führen wir zunächst einen state-of-the-art menschlichen Pose-Tracker aus und extrahieren Heatmaps für die menschlichen Gelenke in jedem Frame. Unser PoTion-Darstellung ergibt sich durch zeitliche Aggregation dieser Wahrscheinlichkeitskarten, wobei jede Karte je nach relativer Zeitposition im Video-Clip farbkodiert und anschließend summiert wird. Diese festen, auf das gesamte Video-Clip bezogenen Darstellungen eignen sich ideal zur Aktenerkennung mittels eines flachen konvolutionellen neuronalen Netzes. Unsere experimentelle Bewertung zeigt, dass PoTion andere state-of-the-art Pose-Darstellungen übertrifft. Zudem ergänzt PoTion die herkömmlichen Erscheinungs- und Bewegungsströme komplementär. Bei der Kombination von PoTion mit dem jüngsten Zweistromansatz I3D [5] erreichen wir state-of-the-art Ergebnisse auf den Datensätzen JHMDB, HMDB und UCF101.

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 6 Monaten

Aktionserkennung

Faltungsneuronales Netzwerk

JÃ©rÃ´me Revaud Vasileios Choutas Cordelia Schmid Philippe Weinzaepfel

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 6 Monaten

Aktionserkennung

Faltungsneuronales Netzwerk

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

PoTion: Pose MoTion Darstellung für die Aktionserkennung

JÃ©rÃ´me Revaud Vasileios Choutas Cordelia Schmid Philippe Weinzaepfel

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

PoTion: Pose MoTion Darstellung für die Aktionserkennung

JÃ©rÃ´me Revaud Vasileios Choutas Cordelia Schmid Philippe Weinzaepfel

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

PoTion: Pose MoTion Darstellung für die Aktionserkennung

JÃ©rÃ´me Revaud Vasileios Choutas Cordelia Schmid Philippe Weinzaepfel

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters