HyperAIHyperAI

Command Palette

Search for a command to run...

CTRN: Class-Temporal Relational Network für die Aktionsdetektion

Rui Dai Srijan Das Francois Bremond

Zusammenfassung

Die Aktionsdetektion ist eine zentrale und herausfordernde Aufgabe, insbesondere für dicht annotierte Datensätze ungeschnittener Videos. Solche Datensätze beinhalten zahlreiche realweltbezogene Herausforderungen, wie zusammengesetzte Aktionen, gleichzeitige Aktionen sowie eine hohe zeitliche Variabilität der Aktionsdauer. Um diesen Herausforderungen zu begegnen, schlagen wir vor, sowohl die Klassen- als auch die zeitlichen Beziehungen detektierter Aktionen zu erforschen. In dieser Arbeit stellen wir ein end-to-end-Netzwerk vor: das Class-Temporal Relational Network (CTRN). Es besteht aus drei Schlüsselkomponenten: (1) Das Representation Transform Modul filtert klassenspezifische Merkmale aus gemischten Darstellungen, um graphbasierte Daten zu erstellen. (2) Das Class-Temporal Modul modelliert die Klassen- und zeitlichen Beziehungen sequenziell. (3) Der G-Classifier nutzt das privilegierte Wissen über snippetweise auftretende Aktionenpaare, um die Detektion gleichzeitiger Aktionen weiter zu verbessern. Wir evaluieren CTRN auf drei anspruchsvollen, dicht annotierten Datensätzen und erreichen dabei state-of-the-art-Leistungen, was die Wirksamkeit und Robustheit unseres Ansatzes unterstreicht.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp