HyperAIHyperAI

Command Palette

Search for a command to run...

Verfolgung durch natürliche-Sprache-Spezifikation

Arnold W. M. Smeulders Efstratios Gavves Zhenyang Li Ran Tao Cees G. M. Snoek

Zusammenfassung

Diese Arbeit befasst sich mit der Verfolgung eines Zielobjekts in einem Video. Anstatt das Ziel im ersten Frame eines Videos durch eine Begrenzungsbox anzugeben, schlagen wir vor, das Objekt basierend auf einer natürlichsprachlichen Beschreibung des Ziels zu verfolgen. Dies ermöglicht eine natürlichere Mensch-Maschine-Interaktion sowie eine Möglichkeit zur Verbesserung der Verfolgungsergebnisse. Wir definieren drei Varianten der sprachbasierten Verfolgung: eine, die ausschließlich auf einer sprachlichen Zielbeschreibung beruht; eine, die auf einer visuellen Zielbeschreibung basiert, die mittels Sprache generiert wird; und eine dritte, die die gemeinsame Kapazität beider Ansätze nutzt. Um das Potenzial der Verfolgung mittels natürlichsprachlicher Spezifikation zu verdeutlichen, erweitern wir zwei gängige Verfolgungsdatasets um sprachliche Beschreibungen und präsentieren experimentelle Ergebnisse. Schließlich skizzieren wir auch neue Anwendungsszenarien im Bereich der Überwachung und anderer Echtzeit-Videostreams, die durch eine sprachliche Spezifikation des Ziels erst möglich werden.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Verfolgung durch natürliche-Sprache-Spezifikation | Paper | HyperAI