HyperAIHyperAI

Command Palette

Search for a command to run...

Extraktion von Inter-Video-Vorschlags-Beziehungen für die Video-Objektdetektion

Xiaojun Chang Yu Qiao Yali Wang Mingfei Han

Zusammenfassung

Neuere Studien haben gezeigt, dass die Berücksichtigung von Kontextinformationen aus Vorschlägen in verschiedenen Frames die Leistung von Video-Objekterkennung deutlich verbessern kann. Allerdings nutzen diese Ansätze hauptsächlich die innerhalb einzelner Videos bestehenden Beziehungen zwischen Vorschlägen, während sie die innerhalb von verschiedenen Videos bestehenden Beziehungen zwischen Vorschlägen vernachlässigen, welche wichtige diskriminative Hinweise für die Erkennung verwirrender Objekte liefern können. Um diesen Limitierung zu begegnen, schlagen wir einen neuen Inter-Video-Vorschlag-Beziehung-Modul (Inter-Video Proposal Relation Module) vor. Auf Basis eines kompakten mehrstufigen Dreier-Selektionsansatzes kann dieser Modul effektive Objektrepräsentationen durch Modellierung der Beziehungen zwischen anspruchsvollen Vorschlägen aus verschiedenen Videos erlernen. Darüber hinaus entwerfen wir ein hierarchisches Video-Beziehungsnetzwerk (Hierarchical Video Relation Network, HVR-Net), indem wir innerhalb- und zwischen-Video-Vorschlagsbeziehungen hierarchisch integrieren. Diese Architektur ermöglicht es, schrittweise sowohl intra- als auch inter-Video-Kontextinformationen auszunutzen, um die Video-Objekterkennung zu verbessern. Wir evaluieren unsere Methode am großen Video-Objekterkennungsbenchmark ImageNet VID, wo HVR-Net SOTA-Ergebnisse erzielt. Die Codes und Modelle werden anschließend veröffentlicht.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Extraktion von Inter-Video-Vorschlags-Beziehungen für die Video-Objektdetektion | Paper | HyperAI