HyperAIHyperAI

Command Palette

Search for a command to run...

BoxMask: Neubewertung der Bounding Box-Supervision für die Video-Objekterkennung

Khurram Azeem Hashmi Alain Pagani Didier Stricker Muhammamd Zeshan Afzal

Zusammenfassung

Wir präsentieren einen neuen, einfachen jedoch effektiven Ansatz zur Erhebung der Videoobjektdetektion. Wir beobachten, dass frühere Arbeiten auf der Ebene der Instanz-Feature-Aggregation operieren, wodurch die verfeinerten pixelbasierten Darstellungen unweigerlich vernachlässigt werden und somit Verwechslungen zwischen Objekten mit ähnlichen Erscheinungs- oder Bewegungseigenschaften entstehen. Um diese Einschränkung zu überwinden, schlagen wir BoxMask vor, das diskriminative Darstellungen effektiv durch Einbeziehung klassenbewusster pixelbasierter Informationen lernt. Wir betrachten einfach die Bounding-Box-Anmerkungen als grobe Masken für jedes Objekt, um unseren Ansatz zu supervidieren. Das vorgeschlagene Modul lässt sich problemlos in beliebige regionenbasierte Detektoren integrieren, um deren Leistung zu steigern. Umfangreiche Experimente auf den Datensätzen ImageNet VID und EPIC KITCHENS zeigen eine konsistente und signifikante Verbesserung, wenn wir das BoxMask-Modul in zahlreiche aktuelle state-of-the-art-Methoden einbinden.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp