HyperAIHyperAI
vor 17 Tagen

BoxMask: Neubewertung der Bounding Box-Supervision für die Video-Objekterkennung

Khurram Azeem Hashmi, Alain Pagani, Didier Stricker, Muhammamd Zeshan Afzal
BoxMask: Neubewertung der Bounding Box-Supervision für die Video-Objekterkennung
Abstract

Wir präsentieren einen neuen, einfachen jedoch effektiven Ansatz zur Erhebung der Videoobjektdetektion. Wir beobachten, dass frühere Arbeiten auf der Ebene der Instanz-Feature-Aggregation operieren, wodurch die verfeinerten pixelbasierten Darstellungen unweigerlich vernachlässigt werden und somit Verwechslungen zwischen Objekten mit ähnlichen Erscheinungs- oder Bewegungseigenschaften entstehen. Um diese Einschränkung zu überwinden, schlagen wir BoxMask vor, das diskriminative Darstellungen effektiv durch Einbeziehung klassenbewusster pixelbasierter Informationen lernt. Wir betrachten einfach die Bounding-Box-Anmerkungen als grobe Masken für jedes Objekt, um unseren Ansatz zu supervidieren. Das vorgeschlagene Modul lässt sich problemlos in beliebige regionenbasierte Detektoren integrieren, um deren Leistung zu steigern. Umfangreiche Experimente auf den Datensätzen ImageNet VID und EPIC KITCHENS zeigen eine konsistente und signifikante Verbesserung, wenn wir das BoxMask-Modul in zahlreiche aktuelle state-of-the-art-Methoden einbinden.