HyperAIHyperAI
vor 7 Tagen

Ein Dreischicht-Plugin zur Verbesserung der Detektion verdeckter Objekte

Guanqi Zhan, Weidi Xie, Andrew Zisserman
Ein Dreischicht-Plugin zur Verbesserung der Detektion verdeckter Objekte
Abstract

Die Erkennung verdeckter Objekte stellt weiterhin eine Herausforderung für moderne Objektdetektoren dar. Ziel dieser Arbeit ist es, die Erkennung solcher Objekte zu verbessern und damit die Gesamtleistung eines modernen Objektdetektors zu steigern.Dazu leisten wir folgende vier Beiträge: (1) Wir stellen ein einfaches „Plugin“-Modul für den Detektionskopf zweistufiger Objektdetektoren vor, das die Recall-Rate für teilweise verdeckte Objekte erhöht. Das Modul prognostiziert eine dreischichtige Maske für das Zielobjekt, den Verdecker und das Verdeckte und ermöglicht dadurch eine präzisere Vorhersage der Maske des Zielobjekts. (2) Wir schlagen eine skalierbare Pipeline zur Generierung von Trainingsdaten für das Modul vor, indem wir die amodale Ergänzung bestehender Datensätze für Objektdetektion und Instanzsegmentierung nutzen, um Verdeckungsbeziehungen zu etablieren. (3) Wir stellen zudem einen neuen COCO-Evaluation-Datensatz bereit, um die Recall-Leistung bei teilweise verdeckten und getrennten Objekten zu messen. (4) Wir zeigen, dass das eingefügte Plugin-Modul in einem zweistufigen Detektor die Leistung erheblich steigert, wenn lediglich der Detektionskopf feinabgestimmt wird, und zusätzliche Verbesserungen erzielt werden kann, wenn die gesamte Architektur feinabgestimmt wird. Die Ergebnisse auf COCO werden für Mask R-CNN mit Swin-T- oder Swin-S-Backbones sowie für Cascade Mask R-CNN mit einem Swin-B-Backbone berichtet.

Ein Dreischicht-Plugin zur Verbesserung der Detektion verdeckter Objekte | Neueste Forschungsarbeiten | HyperAI