HyperAIHyperAI
vor 17 Tagen

Hierarchischer Shot-Detektor

{ Xuelong Li, Jungong Han, Yanwei Pang, Jiale Cao}
Hierarchischer Shot-Detektor
Abstract

Der Single Shot Detector prognostiziert gleichzeitig Objektkategorien und Regressions-Offset-Werte der Standardboxen. Trotz hoher Effizienz weist diese Architektur einige unangemessene Entwürfe auf: (1) Während der Inferenz wird das Klassifikationsergebnis der Standardbox fälschlicherweise auf die regressierte Box übertragen; (2) Eine einzige Regressionsoperation reicht nicht aus, um eine präzise Objekterkennung zu gewährleisten. Um das erste Problem zu lösen, wird ein neuartiges Reg-Offset-CLS (ROC)-Modul vorgeschlagen. Es umfasst drei hierarchische Schritte: Box-Regression, Vorhersage der Merkmalsabtastpositionen und Klassifikation der regressierten Box unter Verwendung der Merkmale aus den Offset-Positionen. Um das zweite Problem weiter zu beheben, wird ein hierarchischer Shot-Detektor (HSD) vorgestellt, der zwei ROC-Module sowie ein Merkmalsverstärkungsmodul enthält. Das zweite ROC-Modul nimmt die regressierten Boxen sowie die Merkmalsabtastpositionen aus dem ersten ROC als Eingabe. Gleichzeitig dient das zwischen den beiden ROC-Modulen eingefügte Merkmalsverstärkungsmodul dazu, sowohl lokale als auch nicht-lokale Kontextinformationen zu extrahieren. Experimente auf den Datensätzen MS COCO und PASCAL VOC belegen die Überlegenheit des vorgeschlagenen HSD. Ohne zusätzliche Komponenten übertrifft der HSD alle Einzelstufen-Methoden in Echtzeitgeschwindigkeit.