HyperAIHyperAI
vor 2 Monaten

DeFRCN: Entkoppeltes Faster R-CNN für Few-Shot-Objekterkennung

Qiao, Limeng ; Zhao, Yuxuan ; Li, Zhiyuan ; Qiu, Xi ; Wu, Jianan ; Zhang, Chi
DeFRCN: Entkoppeltes Faster R-CNN für Few-Shot-Objekterkennung
Abstract

Die Few-Shot-Objekterkennung, die darauf abzielt, neuartige Objekte auf der Grundlage extrem weniger annotierter Beispiele von zuvor unbekannten Klassen schnell zu erkennen, hat in der Forschergemeinschaft erhebliches Interesse geweckt. Die meisten existierenden Ansätze verwenden das Faster R-CNN als grundlegendes Erkennungsframework. Aufgrund des Mangels an maßgeschneiderten Überlegungen für Szenarien mit Datenknappheit ist jedoch ihre Leistung oft nicht zufriedenstellend. In dieser Arbeit untersuchen wir das konventionelle Faster R-CNN genauer und analysieren dessen Widersprüche aus zwei orthogonalen Perspektiven, nämlich multistufig (RPN vs. RCNN) und multitasking (Klassifikation vs. Lokalisierung). Um diese Probleme zu lösen, schlagen wir eine einfache, aber effektive Architektur vor, die Decoupled Faster R-CNN (DeFRCN) genannt wird. Konkret erweitern wir das Faster R-CNN durch die Einführung einer Gradient Decoupled Layer für die multistufige Entkopplung und eines Prototypical Calibration Block für die multitask-Entkopplung. Die Gradient Decoupled Layer ist eine neuartige tiefere Schicht, die den Feature-Forward-Vorgang und den Gradient-Backward-Vorgang neu definiert, um ihre nachfolgende und vorhergehende Schicht zu entkoppeln. Der Prototypical Calibration Block ist ein offline-basierter prototypischer Klassifikationsmodell, das Vorschläge vom Detektor als Eingabe verwendet und die ursprünglichen Klassifikationsscores durch zusätzliche paarweise Scores zur Kalibrierung verbessert. Ausführliche Experimente auf mehreren Benchmarks zeigen, dass unser Framework deutlich überlegen anderen existierenden Ansätzen ist und einen neuen Stand der Technik in der Few-Shot-Literatur etabliert.

DeFRCN: Entkoppeltes Faster R-CNN für Few-Shot-Objekterkennung | Neueste Forschungsarbeiten | HyperAI