HyperAIHyperAI
vor 16 Tagen

HSIC-basierte Moving-Weight-Averaging-Methode für Few-Shot Open-Set Object Detection

{Binyi Su; Hua Zhang; Zhong Zhou}
Abstract

Wir untersuchen das Problem des Few-Shot Open-Set Object Detection (FOOD), dessen Ziel darin besteht, ein Modell schnell an eine kleine Menge annotierter Beispiele anzupassen und gleichzeitig Objekte unbekannter Klassen abzulehnen. In jüngeren Arbeiten wird häufig die Gewichtssparsamkeit zur Ablehnung unbekannter Klassen eingesetzt; aufgrund der mangelnden spezifischen Berücksichtigung datenscharfer Szenarien erzielt diese Herangehensweise jedoch nicht zufriedenstellende Leistung. In dieser Arbeit lösen wir das herausfordernde Problem des Few-Shot Open-Set Object Detection aus drei Perspektiven. Erstens verwenden wir im Gegensatz zu früheren Methoden zur Generierung von Pseudounbekannten (pseudo-unknown) Proben eine evidenzbasierte Unsicherheit, die durch die Dirichlet-Verteilung der Wahrscheinlichkeiten geschätzt wird, um Pseudounbekannte aus dem Vordergrund- und Hintergrundvorschlagsraum zu extrahieren. Zweitens leiten wir auf Basis einer statistischen Analyse zwischen der Anzahl der Pseudounbekannten und dem Intersection over Union (IoU) ein IoU-orientiertes Objektiv für die Unbekannterkennung her, das durch Berücksichtigung der Lokalisationsqualität die Entscheidungsgrenze für Unbekannte schärft. Drittens schlagen wir eine HSIC-basierte (Hilbert-Schmidt Independence Criterion) bewegliche Gewichtsdurchschnittsbildung zur Aktualisierung der Gewichte der Klassifikations- und Regressionsköpfe vor, um das Überanpassungsproblem zu unterdrücken und die Generalisierungsfähigkeit des Modells für die Ablehnung unbekannter Klassen zu verbessern; dabei wird der Grad der Unabhängigkeit zwischen den aktuellen Gewichten und den in Langzeit-Speicherbanken gespeicherten vorherigen Gewichten berücksichtigt. Wir vergleichen unsere Methode mit mehreren state-of-the-art Ansätzen und beobachten, dass unsere Methode die mittlere Recall-Rate unbekannter Klassen im VOC-COCO-Datensatz um 12,87 % über alle Shot-Zahlen hinweg verbessert. Unser Code ist unter https://github.com/binyisu/food verfügbar.

HSIC-basierte Moving-Weight-Averaging-Methode für Few-Shot Open-Set Object Detection | Neueste Forschungsarbeiten | HyperAI