HyperAIHyperAI
vor 11 Tagen

Meta-DETR: Bildbereichs-basierte Few-Shot-Objekterkennung mit Ausnutzung der Inter-Klassen-Korrelation

Gongjie Zhang, Zhipeng Luo, Kaiwen Cui, Shijian Lu
Meta-DETR: Bildbereichs-basierte Few-Shot-Objekterkennung mit Ausnutzung der Inter-Klassen-Korrelation
Abstract

Few-shot-Objektdetektion wurde umfassend untersucht, indem Meta-Learning in region-basierte Detektionsframeworks integriert wurde. Trotz des Erfolgs sind diese Ansätze durch mehrere Einschränkungen geprägt, darunter (i) geringe Qualität der Regionsvorschläge für neue Klassen und (ii) die Vernachlässigung der Korrelation zwischen verschiedenen Klassen. Diese Beschränkungen behindern die Verallgemeinerung von Basis-Klassen-Wissen für die Detektion von Objekten neuer Klassen. In dieser Arbeit stellen wir Meta-DETR vor, ein neuartiges Few-shot-Detektionsframework, das eine Korrelationsaggregation für Meta-Learning in DETR-basierte Detektionsframeworks integriert. Meta-DETR arbeitet vollständig auf Bild-Ebene und benötigt keine Regionsvorschläge, wodurch die Einschränkung durch ungenaue Vorschläge in etablierten Few-shot-Detektionsframeworks umgangen wird. Darüber hinaus kann Meta-DETR gleichzeitig mehrere Support-Klassen innerhalb einer einzigen Feed-Forward-Phase verarbeiten. Diese einzigartige Architektur ermöglicht die Erfassung der Korrelation zwischen verschiedenen Klassen, was die Fehlklassifizierung ähnlicher Klassen erheblich reduziert und die Verallgemeinerungsfähigkeit auf neue Klassen verbessert. Experimente an mehreren Few-shot-Objektdetektionsbenchmarks zeigen, dass das vorgeschlagene Meta-DETR state-of-the-art-Methoden deutlich übertrifft. Der Implementierungscode wird unter https://github.com/ZhangGongjie/Meta-DETR veröffentlicht.

Meta-DETR: Bildbereichs-basierte Few-Shot-Objekterkennung mit Ausnutzung der Inter-Klassen-Korrelation | Neueste Forschungsarbeiten | HyperAI