HyperAIHyperAI
vor 11 Tagen

Hierarchisches Aufmerksamkeitsnetzwerk für Few-Shot-Objekterkennung mittels Meta-Kontrastiver Lernung

Dongwoo Park, Jong-Min Lee
Hierarchisches Aufmerksamkeitsnetzwerk für Few-Shot-Objekterkennung mittels Meta-Kontrastiver Lernung
Abstract

Few-shot Object Detection (FSOD) zielt darauf ab, neue Kategorien anhand nur weniger Bilder zu klassifizieren und zu detektieren. Bestehende Meta-Lernverfahren nutzen aufgrund struktureller Einschränkungen die Merkmale zwischen Support- und Query-Bildern nicht ausreichend aus. Wir schlagen ein hierarchisches Aufmerksamkeitsnetzwerk mit sequenziell großen Rezeptivfeldern vor, um die Informationen in Query- und Support-Bildern vollständig auszunutzen. Zudem unterscheidet Meta-Lernen Kategorien nicht ausreichend gut, da es lediglich feststellt, ob Support- und Query-Bilder übereinstimmen. Mit anderen Worten: metrikbasiertes Lernen zur Klassifikation ist ineffektiv, da es nicht direkt auf das Ziel abzielt. Daher schlagen wir eine kontrastive Lernmethode vor, die wir Meta-Kontrastives Lernen nennen, welche direkt zur Realisierung des Meta-Lernziels beiträgt. Schließlich etablieren wir ein neues State-of-the-Art-Netzwerk, das durch signifikante Verbesserungen gekennzeichnet ist. Unsere Methode erzielt auf dem COCO-Datensatz Verbesserungen der AP um 2,3, 1,0, 1,3, 3,4 und 2,4 Prozentpunkte bei 1- bis 30-Shot Object Detection. Unser Code ist verfügbar unter: https://github.com/infinity7428/hANMCL

Hierarchisches Aufmerksamkeitsnetzwerk für Few-Shot-Objekterkennung mittels Meta-Kontrastiver Lernung | Neueste Forschungsarbeiten | HyperAI