HyperAIHyperAI

Command Palette

Search for a command to run...

Hierarchisches Aufmerksamkeitsnetzwerk für Few-Shot-Objekterkennung mittels Meta-Kontrastiver Lernung

Dongwoo Park Jong-Min Lee

Zusammenfassung

Few-shot Object Detection (FSOD) zielt darauf ab, neue Kategorien anhand nur weniger Bilder zu klassifizieren und zu detektieren. Bestehende Meta-Lernverfahren nutzen aufgrund struktureller Einschränkungen die Merkmale zwischen Support- und Query-Bildern nicht ausreichend aus. Wir schlagen ein hierarchisches Aufmerksamkeitsnetzwerk mit sequenziell großen Rezeptivfeldern vor, um die Informationen in Query- und Support-Bildern vollständig auszunutzen. Zudem unterscheidet Meta-Lernen Kategorien nicht ausreichend gut, da es lediglich feststellt, ob Support- und Query-Bilder übereinstimmen. Mit anderen Worten: metrikbasiertes Lernen zur Klassifikation ist ineffektiv, da es nicht direkt auf das Ziel abzielt. Daher schlagen wir eine kontrastive Lernmethode vor, die wir Meta-Kontrastives Lernen nennen, welche direkt zur Realisierung des Meta-Lernziels beiträgt. Schließlich etablieren wir ein neues State-of-the-Art-Netzwerk, das durch signifikante Verbesserungen gekennzeichnet ist. Unsere Methode erzielt auf dem COCO-Datensatz Verbesserungen der AP um 2,3, 1,0, 1,3, 3,4 und 2,4 Prozentpunkte bei 1- bis 30-Shot Object Detection. Unser Code ist verfügbar unter: https://github.com/infinity7428/hANMCL


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp