HyperAIHyperAI

Command Palette

Search for a command to run...

Komprehensives Aufmerksamkeits-Self-Distillation für schwach beschriftete Objektdetektion

Zeyi Huang Yang Zou Vijayakumar Bhagavatula Dong Huang

Zusammenfassung

Schwach beschriftete Objektdetektion (Weakly Supervised Object Detection, WSOD) ist zu einem effektiven Werkzeug geworden, um Objektdetektoren ausschließlich anhand von bildweisen Kategorielabels zu trainieren. Ohne objektweise Annotationen neigen WSOD-Detektoren jedoch dazu, Bounding Boxes auf auffällige Objekte, gruppierte Objekte sowie diskriminative Objektteile zu detektieren. Zudem erzwingen bildweise Kategorielabel keine konsistente Objektdetektion über verschiedene Transformationen derselben Bilder hinweg. Um diese Probleme anzugehen, schlagen wir einen umfassenden Aufmerksamkeits-Selbst-Distillation (Comprehensive Attention Self-Distillation, CASD)-Trainingsansatz für WSOD vor. Um das Merkmalslernen über alle Objektinstanzen hinweg auszugleichen, berechnet CASD die umfassende Aufmerksamkeit, die aus mehreren Transformationen und Merkmalschichten desselben Bildes aggregiert wird. Um eine konsistente räumliche Supervision auf Objekte zu gewährleisten, führt CASD eine Selbst-Distillation in den WSOD-Netzwerken durch, sodass die umfassende Aufmerksamkeit gleichzeitig durch mehrere Transformationen und Merkmalschichten desselben Bildes approximiert wird. CASD erzielt neue SOTA-Ergebnisse (State-of-the-Art) für WSOD auf etablierten Benchmarks wie PASCAL VOC 2007/2012 und MS-COCO.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp