HyperAIHyperAI
vor 2 Monaten

Residueller Aufmerksamkeit: Eine einfache, aber effektive Methode für die Mehrfachklassifizierung

Zhu, Ke ; Wu, Jianxin
Residueller Aufmerksamkeit: Eine einfache, aber effektive Methode für die Mehrfachklassifizierung
Abstract

Die Mehrfachkategorien-Bilderkennung ist eine herausfordernde Aufgabe im Bereich der Computer Vision von praktischer Bedeutung. Fortschritte in diesem Bereich sind jedoch oft durch komplizierte Methoden, aufwändige Berechnungen und den Mangel an intuitiven Erklärungen gekennzeichnet. Um verschiedene räumliche Regionen zu erfassen, die von Objekten unterschiedlicher Kategorien eingenommen werden, schlagen wir ein erstaunlich einfaches Modul vor, das als klassenspezifische residuale Aufmerksamkeit (Class-Specific Residual Attention, CSRA) bezeichnet wird. CSRA generiert für jede Kategorie klassenspezifische Merkmale durch die Einführung eines einfachen räumlichen Aufmerksamkeitswertes und kombiniert diesen anschließend mit dem klassenunabhängigen Durchschnittspooling-Merkmalsvektor. CSRA erreicht Stand-of-the-Art-Ergebnisse bei der Mehrfachkategorien-Erkennung und ist dabei viel einfacher als vergleichbare Ansätze. Darüber hinaus führt CSRA mit nur vier Zeilen Code zu einem konsistenten Leistungsanstieg bei vielen verschiedenen vortrainierten Modellen und Datensätzen, ohne zusätzliche Trainingsphasen zu erfordern. CSRA ist sowohl einfach umzusetzen als auch rechnerisch effizient und bietet zudem intuitive Erklärungen und Visualisierungen.

Residueller Aufmerksamkeit: Eine einfache, aber effektive Methode für die Mehrfachklassifizierung | Neueste Forschungsarbeiten | HyperAI