HyperAIHyperAI

Command Palette

Search for a command to run...

Feinabgestimmte visuelle Klassifikation mit effizienter end-to-end Lokalisierung

Harald Hanselmann Hermann Ney

Zusammenfassung

Der Begriff feinkörnige visuelle Klassifikation (fine-grained visual classification, FGVC) bezeichnet Klassifikationsaufgaben, bei denen die Klassen sehr ähnlich sind und das Klassifikationsmodell in der Lage sein muss, subtile Unterschiede zu erkennen, um eine korrekte Vorhersage zu treffen. Moderne Ansätze beinhalten häufig einen Lokalisierungsschritt, der dem Klassifikationsnetzwerk hilft, indem relevante Teile der Eingabebilder lokalisiert werden. Dies erfordert jedoch meist mehrere Iterationen oder Durchläufe durch ein vollständiges Klassifikationsnetzwerk oder komplizierte Trainingsstrategien. In dieser Arbeit präsentieren wir ein effizientes Lokalisierungsmodul, das nahtlos in ein Klassifikationsnetzwerk in einer end-to-end-Architektur integriert werden kann. Auf der einen Seite wird das Modul durch den von der Klassifikationsschicht zurückfließenden Gradienten trainiert. Auf der anderen Seite werden zwei selbstüberwachte Verlustfunktionen eingeführt, um die Genauigkeit der Lokalisierung zu verbessern. Wir evaluieren das neue Modell anhand der drei Benchmark-Datensätze CUB200-2011, Stanford Cars und FGVC-Aircraft und erreichen dabei konkurrenzfähige Erkennungsergebnisse.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Feinabgestimmte visuelle Klassifikation mit effizienter end-to-end Lokalisierung | Paper | HyperAI