vor 6 Monaten

Zusammenfassung

Feinabgestufte visuelle Kategorisierung (Fine-Grained Visual Categorization, FGVC) ist ein herausforderndes Thema im Bereich des maschinellen Sehens. Es zeichnet sich durch große intra-klassische Unterschiede und subtile inter-klassische Unterschiede aus. In diesem Artikel bearbeiten wir dieses Problem auf schwach überwachte Weise, wobei neuronale Netzwerke mit zusätzlichen Daten durch eine Datenverstärkungstechnik unter Verwendung eines visuellen Aufmerksamkeitsmechanismus versorgt werden. Wir realisieren einen domänenspezifischen Wissenstransfer durch Feinabstimmung (fine-tuning) unseres Basisnetzwerks. Unsere Experimente werden auf sechs anspruchsvollen und häufig verwendeten FGVC-Datensätzen durchgeführt, wobei wir durch die Verwendung von auf Aufmerksamkeit basierender Datenverstärkungstechniken sowie Merkmale aus einem tiefen Lernmodell (InceptionV3), das auf großskaligen Datensätzen vortrainiert wurde, wettbewerbsfähige Verbesserungen hinsichtlich der Genauigkeit erzielen. Unsere Methode übertrifft mehrere Konkurrenzverfahren auf mehreren FGVC-Datensätzen und erzielt zudem wettbewerbsfähige Ergebnisse auf weiteren Datensätzen. Experimentelle Studien zeigen, dass der Transferlernen aus großskaligen Datensätzen effektiv in Kombination mit datenverstärkenden Techniken auf Basis visueller Aufmerksamkeit genutzt werden kann, um state-of-the-art-Ergebnisse auf mehreren FGVC-Datensätzen zu erzielen. Wir präsentieren eine umfassende Analyse unserer Experimente. Unser Ansatz erreicht state-of-the-art-Ergebnisse auf mehreren feinabgestuften Klassifikationsdatensätzen, darunter die anspruchsvollen Datensätze CUB200-2011 (Vögel), Flowers-102 und FGVC-Aircrafts.

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 6 Monaten

Computer Vision

Bildklassifikation

Faltungsneuronales Netzwerk

Ansatz/Rahmenwerk

Computervision

Aufgabe

Ashiq Imran Vassilis Athitsos

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 6 Monaten

Computer Vision

Bildklassifikation

Faltungsneuronales Netzwerk

Ansatz/Rahmenwerk

Computervision

Aufgabe

Ashiq Imran Vassilis Athitsos

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

Domänenadaptives Transfer Learning auf visuell Aufmerksamkeitsorientierter Datenaugmentation für feinabgestufte visuelle Kategorisierung

Ashiq Imran Vassilis Athitsos

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Domänenadaptives Transfer Learning auf visuell Aufmerksamkeitsorientierter Datenaugmentation für feinabgestufte visuelle Kategorisierung

Ashiq Imran Vassilis Athitsos

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Domänenadaptives Transfer Learning auf visuell Aufmerksamkeitsorientierter Datenaugmentation für feinabgestufte visuelle Kategorisierung

Ashiq Imran Vassilis Athitsos

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters