Command Palette
Search for a command to run...
WILDCAT: Schwach beschriftetes Lernen tiefer ConvNets für die Bildklassifikation, punktuelle Lokalisierung und Segmentierung
WILDCAT: Schwach beschriftetes Lernen tiefer ConvNets für die Bildklassifikation, punktuelle Lokalisierung und Segmentierung
Nicolas Thome Taylor Mordan Matthieu Cord Thibaut Durand
Zusammenfassung
Diese Arbeit stellt WILDCAT vor, eine tiefe Lernmethode, die gleichzeitig darauf abzielt, Bildregionen zur Erzielung von räumlicher Invarianz auszurichten und stark lokalisierte Merkmale zu lernen. Unser Modell wird ausschließlich mit globalen Bildbeschriftungen trainiert und dient drei zentralen Aufgaben der visuellen Erkennung: Bildklassifikation, schwach überwachte Objektpositionierung und semantische Segmentierung. WILDCAT erweitert state-of-the-art-Faltungsneuronale Netze auf drei Hauptebenen: die Verwendung von vollständig faltenden Netzwerken zur Erhaltung der räumlichen Auflösung, die explizite Gestaltung von lokalen Merkmalen im Netzwerk, die sich auf unterschiedliche Klassenmodalitäten beziehen, sowie eine neue Methode zur Pooling dieser Merkmale, um eine globale Bildvorhersage zu generieren, die für den schwach überwachten Trainingsprozess erforderlich ist. Umfangreiche Experimente zeigen, dass unser Modell state-of-the-art-Methoden erheblich übertrifft.