HyperAIHyperAI
vor 2 Monaten

Tiefes Lernen von Merkmalen für diskriminative Lokalisierung

Bolei Zhou; Aditya Khosla; Agata Lapedriza; Aude Oliva; Antonio Torralba
Tiefes Lernen von Merkmalen für diskriminative Lokalisierung
Abstract

In dieser Arbeit untersuchen wir die globale Durchschnittspooling-Schicht, die in [13] vorgeschlagen wurde, und beleuchten, wie sie es dem Faltungsneuralnetz (Convolutional Neural Network) ermöglicht, eine bemerkenswerte Lokalisierungsfähigkeit zu erlangen, obwohl es nur mit bildbasierten Labels trainiert wird. Während diese Technik bisher als Mittel zur Regularisierung des Trainings vorgeschlagen wurde, stellen wir fest, dass sie tatsächlich eine generische lokalisierbare tiefere Darstellung erstellt, die auf verschiedene Aufgaben angewendet werden kann. Trotz der scheinbaren Einfachheit des globalen Durchschnittspoolings gelingt uns ein Top-5-Fehler von 37,1 % bei der Objektlokalisierung im ILSVRC 2014-Wettbewerb, was bemerkenswert nahe am Top-5-Fehler von 34,2 % liegt, den eine vollständig überwachte CNN-Methode erreicht. Wir zeigen, dass unser Netzwerk in der Lage ist, diskriminative Bildbereiche bei verschiedenen Aufgaben zu lokalisieren, obwohl es nicht dafür trainiert wurde.

Tiefes Lernen von Merkmalen für diskriminative Lokalisierung | Neueste Forschungsarbeiten | HyperAI