HyperAIHyperAI
vor 2 Monaten

Schwach überwachte Lokalisierung mit tiefen Merkmalskarten

Archith J. Bency; Heesung Kwon; Hyungtae Lee; S. Karthikeyan; B. S. Manjunath
Schwach überwachte Lokalisierung mit tiefen Merkmalskarten
Abstract

Objektlokalisation ist ein wichtiges Problem der Computer Vision mit einer Vielzahl von Anwendungen. Der Mangel an umfangreichen Objekt-Level-Annotierungen und die relative Fülle von Bild-Level-Etiketten sprechen dafür, schwache Überwachung in der Objektlokalisation einzusetzen. Tiefgängige Faltungsneuronale Netze (Deep Convolutional Neural Networks) sind eine Klasse von Stand-der-Technik-Methoden für das verwandte Problem der Objekterkennung. In dieser Arbeit beschreiben wir einen neuen Algorithmus zur Objektlokalisation, der Klassifikationsnetze verwendet, die ausschließlich auf Bildetiketten trainiert wurden. Diese schwach überwachte Methode nutzt lokale räumliche und semantische Muster, die in den Faltungsschichten der Klassifikationsnetze erfasst werden. Wir schlagen einen effizienten Strahlensuchansatz (beam search based approach) vor, um mehrere Objekte in Bildern zu erkennen und zu lokalisieren. Die vorgeschlagene Methode übertrifft den Stand der Technik in Standard-Datensätzen für Objektlokalisation deutlich, wobei sich die mAP-Werte um 8 Punkte verbessert haben.

Schwach überwachte Lokalisierung mit tiefen Merkmalskarten | Neueste Forschungsarbeiten | HyperAI