HyperAIHyperAI
vor 2 Monaten

Selbstgesteuertes Deep Learning für schwach überwachte Objekterkennung

Enver Sangineto; Moin Nabi; Dubravko Culibrk; Nicu Sebe
Selbstgesteuertes Deep Learning für schwach überwachte Objekterkennung
Abstract

In einem schwach überwachten Szenario müssen Objekterkennungssysteme allein mit bildbasierten Annotationen trainiert werden. Da die Bodenwahrheit (ground truth) auf der Ebene von Begrenzungsrahmen (bounding boxes) nicht verfügbar ist, basieren die meisten bisher vorgeschlagenen Lösungen auf einem iterativen Mehrfachinstanz-Lernrahmen (Multiple Instance Learning), bei dem der aktuelle Klassifizierer verwendet wird, um die Begrenzungsrahmen mit der höchsten Zuversichtlichkeit in jedem Bild auszuwählen. Diese werden im nächsten Trainingszyklus als Pseudo-Bodenwahrheit behandelt. Die Fehler eines unreifen Klassifizierers können jedoch den Prozess verzerren und in der Regel viele Falschpositiv-Einträge in den Trainingsdatensatz einführen. Um dieses Problem zu mildern, schlagen wir in dieser Arbeit ein Trainingsprotokoll vor, das auf dem Paradigma des selbstgesteuerten Lernens (self-paced learning) basiert. Das Hauptziel besteht darin, iterativ eine Teilmenge von Bildern und Begrenzungsrahmen auszuwählen, die am zuverlässigsten sind, und diese für das Training zu verwenden. In den letzten Jahren wurden ähnliche Strategien für SVMs und andere Klassifizierer angewendet; wir sind jedoch die Ersten, die zeigen, dass ein selbstgesteuertes Vorgehen auch mit tiefen neuronalen Netzwerken-basierten Klassifizierern in einer end-to-end-Trainingspipeline eingesetzt werden kann. Unser vorgeschlagener Ansatz basiert auf der vollständig überwachten Fast-RCNN-Architektur und kann auf ähnliche Architekturen angewendet werden, die das Eingangsbild als Sammlung von Begrenzungsrahmen darstellen. Wir präsentieren Stand-der-Kunst-Ergebnisse für Pascal VOC 2007, Pascal VOC 2010 und ILSVRC 2013. Bei ILSVRC 2013 übertreffen unsere Ergebnisse sogar solche schwach überwachten Ansätze, die viel leistungsfähigere Netzwerke verwenden, wie zum Beispiel AlexNet.

Selbstgesteuertes Deep Learning für schwach überwachte Objekterkennung | Neueste Forschungsarbeiten | HyperAI