HyperAIHyperAI
vor 11 Tagen

Mehrfachinstanz-Lernen auf tiefen Merkmalen für schwach überwachte Objektdetektion bei extremen Domänenverschiebungen

Nicolas Gonthier, Saïd Ladjal, Yann Gousseau
Mehrfachinstanz-Lernen auf tiefen Merkmalen für schwach überwachte Objektdetektion bei extremen Domänenverschiebungen
Abstract

Schwach beschriftete Objektdetektion (Weakly Supervised Object Detection, WSOD) unter Verwendung lediglich von Bild-Level-Anmerkungen hat in den letzten Jahren zunehmend Aufmerksamkeit erlangt. Während diese Aufgabe typischerweise mit domänenspezifischen Ansätzen für natürliche Bilder angegangen wird, zeigen wir, dass ein einfacher mehrinstanzbasierter Ansatz, angewendet auf vortrainierte tiefe Merkmale, hervorragende Leistungen auch auf nicht-fotografischen Datensätzen erzielt – möglicherweise sogar für neue Klassen. Der Ansatz beinhaltet weder Feinabstimmung (fine-tuning) noch Cross-Domain-Lernen und ist daher effizient und potenziell auf beliebige Datensätze und Klassen übertragbar. Wir untersuchen verschiedene Varianten des vorgeschlagenen Ansatzes, darunter solche mit mehrschichtigen Perzeptronen und polyedrischen Klassifikatoren. Trotz seiner Einfachheit erzielt unsere Methode wettbewerbsfähige Ergebnisse auf einer Vielzahl öffentlich verfügbarer Datensätze, darunter Gemälde (People-Art, IconArt), Aquarelle, Cliparts und Comics, und ermöglicht zudem eine schnelle Lernfähigkeit für bisher unbekannte visuelle Kategorien.

Mehrfachinstanz-Lernen auf tiefen Merkmalen für schwach überwachte Objektdetektion bei extremen Domänenverschiebungen | Neueste Forschungsarbeiten | HyperAI