Command Palette
Search for a command to run...
Zu unsupervisierter, mehrfacher Objekterkennung in großen Bildsammlungen
Zu unsupervisierter, mehrfacher Objekterkennung in großen Bildsammlungen
Huy V. Vo Patrick Pérez Jean Ponce
Zusammenfassung
Dieses Papier behandelt das Problem der Identifizierung von Objekten in einer Bildsammlung ohne jegliche Überwachung. Wir bauen auf dem Optimierungsansatz von Vo et al. (CVPR'19) auf und bringen mehrere wesentliche Neuerungen ein: (1) Wir schlagen einen neuen, auf Salienz basierenden Regionenvorschlagsalgorithmus vor, der eine erheblich höhere Überschneidung mit den actually vorhandenen Objekten als andere wettbewerbsfähige Methoden erreicht. Dieses Verfahren nutzt vorgefertigte CNN-Features, die für Klassifizierungsaufgaben trainiert wurden, ohne jedoch Informationen über Begrenzungsrahmen zu verwenden; es ist ansonsten unüberwacht. (2) Wir nutzen die inhärente hierarchische Struktur der Vorschläge als effektiven Regularisierer für den Ansatz zur Objekterkennung von Vo et al., was die Leistung erheblich verbessert und zu einem deutlichen Fortschritt im Vergleich zum Stand der Technik bei mehreren Standardbenchmarks führt. (3) Wir setzen eine zweistufige Strategie ein, um vielversprechende Vorschläge unter Verwendung kleiner zufälliger Bildmengen auszuwählen, bevor wir die gesamte Bildsammlung verwenden, um die dargestellten Objekte zu entdecken. Dies ermöglicht es uns, erstmals (nach bestem Wissen) die Entdeckung von mehreren Objekten in jedem einzelnen Bild von Datensätzen mit bis zu 20.000 Bildern zu bewältigen, was eine mehr als fünfmalige Steigerung im Vergleich zu existierenden Methoden darstellt und einen ersten Schritt hin zu einer echten groß angelegten unüberwachten Bildinterpretation darstellt.