HyperAIHyperAI
vor 2 Monaten

Unüberwachte Objekterkennung und gemeinsame Lokalisierung durch tiefes Deskriptor-Transforming

Xiu-Shen Wei; Chen-Lin Zhang; Jianxin Wu; Chunhua Shen; Zhi-Hua Zhou
Unüberwachte Objekterkennung und gemeinsame Lokalisierung durch tiefes Deskriptor-Transforming
Abstract

Die Wiederverwendbarkeit von Modellen wird mit der raschen Expansion von Anwendungen im Bereich Computer Vision und maschinelles Lernen zunehmend erwünscht. In dieser Arbeit konzentrieren wir uns auf die Wiederverwendbarkeit vortrainierter tiefer Faltungsmodelle. Insbesondere unterscheiden wir uns davon, vortrainierte Modelle als Feature-Extractor zu betrachten, indem wir weitere Schätze unter den Faltungsschichten aufdecken, nämlich dass die Faltungsaktivierungen als Detektor für gemeinsame Objekte im Problem der Bild-Ko-Lokalisierung dienen können. Wir schlagen eine einfache, aber effektive Methode vor, die als Tiefes Deskriptor-Transforming (DDT) bezeichnet wird, um die Korrelationen von Deskriptoren zu bewerten und dann kategoriekonsistente Bereiche zu erhalten, die das gemeinsame Objekt in einer Menge unannotierter Bilder genau lokalisieren können, d.h. unüberwachte Objekterkennung. Empirische Studien bestätigen die Effektivität der vorgeschlagenen DDT-Methode. Auf Benchmarks für Bild-Ko-Lokalisierung übertrifft DDT bestehende state-of-the-art Methoden deutlich. Darüber hinaus zeigt DDT auch gute Generalisierungsfähigkeiten für unbekannte Kategorien und Robustheit bei der Verarbeitung verrauschter Daten. Darüber hinaus kann DDT auch zur Sammlung von Web-Bildern in gültige externe Datenspeicher verwendet werden, um die Leistung sowohl der Bilderkennung als auch der Objekterkennung zu verbessern.

Unüberwachte Objekterkennung und gemeinsame Lokalisierung durch tiefes Deskriptor-Transforming | Neueste Forschungsarbeiten | HyperAI