HyperAIHyperAI
vor 4 Monaten

Die unerwartete Effektivität von verrauschten Daten für die feingranulare Erkennung

Jonathan Krause; Benjamin Sapp; Andrew Howard; Howard Zhou; Alexander Toshev; Tom Duerig; James Philbin; Li Fei-Fei
Die unerwartete Effektivität von verrauschten Daten für die feingranulare Erkennung
Abstract

Aktuelle Ansätze für die feingranulare Erkennung beinhalten folgende Schritte: Erstens, Experten werden angeworben, um einen Datensatz von Bildern zu annotieren und optional strukturiertere Daten in Form von Teileannotierungen und Begrenzungsrahmen zu sammeln. Zweitens, ein Modell wird unter Verwendung dieser Daten trainiert. Im Hinblick auf das Ziel der Lösung des Problems der feingranularen Erkennung stellen wir einen alternativen Ansatz vor, der freie, aber verrauschte Daten aus dem Internet und einfache, generische Erkennungsmethoden nutzt. Dieser Ansatz hat Vorteile sowohl in Bezug auf die Leistung als auch auf die Skalierbarkeit. Wir demonstrieren seine Effektivität anhand von vier feingranularen Datensätzen, wobei wir bestehende Standesmodelle weit übertreffen, ohne auch nur ein einziges Label manuell zu sammeln. Darüber hinaus zeigen wir erste Ergebnisse bei der Skalierung auf mehr als 10.000 feingranular Kategorien. Quantitativ erreichen wir Top-1-Akkuratenzen von 92,3 % auf CUB-200-2011, 85,4 % auf Birdsnap, 93,4 % auf FGVC-Aircraft und 80,8 % auf Stanford Dogs ohne deren annotierte Trainingsdatensätze zu verwenden. Wir vergleichen unseren Ansatz mit einem aktiven Lernalgorithmus zur Erweiterung feingranularer Datensätze.