Kantenverstärkung für die large-scale Skizzenerkennung ohne Skizzen

Diese Arbeit befasst sich mit der Skalierung der Sketch-Klassifikationsaufgabe auf eine große Anzahl von Kategorien. Die Sammlung von Skizzen für das Training ist ein langsamer und mühsamer Prozess, der bisher jede Versuch unterbunden hat, die Sketch-Erkennung großflächig zu implementieren. Wir überwinden den Mangel an Trainingsdaten für Skizzen, indem wir etikettierte Sammlungen natürlicher Bilder nutzen, die leichter zu beschaffen sind. Um den Domänenunterschied zu überbrücken, stellen wir eine neuartige Erweiterungstechnik vor, die speziell für die Aufgabe entwickelt wurde, aus einer Trainingsmenge natürlicher Bilder Sketch-Erkennung zu lernen.Zufälligkeit wird in den Parametern der Kantendetektion und Kantenselektion eingeführt. Natürliche Bilder werden in einen pseudoneuen Bereich übersetzt, der als "randomisierte Binäre Dünnkanten" (rBTE) bezeichnet wird und als Trainingsdomäne anstelle von natürlichen Bildern verwendet wird. Die Fähigkeit zur Skalierung wird durch das Training einer CNN-basierten Sketch-Erkennung demonstriert, bei der mehr als 2,5 Mal so viele Kategorien verwendet werden wie bisher. Zu diesem Zweck wurde ein Datensatz von natürlichen Bildern aus 874 Kategorien erstellt, indem eine Reihe beliebter Computer Vision-Datensätze kombiniert wurden. Die Kategorien wurden ausgewählt, um für die Sketch-Erkennung geeignet zu sein. Um die Leistung abzuschätzen, wurde auch ein Teildatensatz mit 393 Kategorien gesammelt, für die Skizzen vorhanden sind.