HyperAIHyperAI
vor 3 Monaten

Localize to Classify and Classify to Localize: Wechselseitige Führung in der Objekterkennung

Heng Zhang, Elisa Fromont, Sébastien Lefevre, Bruno Avignon
Localize to Classify and Classify to Localize: Wechselseitige Führung in der Objekterkennung
Abstract

Die meisten Deep-Learning-Objektdetektoren basieren auf dem Anchor-Mechanismus und nutzen die Intersection over Union (IoU) zwischen vordefinierten Anchor-Boxes und Ground-Truth-Boxes, um die Übereinstimmungsqualität zwischen Anchors und Objekten zu bewerten. In diesem Paper stellen wir diese Verwendung der IoU in Frage und schlagen ein neues Anchor-Matching-Kriterium vor, das während des Trainings durch die Optimierung sowohl der Lokalisations- als auch der Klassifikationsaufgabe geleitet wird: Die Vorhersagen einer Aufgabe werden genutzt, um während des Trainings dynamisch Beispiel-Anchors zuzuweisen und das Modell auf der anderen Aufgabe zu verbessern, und umgekehrt. Trotz der Einfachheit des vorgeschlagenen Ansatzes zeigen unsere Experimente mit verschiedenen state-of-the-art Deep-Learning-Architekturen auf den Datensätzen PASCAL VOC und MS COCO die Wirksamkeit und Allgemeingültigkeit unserer Mutual Guidance-Strategie.

Localize to Classify and Classify to Localize: Wechselseitige Führung in der Objekterkennung | Forschungsarbeiten | HyperAI