HyperAIHyperAI
vor 11 Tagen

Sie ernten, was Sie säen: Verwendung von Videos zur Generierung hochpräziser Objektvorschläge für schwach überwachte Objektdetektion

{ Yong Jae Lee, Krishna Kumar Singh}
Sie ernten, was Sie säen: Verwendung von Videos zur Generierung hochpräziser Objektvorschläge für schwach überwachte Objektdetektion
Abstract

Wir schlagen eine neuartige Methode zur Nutzung von Videos vor, um hochpräzise Objektvorschläge für die schwach überwachte Objektdetektion zu erzielen. Bestehende Ansätze der schwach überwachten Detektion verwenden herkömmliche Vorschlagsmethoden wie Edge Boxes oder Selective Search, um Kandidatboxen zu generieren. Diese Methoden erreichen eine hohe Recall-Rate, erzeugen jedoch tausende von verrauschten Vorschlägen. Dadurch liegt die gesamte Verantwortung dafür, die wenigen relevanten Objektregionen zu identifizieren, bei der nachfolgenden Objektmining-Phase. Um dieses Problem zu mildern, konzentrieren wir uns stattdessen darauf, die Genauigkeit der anfänglichen Kandidatvorschläge zu verbessern. Da wir auf Lokalisationsannotationen nicht zurückgreifen können, wenden wir uns stattdessen Videos zu und nutzen Bewegungsinformationen, um automatisch die Ausdehnung von Objekten zu schätzen, um ein schwach überwachtes Region Proposal Network (W-RPN) zu trainieren. Mit dem W-RPN generieren wir hochpräzise Objektvorschläge, die anschließend verwendet werden, um Vorschläge mit hoher Recall-Rate wie Edge Boxes oder Selective Search basierend auf ihrer räumlichen Überlappung neu zu bewerten. Unsere W-RPN-Vorschläge führen zu einer signifikanten Leistungssteigerung bei aktuellen State-of-the-Art-Methoden der schwach überwachten Objektdetektion auf den Datensätzen PASCAL VOC 2007 und 2012.

Sie ernten, was Sie säen: Verwendung von Videos zur Generierung hochpräziser Objektvorschläge für schwach überwachte Objektdetektion | Neueste Forschungsarbeiten | HyperAI