Konsistenzbasiertes semi-supervised Learning für die Objekterkennung

Die präzise Annotation in großen Datensätzen ist entscheidend für die Leistungsfähigkeit von Objekterkennungssystemen. Während die Aufgabe der Objekterkennung eine große Anzahl annotierter Beispiele erfordert, um eine hohe Leistung zu gewährleisten, ist das Setzen von Bounding Boxes für jedes Objekt in jedem Beispiel zeitaufwendig und kostspielig. Um dieses Problem zu mildern, schlagen wir eine konsistenzbasierte semi-supervised Lernmethode für die Objekterkennung (CSD) vor, die Konsistenzbedingungen als Werkzeug nutzt, um die Erkennungsleistung durch vollständige Ausnutzung verfügbarer unbeschrifteter Daten zu verbessern. Insbesondere wird die Konsistenzbedingung nicht nur für die Klassifikation, sondern auch für die Lokalisierung angewendet. Außerdem stellen wir eine Hintergrundeliminierung (BE) vor, um den negativen Einfluss dominanter Hintergründe auf die Erkennungsleistung zu vermeiden. Die vorgeschlagene CSD-Methode wurde sowohl in Ein-Stufe- als auch in Zwei-Stufe-Detektoren evaluiert, und die Ergebnisse belegen die Wirksamkeit unseres Ansatzes.