vor 2 Monaten

Kreuzdomänen schwach überwachte Objekterkennung durch fortschreitende Domänenanpassung

Naoto Inoue; Ryosuke Furuta; Toshihiko Yamasaki; Kiyoharu Aizawa

Abstract

Können wir allgemeine Objekte in verschiedenen Bildbereichen ohne instanzbasierte Annotationen erkennen? In dieser Arbeit stellen wir einen Rahmen für eine neue Aufgabe vor, nämlich die cross-domain schwach überwachte Objekterkennung, die diese Frage behandelt. Für diese Arbeit haben wir Zugang zu Bildern mit instanzbasierten Annotationen in einem Quellbereich (z.B. natürliche Bilder) und zu Bildern mit bildbasierten Annotationen in einem Zielbereich (z.B. Aquarellbilder). Zudem sind die Klassen, die im Zielbereich erkannt werden sollen, alle oder ein Teil derer im Quellbereich. Ausgehend von einem vollständig überwachten Objekterkennungsmodell, das auf dem Quellbereich vortrainiert wurde, schlagen wir eine zweistufige fortschreitende Domänenanpassungstechnik vor, bei der der Erkennungsmodell an zwei Arten künstlich und automatisch generierter Stichproben angepasst wird. Wir testen unsere Methoden auf unseren neu gesammelten Datensätzen, die drei Bildbereiche enthalten, und erreichen eine Verbesserung von etwa 5 bis 20 Prozentpunkten in Bezug auf den mittleren Durchschnitts-Präzisionswert (mean average precision, mAP) im Vergleich zu den besten Baselines.