Multiple-Instanz-aktives Lernen für die Objekterkennung

Trotz der erheblichen Fortschritte im Bereich des aktiven Lernens für die Bilderkennung fehlt es noch an einer instanzbasierten Methode des aktiven Lernens, die speziell für die Objekterkennung entwickelt wurde. In dieser Arbeit schlagen wir Multiple Instance Active Object Detection (MI-AOD) vor, um die informativsten Bilder für das Training von Detektoren auszuwählen, indem wir uns auf die instanzbasierte Unsicherheit konzentrieren. MI-AOD definiert ein Modul zur Lernung der Instanzunsicherheit, das die Diskrepanz zwischen zwei antagonistischen Instanzklassifizierern nutzt, die auf dem etikettierten Datensatz trainiert wurden, um die Instanzunsicherheit des nicht etikettierten Datensatzes vorherzusagen. MI-AOD behandelt nicht etikettierte Bilder als Instanzsäcke und Merkmalsanker in den Bildern als Instanzen und schätzt die Bildunsicherheit durch Neugewichtung der Instanzen im Rahmen des Multiple Instance Learning (MIL). Die iterative Lernung der Instanzunsicherheit und Neugewichtung fördern die Unterdrückung rauschhafter Instanzen und helfen dabei, die Kluft zwischen Instanz- und Bildunsicherheit zu überbrücken. Experimente bestätigen, dass MI-AOD eine solide Grundlage für instanzbasiertes aktives Lernen bildet. Auf gängigen Datensätzen für Objekterkennung übertrifft MI-AOD state-of-the-art-Methoden deutlich, insbesondere wenn die etikettierten Datensätze klein sind. Der Quellcode ist unter https://github.com/yuantn/MI-AOD verfügbar.