Die Ausbildung von regionenbasierten Objekterkennern durch Online-Schwerpunktsbeispielsabbau

Das Gebiet der Objekterkennung hat erhebliche Fortschritte gemacht, getragen von der Entwicklung regionsbasierter ConvNets. Dennoch beinhaltet ihr Trainingsverfahren viele Heuristiken und Hyperparameter, die kostspielig zu justieren sind. Wir stellen einen einfachen, aber überraschend effektiven Online-Hard-Example-Mining-Algorithmus (OHEM) für das Training regionsbasierter ConvNet-Detektoren vor. Unsere Motivation ist dieselbe wie immer – Detektionsdatensätze enthalten eine überwältigende Anzahl leichter Beispiele und eine geringe Anzahl schwieriger Beispiele. Die automatische Auswahl dieser schwierigen Beispiele kann das Training effektiver und effizienter gestalten. OHEM ist ein einfacher und intuitiver Algorithmus, der mehrere gebräuchliche Heuristiken und Hyperparameter eliminiert. Wichtiger jedoch ist, dass es konsistente und signifikante Verbesserungen der Detektionsleistung auf Benchmarks wie PASCAL VOC 2007 und 2012 erzielt. Seine Effektivität nimmt zu, wenn die Datensätze größer und schwieriger werden, wie die Ergebnisse am MS COCO-Datensatz zeigen. Darüber hinaus führt OHEM in Kombination mit ergänzenden Fortschritten im Bereich zu den besten bisherigen Ergebnissen von 78,9 % und 76,3 % mAP auf PASCAL VOC 2007 und 2012 respektive.