HyperAIHyperAI
vor 2 Monaten

YOLO9000: Besser, Schneller, Stärker

Joseph Redmon; Ali Farhadi
YOLO9000: Besser, Schneller, Stärker
Abstract

Wir stellen YOLO9000 vor, ein leistungsstarkes, Echtzeit-Objekterkennungssystem, das über 9000 Objektkategorien erkennen kann. Zunächst schlagen wir verschiedene Verbesserungen der YOLO-Erkennungsmethode vor, sowohl neuartige als auch aus früheren Arbeiten entnommene. Das verbesserte Modell, YOLOv2, ist an der Spitze bei Standard-Erkennungsaufgaben wie PASCAL VOC und COCO. Bei 67 Bildern pro Sekunde (FPS) erreicht YOLOv2 auf PASCAL VOC 2007 einen mittleren Durchschnittspräzision (mAP) von 76,8 %. Bei 40 FPS erreicht YOLOv2 einen mAP von 78,6 % und übertrifft dabei moderne Methoden wie Faster R-CNN mit ResNet und SSD, während es dennoch erheblich schneller läuft. Schließlich schlagen wir eine Methode vor, um gleichzeitig Objekterkennung und Klassifikation zu trainieren. Mit dieser Methode trainieren wir YOLO9000 simultan auf dem COCO-Erkennungsdatensatz und dem ImageNet-Klassifikationsdatensatz. Unser gemeinsames Training ermöglicht es YOLO9000, Erkennungen für Objektklassen vorherzusagen, die keine beschrifteten Erkennungsdaten haben. Wir validieren unseren Ansatz an der ImageNet-Erkennungsaufgabe. Trotz der Verfügbarkeit von Erkennungsdaten nur für 44 von insgesamt 200 Klassen erreicht YOLO9000 auf dem ImageNet-Erkennungsvalidierungssatz einen mAP von 19,7 %. Auf den 156 Klassen, die nicht im COCO-Datensatz enthalten sind, erreicht YOLO9000 einen mAP von 16,0 %. Aber YOLO kann mehr als nur 200 Klassen erkennen; es kann Erkennungen für mehr als 9000 verschiedene Objektkategorien vorhersagen. Und es läuft immer noch in Echtzeit.

YOLO9000: Besser, Schneller, Stärker | Neueste Forschungsarbeiten | HyperAI