
우리는 YOLO9000을 소개합니다. YOLO9000은 실시간으로 9,000개 이상의 객체 카테고리를 감지할 수 있는 최첨단 객체 검출 시스템입니다. 먼저, YOLO 검출 방법에 대한 다양한 개선 사항을 제안합니다. 이 개선 사항은 새로운 것과 기존 연구에서 도입된 것이 포함되어 있습니다. 개선된 모델인 YOLOv2는 PASCAL VOC와 COCO와 같은 표준 검출 작업에서 최첨단 성능을 보여줍니다. 67 FPS에서 YOLOv2는 VOC 2007에서 76.8 mAP를 얻습니다. 40 FPS에서는 78.6 mAP를 얻어, ResNet을 사용한 Faster R-CNN과 SSD 등 최신 방법론보다 우수한 성능을 보이며 동시에 훨씬 빠르게 실행됩니다.마지막으로, 객체 검출과 분류를 동시에 학습하는 방법을 제안합니다. 이 방법을 사용하여 COCO 검출 데이터셋과 ImageNet 분류 데이터셋에서 동시에 YOLO9000을 학습시킵니다. 우리의 동시 학습 방식은 YOLO9000이 라벨링된 검출 데이터가 없는 객체 클래스에 대해도 검출 예측을 할 수 있게 합니다. 우리는 ImageNet 검출 작업에서 접근법의 유효성을 확인하였습니다. YOLO9000은 200개 클래스 중 44개만에 대한 검출 데이터가 있음에도 불구하고 ImageNet 검출 검증 세트에서 19.7 mAP를 얻었습니다. COCO에 포함되지 않은 156개 클래스에서는 YOLO9000이 16.0 mAP를 얻었습니다.하지만 YOLO는 단순히 200개 클래스 이상의 객체만 감지하는 것이 아닙니다; 그것은 9,000개 이상의 다양한 객체 카테고리에 대한 검출 예측을 수행합니다(over 9,000 different object categories). 그리고 여전히 실시간으로 실행됩니다(real-time).