2 个月前

YOLO9000:更优、更快、更强

Joseph Redmon; Ali Farhadi
YOLO9000:更优、更快、更强
摘要

我们介绍了YOLO9000,这是一种最先进的实时目标检测系统,能够检测超过9000个目标类别。首先,我们提出了对YOLO检测方法的各种改进,这些改进既包括新颖的方法,也借鉴了先前的研究成果。改进后的模型称为YOLOv2,在标准检测任务如PASCAL VOC和COCO上达到了最先进水平。在67帧每秒(FPS)时,YOLOv2在VOC 2007数据集上的平均精度均值(mAP)为76.8;在40帧每秒时,其mAP达到78.6,超过了诸如Faster R-CNN与ResNet以及SSD等最先进方法,同时运行速度显著更快。最后,我们提出了一种联合训练目标检测和分类的方法。利用这种方法,我们在COCO检测数据集和ImageNet分类数据集上同时训练了YOLO9000。我们的联合训练使得YOLO9000能够预测那些没有标记检测数据的目标类别的检测结果。我们在ImageNet检测任务上验证了这一方法的有效性。尽管只有44个类别的检测数据可用,YOLO9000在ImageNet检测验证集上的mAP仍达到了19.7。对于不在COCO中的156个类别,YOLO9000的mAP为16.0。但YOLO不仅仅能检测200个类别;它能够预测超过9000个不同目标类别的检测结果,并且仍然保持实时运行的能力。

YOLO9000:更优、更快、更强 | 最新论文 | HyperAI超神经