2ヶ月前

YOLO9000: より良い、より速い、より強い

Joseph Redmon; Ali Farhadi
YOLO9000: より良い、より速い、より強い
要約

我々はYOLO9000を紹介します。これは最先端のリアルタイム物体検出システムで、9000以上の物体カテゴリーを検出することができます。まず、YOLO検出方法に対する様々な改善案を提案します。これらの改善案は新規のものと既存の研究から引用したものを含んでいます。改善されたモデルであるYOLOv2は、PASCAL VOCやCOCOなどの標準的な検出タスクにおいて最先端の性能を達成しています。67 FPS(フレーム毎秒)でYOLOv2はVOC 2007において76.8 mAP(平均精度)を得ています。40 FPSでは78.6 mAPを得ており、Faster RCNN with ResNetやSSDなどの最先端手法を上回りながら、依然として著しく高速に動作しています。最後に、物体検出と分類を同時に行うための方法を提案します。この方法を使用して、COCO検出データセットとImageNet分類データセット上で同時にYOLO9000を訓練しました。我々の同時訓練により、ラベル付き検出データがない物体クラスについてもYOLO9000が予測を行うことが可能になりました。このアプローチの有効性はImageNet検出タスクで確認されています。200クラス中44クラスのみに検出データがあるにもかかわらず、YOLO9000はImageNet検出バリデーションセットで19.7 mAPを得ています。COCOに含まれていない156クラスについては、16.0 mAPを得ています。しかし、YOLOが検出できるのは200クラスだけではありません;9,418以上の異なる物体カテゴリー(原文: 9,418+ different object categories)について予測を行うことができます。そして依然としてリアルタイムで動作します。

YOLO9000: より良い、より速い、より強い | 最新論文 | HyperAI超神経