17日前

EfficientDet:スケーラブルかつ効率的なオブジェクト検出

Mingxing Tan, Ruoming Pang, Quoc V. Le
EfficientDet:スケーラブルかつ効率的なオブジェクト検出
要約

コンピュータビジョンにおけるモデルの効率性は、近年ますます重要性を増している。本論文では、物体検出におけるニューラルネットワークアーキテクチャ設計の選択肢を体系的に検討し、効率性を向上させるための複数の重要な最適化手法を提案する。まず、簡単かつ高速なマルチスケール特徴の統合を可能にする重み付き双向特徴ピラミッドネットワーク(BiFPN)を提案する。次に、バックボーン、特徴ネットワーク、ボックス/クラス予測ネットワークのすべてに対して、解像度、深さ、幅を同時に均一にスケーリングするコンパウンドスケーリング法を提案する。これらの最適化手法とより優れたバックボーンを組み合わせることで、広範なリソース制約下において従来の手法を大きく上回る効率性を実現する新たな物体検出器のファミリー、EfficientDetを構築した。特に、単一モデル・単一スケールの設定において、EfficientDet-D7はCOCO test-devで55.1 APを達成し、パラメータ数77M、FLOPs 410Bという規模で、過去の検出器と比較してサイズが4倍~9倍小さく、FLOPsは13倍~42倍も削減された。コードは https://github.com/google/automl/tree/master/efficientdet にて公開されている。