17日前

LeYOLO、オブジェクト検出のための新規埋め込みアーキテクチャ

Lilian Hollard, Lucas Mohimont, Nathalie Gaveau, Luiz Angelo Steffenel
LeYOLO、オブジェクト検出のための新規埋め込みアーキテクチャ
要約

深層ニューラルネットワークにおける効率的な計算は、リアルタイム物体検出において極めて重要である。しかし、近年の進展は、主に高性能ハードウェアの向上に起因しており、パラメータ数やFLOP(浮動小数点演算回数)の効率性の改善にはあまり注目が集まっていない。これは特に最新のYOLOアーキテクチャにおいて顕著であり、軽量設計よりも処理速度が優先されている。その結果、マイコンなどのリソース制約環境向けに最適化された物体検出モデルは、相対的に注目されていない。計算能力が限られたデバイスでは、既存の解決策は主にSSDLiteや低パラメータ数の分類器の組み合わせに依存しており、YOLO系アーキテクチャと真正に効率的な軽量検出器との間に明確なギャップが生じている。この状況から、以下の核心的な問いが浮かび上がる:パラメータ数およびFLOP効率に最適化されたモデルは、主流のYOLOモデルと同等の精度を達成できるだろうか?この問いに答えるため、本研究ではMSCOCOをベースとする検証セットを用いて、物体検出モデルにおいて2つの主要な貢献を提示する。第一に、推論速度がSSDLiteと同等である一方で、精度を著しく向上させ、パラメータ数を大幅に削減する汎用的な検出フレームワーク「LeNeck」を提案する。第二に、YOLOベースアーキテクチャにおける計算効率を向上させるために設計された効率的な物体検出モデル「LeYOLO」を提示する。LeYOLOは、SSDLiteベースの検出器とYOLOモデルの間のギャップを効果的に埋め、MobileNetクラスの非常にコンパクトなモデルでありながら高い精度を実現する。これらの貢献は、特にモバイル端末、組み込みシステム、超低消費電力デバイス(マイコンを含む)において、計算効率が極めて重要な環境に最適である。