1ヶ月前

リアルタイム物体検出のためのエネルギー効率とGPU計算効率に優れたバックボーンネットワーク

Youngwan Lee; Joong-won Hwang; Sangrok Lee; Yuseok Bae; Jongyoul Park
リアルタイム物体検出のためのエネルギー効率とGPU計算効率に優れたバックボーンネットワーク
要約

DenseNetは、多様な受容野を持つ中間特徴量を密結合によって集約することで、物体検出タスクにおいて優れた性能を示します。特徴量の再利用により、DenseNetは少ないモデルパラメータとFLOPsで強力な特徴量を生成できますが、DenseNetをバックボーンとした検出器は比較的遅い速度と低いエネルギー効率を示します。私たちは、密結合による線形増加する入力チャネルが重いメモリアクセスコストにつながり、計算オーバーヘッドとエネルギー消費量の増加を引き起こすことを発見しました。DenseNetの非効率性を解決するために、One-Shot Aggregation (OSA) を採用したエネルギー効率と計算効率に優れたアーキテクチャであるVoVNetを提案します。OSAは、多様な特徴量を複数の受容野で表現するDenseNetの長所を受け継ぎつつ、最後の特徴マップで一度だけすべての特徴量を集約することで密結合の非効率性を克服します。VoVNetがバックボーンネットワークとして有効であることを検証するために、軽量版および大規模版のVoVNetを設計し、一段階および二段階の物体検出器に適用しました。私たちのVoVNetベースの検出器は、DenseNetベースのものよりも2倍速く、エネルギー消費量も1.6倍から4.1倍削減されました。DenseNetだけでなく、広く使用されているResNetバックボーンにも比べてVoVNetはより速く、より良いエネルギー効率を示しています。特に、小物体検出性能においてはDenseNetやResNetに対して大幅に改善されています。

リアルタイム物体検出のためのエネルギー効率とGPU計算効率に優れたバックボーンネットワーク | 最新論文 | HyperAI超神経