2ヶ月前
ThunderNet: 実時間汎用物体検出への道程
Zheng Qin; Zeming Li; Zhaoning Zhang; Yiping Bao; Gang Yu; Yuxing Peng; Jian Sun

要約
モバイルプラットフォームにおけるリアルタイム汎用物体検出は、重要な一方で困難なコンピュータビジョンのタスクです。しかし、従来のCNNベースの検出器は膨大な計算コストを伴い、計算リソースが制約されているシナリオでのリアルタイム推論を妨げています。本論文では、二段階検出器のリアルタイム汎用検出における有効性を調査し、軽量な二段階検出器「ThunderNet」を提案します。バックボーン部分では、以前の軽量バックボーンの欠点を分析し、物体検出に特化した軽量バックボーンを設計しました。検出部分では、極めて効率的なRPN(Region Proposal Network)と検出ヘッドの設計を追求しました。より判別力のある特徴表現を生成するために、「Context Enhancement Module(文脈強化モジュール)」と「Spatial Attention Module(空間注意モジュール)」という2つの効率的なアーキテクチャブロックを設計しました。最後に、入力解像度、バックボーン、および検出ヘッド間のバランスについて調査しました。PASCAL VOCおよびCOCOベンチマークにおいて、ThunderNetは軽量の一段階検出器と比較して40%の計算コストで優れた性能を達成しています。特別な最適化を行わなくても、当モデルはARMベースデバイス上で24.1 fpsで動作します。我々の知る限りでは、これはARMプラットフォーム上で初めて報告されたリアルタイム検出器です。コードとモデルは\url{https://github.com/qinzheng93/ThunderNet}から入手可能です。