17日前

EAutoDet:オブジェクト検出のための効率的なアーキテクチャ探索

Xiaoxing Wang, Jiale Lin, Junchi Yan, Juanping Zhao, Xiaokang Yang
EAutoDet:オブジェクト検出のための効率的なアーキテクチャ探索
要約

物体検出用のCNNを訓練する際には、大規模なデータセットと複雑なネットワークモジュールのため、時間的に非常に費やすことが課題であり、検出データセット上でアーキテクチャを直接探索することは困難である。これは通常、膨大な探索コスト(数十から数百GPU日単位)を要する。これに対して、本論文では、物体検出用の実用的なバックボーンおよびFPNアーキテクチャをわずか1.4GPU日で発見可能な効率的なフレームワーク、EAutoDetを提案する。具体的には、バックボーンおよびFPNモジュールの両方に対してスーパーネットを構築し、微分可能手法を採用している。GPUメモリ要件および計算コストを低減するため、同一エッジ上の候補演算の重みを共有し、一つの畳み込みに統合する「カーネル再利用技術」を提案する。さらに、チャネル数の探索を効果的に行うための動的チャネル精査戦略も導入している。広範な実験により、本手法の顕著な有効性と効率性が示された。特に、発見されたアーキテクチャは、最先端の物体検出用NAS手法を上回り、COCO test-devセットにおいて120FPSで40.1mAP、41.3FPSで49.2mAPを達成した。また、発見されたアーキテクチャを回転物体検出タスクに転移適用した結果、DOTA-v1.0 testセットにおいて21.1Mパラメータで77.05mAP$_{\text{50}}$の性能を達成した。