2ヶ月前

MobileNetV3 の検索

Howard, Andrew ; Sandler, Mark ; Chu, Grace ; Chen, Liang-Chieh ; Chen, Bo ; Tan, Mingxing ; Wang, Weijun ; Zhu, Yukun ; Pang, Ruoming ; Vasudevan, Vijay ; Le, Quoc V. ; Adam, Hartwig
MobileNetV3 の検索
要約

次世代のMobileNetsを、補完的な探索技術と新規なアーキテクチャ設計の組み合わせに基づいて提案します。MobileNetV3は、ハードウェアに配慮したネットワークアーキテクチャ検索(Hardware-aware Network Architecture Search, NAS)とNetAdaptアルゴリズムを組み合わせてモバイル電話のCPUに最適化され、その後新規なアーキテクチャの進歩によりさらに改善されました。本論文では、自動化された探索アルゴリズムとネットワーク設計がどのように協調して、補完的な手法を活用し全体的な最先端技術を向上させるかについて探求を開始します。この過程を通じて、高リソースおよび低リソースユースケース向けに新しい2つのMobileNetモデル(MobileNetV3-LargeおよびMobileNetV3-Small)を開発しました。これらのモデルは、物体検出とセマンティックセグメンテーションのタスクに適応・適用されます。セマンティックセグメンテーション(または任意の密度ピクセル予測)のタスクに対して、私たちは新しい効率的なセグメンテーションデコーダーであるLite Reduced Atrous Spatial Pyramid Pooling (LR-ASPP) を提案します。これにより、モバイル分類、検出、セグメンテーションにおいて新たな最先端結果を達成しました。MobileNetV3-LargeはImageNet分類においてMobileNetV2よりも3.2%精度が向上し、遅延時間を15%削減しています。MobileNetV3-Smallは4.6%精度が向上し、遅延時間を5%削減しています。また、COCO検出においてMobileNetV2とほぼ同等の精度で約25%高速な検出性能を実現しています。Cityscapesセグメンテーションにおいても、MobileNetV3-Large LR-ASPPはMobileNetV2 R-ASPPと同程度の精度で約30%高速となっています。

MobileNetV3 の検索 | 最新論文 | HyperAI超神経