17日前
DCNAS:意味画像セグメンテーションのための密結合ニューラルアーキテクチャサーチ
Xiong Zhang, Hongmin Xu, Hong Mo, Jianchao Tan, Cheng Yang, Lei Wang, Wenqi Ren

要約
ニューラルアーキテクチャサーチ(NAS)は、密度の高い画像予測に適したスケーラブルなネットワークアーキテクチャを自動設計する上で大きな可能性を示している。しかし、従来のNASアルゴリズムは計算リソースの制約を考慮し、制限された探索空間内で代理タスク(proxy task)を用いて探索を行うため、性能に妥協を強いられる場合が多い。本研究では、可能な限り広範なネットワークアーキテクチャの探索を可能にするとともに、ターゲットデータセットと代理データセットとの間のギャップを回避するため、大規模なターゲットデータセット上で視覚情報のマルチスケール表現に対する最適なネットワーク構造を直接探索する「密結合型NAS(Densely Connected NAS:DCNAS)」フレームワークを提案する。具体的には、セル間を学習可能な重みを用いて接続することで、主流のネットワーク設計を包括する密結合型の探索空間を導入した。さらに、パスレベルおよびチャネルレベルのサンプリング戦略を統合した融合モジュールを設計し、広大な探索空間に伴うメモリ消費を低減した。実験の結果、本研究で得られたアーキテクチャは、公開のセマンティック画像セグメンテーションベンチマークにおいて最先端の性能を達成しており、Cityscapesでは84.3%、PASCAL VOC 2012では86.9%の精度を記録した。また、より困難なADE20KおよびPascal Contextデータセットにおいても、高い性能を維持している。