深層畳み込みニューラルネットワークの画像分類のための多目的進化的設計

畳み込みニューラルネットワーク(CNN)アーキテクチャの初期の進展は、主に人間の専門知識と複雑な設計プロセスによって駆動されてきた。近年、ネットワーク設計プロセスの自動化およびタスク依存的なアーキテクチャの生成を目的として、ニューラルアーキテクチャ探索(NAS)が提案された。既存の手法は画像分類において競争力のある性能を達成しているものの、計算リソースの制約がある問題に対しては適していない。その理由は以下の2点に帰着する:(1)得られたアーキテクチャは分類性能のみに最適化されているか、あるいは一つのデプロイ環境にのみ最適化されている;(2)多くのアプローチにおいて探索プロセスに膨大な計算リソースが必要となる。これらの制約を克服するため、本研究では、分類性能や浮動小数点演算数(FLOPs)といった複数の目的関数を考慮した進化的アルゴリズムを用いたニューラルアーキテクチャ探索手法を提案する。本手法は、遺伝的操作を用いてアーキテクチャ要素を段階的に再結合・変更することで、全体のパレート最適境界(Pareto frontier)を近似する複数のアーキテクチャを生成することにより、第一の課題を解決する。また、探索中におけるアーキテクチャの適切なスケーリングと、過去に成功したアーキテクチャに共通するパターンをベイズモデル学習によって強化することで、計算効率の向上を実現する。本研究の2つの主要な貢献を統合することにより、CIFAR、ImageNet、および人間の胸部X線画像といった標準ベンチマークデータセットにおいて、従来の手動設計および自動設計アーキテクチャを上回る性能を示す効率的なアーキテクチャ設計が可能となる。異なる計算リソース要件に対応する複数のアーキテクチャ選択肢を同時に得られる柔軟性は、本手法を既存の手法と明確に区別する特徴である。コードは以下のURLで公開されている:https://github.com/mikelzc1990/nsganetv1