
要約
様々な視覚タスクや自然言語処理タスクのためのニューラルアーキテクチャの自動探索は、任意のデータセットで高性能な構造を発見できるため、重要なツールとなっています。しかし、ピクセル単位での密集分類などのより困難な領域では、現在の自動アプローチには範囲が限定されています。既存の画像分類器に強く依存しているため、これらの手法は通常、追加の数少ない層のみを探索し、発見されたアーキテクチャは依然として多数のパラメータを含む傾向があります。対照的に、本研究では、事前学習された分類ネットワークのわずかなブロックから軽量かつ精度の高いセグメンテーションアーキテクチャを見つける新しいソリューションを提案します。この目的のために、操作セットのテンプレートに基づいて段階的に方法論を構築し、各ステップでどのテンプレートを使用するかおよび何回適用するかを予測しながら、接続構造とダウンサンプリング係数も生成します。これらの決定は、リカレントニューラルネットワークによって行われます。このネットワークはホールドアウトセットでの生成されたアーキテクチャのスコアに基づいて報酬を受け取り、強化学習を使用して訓練されます。発見された1つのアーキテクチャは27万パラメータしか持たないにもかかわらず、CamVidデータセットで平均IoU(Intersection over Union)63.2%、CityScapesデータセットで67.8%という性能を達成しています。事前学習済みモデルと探索コードは以下のURLから入手可能です: https://github.com/DrSleep/nas-segm-pytorch.