18日前

ニューラル予測に基づくゼロショットNASの有効性

Minh Le, Nhan Nguyen, Ngoc Hoang Luong
ニューラル予測に基づくゼロショットNASの有効性
要約

予測ベースのニューラルアーキテクチャ探索(NAS)において、グラフ畳み込みネットワーク(GCN)から得られる性能指標は顕著な成果を上げている。これらの指標は、前向き伝播構造をワンホット符号化によって成分グラフとして表現することで達成されるが、その限界として、異なる探索空間間でのアーキテクチャ性能評価ができない点が挙げられる。これに対して、ランダム初期化を用いた同一アーキテクチャを前提とする手作業による性能指標(ゼロショットNAS)は、複数の探索空間にわたって汎化可能な特性を有している。この課題を解決するため、我々は深層学習を活用した新たなゼロショットNASアプローチを提案する。本手法では、畳み込みカーネルに対してサイン関数のフーリエ和による符号化を採用し、評価対象のアーキテクチャと類似した構造を持つ計算用前向き伝播グラフを構築可能とする。これらの符号化は学習可能であり、アーキテクチャのトポロジー情報を包括的に捉えることが可能である。さらに、併せて用いられる多層パーセプトロン(MLP)が、これらの符号化に基づいてアーキテクチャを順位付けする。実験の結果、本手法はNAS-Bench-201データセットにおいて従来のGCNベース手法よりも相関性が高く、収束速度も優れていることが示された。また、各NASベンチマークで学習された本手法による特徴表現は、他のNASベンチマークへも転移可能であり、複数の探索空間にわたる有望な汎化能力を示している。コードは以下のURLから公開されている:https://github.com/minh1409/DFT-NPZS-NAS