17日前

ニューラルプロンプトサーチ

Yuanhan Zhang, Kaiyang Zhou, Ziwei Liu
ニューラルプロンプトサーチ
要約

近年、特にVision Transformerの登場を契機として、視覚モデルの規模は指数関数的に拡大している。これに伴い、適応層の学習や視覚的プロンプトトークンの導入など、パラメータ効率的なチューニング手法の開発が促進された。こうした手法により、事前学習で得られた大部分のパラメータを固定したまま、わずかなパラメータのみを微調整することが可能となる。しかし、適切なチューニング手法を設計することは容易ではない。設計選択肢の膨大なリストを試行する必要があり、さらに各ダウンストリームデータセットごとにカスタム設計を要する場合が多い。本論文では、既存のパラメータ効率的なチューニング手法を「プロンプトモジュール」として捉え、大規模視覚モデルに対して、各ダウンストリームデータセットごとに最適なプロンプトモジュールの設計をニューラルアーキテクチャサーチ(NAS)アルゴリズムを用いて学習する新規手法、Neural prOmpt seArcH(NOAH)を提案する。20以上の視覚データセットを対象とした広範な実験を通じて、NOAHが(i)個々のプロンプトモジュールを上回る性能を示し、(ii)少数サンプル学習(few-shot learning)において優れた能力を発揮し、(iii)ドメインに一般化可能な特性を持つことを実証した。コードおよびモデルは、https://github.com/Davidzhangyuanhan/NOAH にて公開されている。