4ヶ月前
メタチューニングの力を解き放ち、スパース補間専門家を用いた少ショット汎化を実現する
Chen, Shengzhuang ; Tack, Jihoon ; Yang, Yunqiao ; Teh, Yee Whye ; Schwarz, Jonathan Richard ; Wei, Ying

要約
最近の成功事例は、パラメータ効率的なファインチューニングが、ビジョンにおける転移学習の最先端手法として確立し、メタ学習などの代替手法の豊富な文献を置き換えることを示唆しています。両者の最良点を活用しようとする取り組みとして、メタチューニングは基礎モデルの後続最適化ステージを導入していますが、これまで限られた成功しか見せておらず、特に分布外(OOD)タスクにおいて性能が低下する傾向があります。本論文では、Sparse MetA-Tuning (SMAT) という方法を紹介します。この方法はスパースなエキスパート混合アプローチに着想を得て、各タスクに対して自動的に事前学習済みパラメータの部分集合を選択してメタチューニングを行うように訓練されています。SMATはOOD感度を克服し、パラメータ効率的なファインチューニングを超えてビジョン基礎モデルの転移能力を向上させる約束を果たしました。私たちはゼロショット設定と勾配ベースの適応設定の両方でMeta-Datasetに追加されたOODタスクとの困難な組み合わせについて新しい最先端結果を樹立しました。さらに、私たちは学習によって得られるスパーシティパターンと手動で設計されたスパーシティパターンの優位性について詳細な分析を行い、分布内と分布外の汎化能力のバランスを取る上でスパーシティレベルの重要性を強調しています。私たちのコードは公開されています。