17日前

HyperShot: カーネルハイパーネットワークを用いたFew-Shot Learning

Marcin Sendera, Marcin Przewięźlikowski, Konrad Karanowski, Maciej Zięba, Jacek Tabor, Przemysław Spurek
HyperShot: カーネルハイパーネットワークを用いたFew-Shot Learning
要約

少数回学習モデルは、与えられたタスクから最小限のラベル付き例を用いて予測を行うことを目的としている。この分野における主な課題は、各クラスに対してたった一つのサンプル(ワンショット)しか与えられない設定である。本研究では、カーネルとハイパーネットワークのパラダイムを統合した「HyperShot」を提案する。従来のアプローチがパラメータの勾配ベースの調整に依存するのに対し、本モデルはタスクの埋め込み(embedding)に応じて分類モジュールのパラメータを切り替えることを目指している。実際には、サポートデータからの集約情報を入力として受け取り、対象となる問題に特化した分類器パラメータを出力するハイパーネットワークを活用する。さらに、ハイパーネットワークに供給されるサポート例の表現として、カーネルベースの表現を導入し、分類モジュールのパラメータを生成する。その結果、バックボーンモデルが提供する特徴量の直接的な値ではなく、サポート例の埋め込み同士の関係性に依拠する。このアプローチにより、本モデルは極めて異なるタスクにも柔軟に適応可能となる。