17日前

拡張少サンプル学習:新規タスクにおける既存リソースの活用

Reza Esfandiarpoor, Amy Pu, Mohsen Hajabdollahi, Stephen H. Bach
拡張少サンプル学習:新規タスクにおける既存リソースの活用
要約

多くの実用的な少サンプル学習(few-shot learning)の問題において、ラベル付きサンプルは限られているものの、有用な情報を含む可能性のある豊富な補助データセット(auxiliary dataset)が存在する。本研究では、こうした状況を扱うため、「拡張少サンプル学習(extended few-shot learning)」という問題設定を提案する。その後、少サンプル画像分類において、補助データを効率的に選択し、効果的に活用するという課題に対処するためのフレームワークを導入する。大規模な補助データセットとクラス間の意味的類似性(semantic similarity)の概念を前提として、ターゲットタスクに関連する他のクラスから自動的に「擬似ショット(pseudo shots)」と呼ばれるラベル付きサンプルを選定する。我々は、単純なアプローチ、すなわち(1)補助サンプルをターゲットタスクのサンプルと同様に扱う方法、あるいは(2)転移学習を用いて特徴を学習する方法では、精度向上が限定的であることを示す。代わりに、補助データの特徴をターゲットクラスの特徴とより類似するように調整する「マスキングモジュール(masking module)」を提案する。実験の結果、このマスキングモジュールは、単純なサポートサンプルのモデル化手法および転移学習手法と比較して、それぞれ4.68ポイントおよび6.03ポイントの精度向上を達成することが明らかになった。