
要約
少ショット学習は、訓練例がわずかしかない状況で新しい概念を学習することを目指しており、近年広く研究されてきました。しかし、現在の多くの研究では、エピソード訓練パラダイムにおいてモデルを訓練するために大規模なラベル付き補助データセットに大きく依存しています。このような教師あり設定は、基本的には少ショット学習アルゴリズムの普及利用を制限しています。本論文では、分布シフトに基づくデータ拡張(Distribution Shift-based Data Augmentation)を利用した無監督少ショット学習(Unsupervised Few-shot Learning)の新規フレームワークであるULDAを開発します。特に、増強ベースの前処理少ショットタスクにおける分布多様性の価値と重要性に注目し、過学習問題を効果的に軽減し、少ショットモデルがより堅牢な特徴表現を学習できるようにします。ULDAにおいては、異なる増強技術の効果を系統的に調査し、各少ショットタスクにおいてクエリセットとサポートセット間の分布多様性(または差異)を強化することを提案します。これにより、単純な増強技術(例えばランダムクロップ、色揺らぎ、または回転)を使用しても、大幅な改善が得られます。実験では、ULDAによって学習された少ショットモデルが優れた汎化性能を達成し、OmniglotおよびminiImageNetでの既存のさまざまな少ショット学習タスクで最先端の結果を得ています。ソースコードは https://github.com/WonderSeven/ULDA で公開されています。