少サンプル画像分類における表現不足の補完:メタラーニングアプローチ

Few-shot学習は、実用的な応用において十分な訓練サンプルを入手することが困難であるため、近年ますます注目が集まっている挑戦的な問題である。これに対応するために、メタ学習(meta-learning)が提案された。メタ学習は、限られたラベル付きサンプルをもとに、ベースラーナー(base-learner)としての予測器を迅速に新しいタスクに適応することを目的としている。しかし、メタ学習における重大な課題は、表現の不足(representation deficiency)である。特に、少数の訓練サンプル、あるいはたった一つのサンプルから共通する情報を抽出することが困難であり、そのような限られた情報から重要な特徴の表現を獲得することが難しい。その結果、高次元のパラメータ空間においてメタラーナーが適切に学習できず、新しいタスクへの汎化が困難になる。従来の手法は、表現の不足を避けるために、表現力が低い特徴を抽出する傾向にある。本研究では、より優れた表現を学習することを目的として、補完的表現ネットワーク(complemented representations network, MCRNet)を用いたメタ学習手法を提案する。具体的には、潜在空間(latent space)を導入し、追加の表現情報を用いて潜在コードを再構成することで、表現の不足を補完する。さらに、この潜在空間は変分推論(variational inference)を用いて構築されており、さまざまなベースラーナーと良好に連携可能であり、他のモデルへの拡張も容易である。最終的に、本研究で提案するエンドツーエンドのフレームワークは、3つの標準的なfew-shot学習データセットにおける画像分類タスクで、最先端の性能を達成した。