
要約
低ショット視覚学習---極めて少ないサンプルから新しい物体カテゴリーを認識する能力---は人間の視覚知能の特徴的な側面です。既存の機械学習手法では、このように一般的化することは困難です。この基礎的な問題に対する進展のために、我々は野生環境で認識システムが直面する課題を模倣した複雑な画像上の低ショット学習ベンチマークを提示します。さらに、a) 表現正則化技術と b) データ不足クラスに対して追加の訓練サンプルを生成する技術を提案します。これらの方法を組み合わせることで、畳み込みニューラルネットワークの低ショット学習における効果性が向上し、挑戦的なImageNetデータセットにおいて新規クラスの単発認識精度が2.3倍に改善しました。