
要約
少サンプル学習(few-shot learning)とは、少数の例から新たな概念を学習する手法であり、実用的な視覚認識システムの基盤となる。既存の多くは少サンプル分類に焦点を当てているが、より挑戦的でありながらも未だ十分に探索されていない少サンプル物体検出に向け、我々は一歩前進する。本研究では、統一的かつ一貫した枠組みで少サンプル分類と少サンプル局在を同時に扱う、概念的に単純だが強力なメタ学習ベースのフレームワークを提案する。このフレームワークは、豊富なデータを持つベースクラスから得られる「モデルパラメータ生成」に関するメタレベルの知識を活用し、新規クラス向けの検出器の生成を支援する。本研究の核心的な洞察は、CNNベースの検出モデルにおけるカテゴリに依存しない部分とカテゴリに依存する部分の学習を分離することにある。特に、少数の例からカテゴリに依存する部分のパラメータを予測できる重み予測メタモデルを導入する。また、現代的な検出器が少数サンプル環境下でどのように性能を発揮するかを体系的にベンチマークした。実際のさまざまなシナリオ(ドメイン内、ドメイン間、長尾分布など)における実験により、異なる意味での新規クラスに対して本手法の有効性と汎用性が示された。