
要約
限られたデータでの学習は視覚認識にとって重要な課題である。多くの少ショット学習手法は、この課題に対処するために、既知のクラスからインスタンス埋め込み関数を学習し、未知のクラスのラベルが限定的なインスタンスにその関数を適用する。このような転移学習はタスク非依存的であり、未知のクラスに対する最適な識別力をもって学習されない。未知のクラス間で区別することにより目標となるタスクが達成されるためである。本論文では、セット間関数を使用してインスタンス埋め込みを目標分類タスクに適合させる新しいアプローチを提案する。これにより、タスク固有かつ識別力のある埋め込みが得られる。我々は実証的に様々なセット間関数の具体例を調査し、トランスフォーマーが最も効果的であることを観察した -- これは我々が望むモデルの重要な特性を自然に満たすからである。このモデルをFEAT(トランスフォーマーによる少ショット埋め込み適合)と呼び、標準的な少ショット分類ベンチマークおよびクロスドメイン、伝導的、汎化型少ショット学習、低ショット学習という4つの拡張された少ショット学習設定において検証した。これらの設定には重要な使用事例が含まれている。FEATはベースラインモデルや従来の手法に対して一貫した改善を示し、2つのベンチマークで新たな最先端の結果を樹立した。