2ヶ月前
学習可能な多スケール埋め込みと注意メカニズムを用いた少ショット画像分類の向上
Askari, Fatemeh ; Fateh, Amirreza ; Mohammadi, Mohammad Reza

要約
少ショット分類の文脈において、目的は限られた数のサンプルを使用しながら満足できる性能を維持する分類器を訓練することです。しかし、従来の計量ベースの手法はこの目標達成に際して特定の制約を示しています。これらの手法は通常、クエリ特徴量とサポート特徴量との間の単一の距離値に依存しているため、浅い特徴量の貢献を見落としています。この課題を克服するために、本論文では新しいアプローチを提案します。当該アプローチでは、サンプルを異なる特徴空間にマッピングするマルチ出力埋め込みネットワークを利用します。提案手法は異なる段階で特徴ベクトルを抽出し、モデルが全体的な特徴と抽象的な特徴双方を捉えることを可能にします。これらの多様な特徴空間を利用することで、当モデルは性能向上を図ります。さらに、自己注意機構(self-attention mechanism)を使用することで各段階での特徴量の洗練が改善され、より堅牢な表現と全体的な性能向上につながります。また、各段階に学習可能な重み(learnable weights)を割り当てることにより、性能と結果が大幅に向上しました。私たちは MiniImageNet および FC100 データセットにおいて包括的な評価を行い、特に 5クラス1ショット(5-way 1-shot)および 5クラス5ショット(5-way 5-shot)シナリオで検証しました。さらに8つのベンチマークデータセット間でのクロスドメインタスクも実施し、テストドメインにおける高い精度を達成しました。これらの評価結果は、提案手法が最先端のアプローチと比較して有効性を持つことを示しています。https://github.com/FatemehAskari/MSENet