2ヶ月前

射影分離変分推論による少ショット分類

Anuj Singh; Hadi Jamali-Rad
射影分離変分推論による少ショット分類
要約

少量のサンプルから学習する柔軟性は、人間の知能の特徴です。Few-shot learning(少ショット学習)は、この能力を機械に移すことを目指しています。確率的深層学習の可能性と力に触発され、我々は新たな変分推論ネットワークを提案します。これはfew-shot classification(少ショット分類)のために設計されており、TRIDENTと命名されました。このネットワークは、画像の表現を意味的な潜在変数とラベルの潜在変数に分離し、これらを相互に関連させて同時に推論します。タスク認識性を誘導するために、TRIDENTの推論メカニズムの一環として、query画像とsupport画像の両方から情報を抽出する新たなアテンションベースの伝導的特徴抽出モジュール(AttFEXと呼ぶ)を利用しています。我々が行った広範な実験結果は、TRIDENTの有効性を確認しており、最も一般的に使用されるデータセットであるminiImageNetとtieredImageNetにおいて、非常に単純なバックボーンを使用して新しい最先端性能を達成しています(それぞれ最大4%および5%の改善)。さらに、最近挑戦的なクロスドメインタスクであるminiImagenet → CUBシナリオでも、既存の最良のクロスドメイン基準を超える大幅な改善(最大20%)を示しています。コードや実験結果については、GitHubリポジトリで公開されています:https://github.com/anujinho/trident