17日前

Few-Shot Image Classificationのためのユニバーサル表現変換層

Lu Liu, William Hamilton, Guodong Long, Jing Jiang, Hugo Larochelle
Few-Shot Image Classificationのためのユニバーサル表現変換層
要約

少サンプル分類は、少数のサンプルしか提示されない状況下で、未観測のクラスを認識することを目的とする。本研究では、未観測のクラスおよびそのサンプルが多様なデータソースから得られるという、マルチドメイン少サンプル画像分類の問題に着目する。この問題は近年注目が集まっており、Meta-Datasetなどのベンチマークの開発を促進している。マルチドメイン設定における主な課題は、学習に用いられる多様なドメインからの特徴表現を効果的に統合することである。本研究では、ドメイン固有の表現を動的に再重み付け・組み合わせることで、普遍的な特徴をメタ学習的に活用するUniversal Representation Transformer(URT)層を提案する。実験の結果、URTはMeta-Dataset上で新たな最良性能を達成し、比較手法と比較して最も多くのデータソースでトップクラスの性能を発揮した。また、URTの変種を分析し、モデルのドメイン間一般化のメカニズムを理解するための注目スコアヒートマップの可視化を提示している。本研究のコードは、https://github.com/liulu112601/URT で公開されている。