17日前

マッチ・テン・アップ:視覚的に説明可能な少サンプル画像分類

Bowen Wang, Liangzhi Li, Manisha Verma, Yuta Nakashima, Ryo Kawasaki, Hajime Nagahara
マッチ・テン・アップ:視覚的に説明可能な少サンプル画像分類
要約

少サンプル学習(Few-shot Learning, FSL)手法は、通常、事前学習された知識がベース(観測済み)カテゴリから得られ、それを新規(未観測)カテゴリに効果的に転移可能であるという仮定に基づいている。しかし、特に後者の転移の部分については、保証が得られるわけではない。この問題により、多数のFSL手法における推論プロセスの不透明性が生じ、リスク感受性の高い分野への応用を妨げている。本論文では、バックボーンモデルからの視覚的表現と、新たに登場した説明可能な分類器によって生成された重みを用いて、画像分類におけるFSLを実現する新たなアプローチを提案する。この重み付き表現は、識別可能な最小限の特徴のみを含み、可視化された重みはFSLプロセスにおける有用なヒントとして機能する。さらに、識別器(ディスクリミネータ)が、サポートセットとクエリセット内の画像ペアごとの表現を比較し、スコアが最も高いペアによって分類結果が決定される。実験結果から、提案手法が3つの主要なデータセットにおいて高い精度と満足できる説明可能性の両方を達成できることを確認した。