17日前

解釈可能な少サンプル画像分類のためのリージョン比較ネットワーク

Zhiyu Xue, Lixin Duan, Wen Li, Lin Chen, Jiebo Luo
解釈可能な少サンプル画像分類のためのリージョン比較ネットワーク
要約

ディープラーニングは、多くの実世界のコンピュータビジョンタスクに成功裏に適用されてきたが、堅牢な分類器を訓練するには、大量の正確にラベル付けされたデータが必要となることが一般的である。しかしながら、ラベル付け作業はしばしば高コストかつ時間のかかるプロセスである。この問題に対応するため、新しいクラスに対するモデルを学習する際に、限られた数のラベル付き例しか使用しない「少サンプル画像分類(few-shot image classification)」が提案されている。近年の転移可能なメトリック学習に基づく手法は、クエリ集合とサポート集合からのサンプル特徴間の類似性を学習することで、有望な分類性能を達成している。しかし、これらの手法の多くは、モデルの解釈可能性(interpretability)を明示的に考慮していない。実際、解釈可能性は訓練段階においても明らかにされるべきものである。本研究では、このような課題に対応するため、メトリック学習に基づく新しい手法として「領域比較ネットワーク(Region Comparison Network: RCN)」を提案する。本手法は、ニューラルネットワーク内での少サンプル学習のメカニズムを可視化するだけでなく、クエリ集合とサポート集合に属する画像間で関連する具体的な領域を特定することが可能である。さらに、ネットワーク内の中間変数を可視化することで、本手法がどのように学習したかを直感的に説明するための可視化戦略「領域活性マッピング(Region Activation Mapping: RAM)」も提案する。また、解釈可能性をタスクレベルからカテゴリレベルへと拡張する新しいアプローチを提示し、これはRCNの最終判断を支える代表的な部位(prototypical parts)を特定する手法としても捉えられる。4つのベンチマークデータセットにおける広範な実験により、従来のベースライン手法と比較して、本手法の有効性が明確に示された。

解釈可能な少サンプル画像分類のためのリージョン比較ネットワーク | 最新論文 | HyperAI超神経