17日前

細粒度画像認識のための選択的スパースサンプリング

{ Jianbin Jiao, Qixiang Ye, Yi Zhu, Yanzhao Zhou, Yao Ding}
細粒度画像認識のための選択的スパースサンプリング
要約

細粒度認識は、同一クラス内に著しい変動が生じる中で、クラス間の微細な差異を捉えるという特有の課題を抱えている(例:鳥類種の嘴の形状)。従来のアプローチでは、画像の局所領域を切り出し、それらから詳細な特徴表現を学習するが、これには部分の数が固定され、周囲の文脈情報が欠落するという問題がある。本研究では、多様で微細な特徴を捉えることを目的として、シンプルかつ効果的なフレームワーク「選択的スパースサンプリング(Selective Sparse Sampling)」を提案する。このフレームワークは畳み込みニューラルネットワーク(CNN)を用いて実装され、選択的スパースサンプリングネットワーク(S3N: Selective Sparse Sampling Networks)と呼ばれる。画像レベルのラベルを用いた教師あり学習において、S3Nはクラス応答マップからピーク(局所的最大値)を抽出し、情報量の多い受容野を推定するとともに、スパースな注目領域を学習することで、微細な視覚的証拠を捉えつつ文脈情報を保持する。得られた証拠は選択的にサンプリングされ、判別力があり補完的な特徴が抽出される。これにより、学習された表現が大幅に豊かになり、ネットワークがより微細な特徴を発見する能力が向上する。広範な実験およびアブレーションスタディの結果、CUB-200-2011、FGVC-Aircraft、Stanford Carsといった困難なベンチマークにおいて、提案手法が最先端手法を一貫して上回ることが示された。

細粒度画像認識のための選択的スパースサンプリング | 最新論文 | HyperAI超神経