11日前

F-CAM:ガイド付きパラメトリックアップスケーリングを用いたフル解像度クラス活性化マップ

Soufiane Belharbi, Aydin Sarraf, Marco Pedersoli, Ismail Ben Ayed, Luke McCaffrey, Eric Granger
F-CAM:ガイド付きパラメトリックアップスケーリングを用いたフル解像度クラス活性化マップ
要約

クラス活性マッピング(CAM)手法は、弱教師あり物体局所化(WSOL)タスクにおいて近年注目を集めている。これらの手法は、完全にアノテーションされた画像データセットでの学習を必要とせずに、CNNの可視化および解釈を可能にする。CAM手法は一般的に、ResNet50など既存のCNNバックボーンと統合される。しかし、畳み込みおよびプーリング演算の影響により、これらのバックボーンは最大32倍の低解像度CAMを出力するため、局所化の精度が損なわれる。フルサイズのCAMを復元するためには補間処理が必要となるが、これには物体の統計的特性(色やテクスチャなど)を考慮しないため、境界が一貫性のない活性化が生じ、正確な局所化が困難となる。本研究では、CAMのパラメトリックな拡大を可能にする汎用的手法を提案する。これにより、高精度なフル解像度CAM(F-CAM)の構築が実現される。具体的には、任意のCNN分類器に接続可能な学習可能なデコーディングアーキテクチャを提案する。低解像度の元のCAMを入力として、前景および背景ピクセルをランダムにサンプリングし、デコーダーを微調整する。さらに、画像統計や物体サイズ制約といった追加の事前知識を活用して、物体境界の拡張および精緻化を図る。CUB-200-2011およびOpenImagesデータセット上における、3種類のCNNバックボーンと6種類のWSOLベースラインを用いた広範な実験結果から、本手法F-CAMはCAMの局所化精度において顕著な向上を達成することが示された。F-CAMの性能は最先端のWSOL手法と競合するレベルに達するが、推論時の計算量はより少ないという利点を持つ。

F-CAM:ガイド付きパラメトリックアップスケーリングを用いたフル解像度クラス活性化マップ | 最新論文 | HyperAI超神経