2ヶ月前

Grad-CAM++: 深層畳み込みネットワークの改善された視覚的説明

Aditya Chattopadhyay; Anirban Sarkar; Prantik Howlader; Vineeth N Balasubramanian
Grad-CAM++: 深層畳み込みネットワークの改善された視覚的説明
要約

過去10年間、畳み込みニューラルネットワーク(CNN)モデルは複雑な視覚問題の解決において非常に成功を収めてきました。しかし、これらの深層モデルは内部機能の理解が不足しているため、「ブラックボックス」手法とみなされています。最近では説明可能な深層学習モデルの開発に対する関心が高まっています。本論文では、この方向性への取り組みとして、最近提案されたGrad-CAMという手法を基に、より優れた視覚的な説明を提供する一般化された手法であるGrad-CAM++を提案します。Grad-CAM++は、特定のクラススコアに対する最終畳み込み層の特徴マップの正の偏微分を重みとして使用し、そのクラスラベルに対応する視覚的な説明を生成します。我々は提案手法の数学的導出を行い、標準データセットにおける包括的な実験と評価(主観的および客観的)を通じて、Grad-CAM++が分類、画像キャプション生成、3次元動作認識などの複数のタスクで与えられたCNNアーキテクチャに対して有望な人間が解釈可能な視覚的な説明を提供することを示しました。また、知識蒸留などの新しい設定でも同様に有効であることが確認されました。

Grad-CAM++: 深層畳み込みネットワークの改善された視覚的説明 | 最新論文 | HyperAI超神経