
要約
深層ニューラルネットワークは、単一のクラスを識別するために、数千ものほとんど理解不能な特徴量を用いるが、その判断は人間が追うことができない。本研究では、解釈可能性の測定可能な側面を備えた、スパースかつ低次元の最終決定層を深層ニューラルネットワークに導入し、細粒度画像分類においてその有効性を示す。我々は、機械学習モデルの判断を人間が理解できるためには、特徴量が解釈可能であり、かつ単一の判断に極めて少数の特徴量しか使用されてはならないと考える。そのためには、最終層はスパースでなければならず、特徴量の解釈を可能にするために低次元である必要がある。このようなモデルを、スパース低次元決定(Sparse Low-Dimensional Decision: SLDD)モデルと呼ぶ。我々は、SLDDモデルが密な高次元の決定層と比較して、局所的・全体的に解釈が容易であることを示すとともに、競争力のある精度を維持できることを実証する。さらに、モデルの特徴量の多様性と精度を向上させる損失関数を提案する。提案するより解釈性の高いSLDDモデルは、クラスごとにわずか50個の特徴量のうち5個しか使用せず、4つの一般的なベンチマークデータセットにおいて、基準モデル(2048特徴量)と比較して97%~100%の精度を維持している。