
要約
我々が提案するフレームワークは、パフォーマンスと説明可能性のトレードオフを打破することを目指し、横方向抑制機構に基づいた設計段階で説明可能な畳み込みニューラルネットワーク(CNN)を導入しています。ExplaiNetモデルは、予測器と説明器から構成されています。予測器は、残差接続や密集接続を持つ高精度のCNNであり、説明器はネットワークニューロンの空間的相互作用を表現する確率グラフです。各グラフノードの値は、活性化強度順に並べられた拮抗ニューロンのインデックスを表す局所離散特徴量(LDF)ベクトルであり、勾配降下法によって学習されます。LDFをシーケンスとして使用することで、分子生物学で一般的に使用されるEMベースのシーケンスモチーフ発見手法EXTREMEを再利用して説明の簡潔性を向上させることができます。中間画像表現それぞれに対して離散特徴量モチーフ行列を使用することで、連続的な活性化テンソルではなくなるため、ベイジアンネットワークの固有の説明可能性を利用することができます。観察結果を集め直接確率を計算することで、隣接するレベル間のモチーフ間の因果関係を説明し、モデル出力を全体的なモチーフに帰属させることができます。さらに、様々な小さな画像ベンチマークデータセットに対する実験により、提案する予測器がパラメータ数や層数が同じ場合でも基準アーキテクチャと同じレベルのパフォーマンスを確保することが確認されました。我々の新しい手法はこのパフォーマンスを超える可能性がありながらも追加の説明ストリームを提供します。解いたMNIST分類タスクにおいては、標準的な訓練設定と0.75百万個のパラメータを使用して単一モデルにおける最先端性能と同等の結果を得ています。