
要約
現代の学習アルゴリズムは、データの正確かつ複雑なモデルを生成することに優れています。しかし、このようなモデルを実世界に展開する際には特別な注意が必要です:信頼性、堅牢性、および望ましくないバイアスの不在を確保しなければなりません。これにより、予測性能だけでなく検証と評価も容易に行えるような同等の精度を持つモデルの開発が促進されます。この目的のために、我々はコンテクスト説明ネットワーク(CEN)という一連のアーキテクチャを導入します。CENは、中間的な簡略化された確率モデルを生成し利用することで予測を行うクラスのアーキテクチャです。具体的には、CENは中間グラフィカルモデルのパラメータを生成し、これらのパラメータが予測に使用されると同時に説明の役割も果たします。既存の事後説明ツールとは異なり、CENは予測と説明を同時に学習します。当手法は二つの主要な利点を提供します:(i) それぞれの予測に対して有効なインスタンス固有の説明が追加計算コストなしで生成され、(ii) 説明を通じた予測が正則化器として機能し、データが乏しい状況での性能向上に寄与します。我々は提案したフレームワークについて理論的におよび実験的に分析しました。画像分類やテキスト分類、サバイバル解析などのタスクにおける結果は、CENが最先端手法と競合しつつも各予測背後の追加的な洞察を提供できることを示しています。これは意思決定支援にとって価値があります。また、事後方法が特定の場合に誤った説明を生成する可能性がある一方で、CENは一貫しており、そのようなケースを系統的に検出することが可能です。