
要約
分布外(Out-of-Distribution, OOD)問題は、ニューラルネットワークが訓練データの分布(In-Distribution, InD)とは著しく異なるデータに遭遇する際に一般に生じる。本論文では、ニューロンの活性化状態に着目してOOD問題を考察する。まず、ニューロンの出力とモデルの決定に与える影響の両方を考慮することで、ニューロン活性化状態を定式化する。次に、ニューロンとOOD問題の関係を特徴付けるために、ニューロン活性化カバレッジ(Neuron Activation Coverage, NAC)という新たな指標を導入する。これはInDデータ下におけるニューロン行動を簡潔に測定するための指標である。本研究で提案するNACを活用して、以下の2点を示す。1)InDとOODの入力は、ニューロンの行動に基づいて大きく分離可能であり、この性質によりOOD検出問題が著しく容易化される。また、CIFAR-10、CIFAR-100、ImageNet-1Kの3つのベンチマークにおいて、従来の21手法を上回る性能を達成した。2)NACとモデルの汎化能力の間に一貫した正の相関関係が、異なるアーキテクチャやデータセットにおいても確認された。この性質により、NACに基づくモデルのロバスト性評価基準の構築が可能となる。従来のInD検証基準と比較して、NACはよりロバストなモデルを効果的に選別できることに加え、OODテスト性能との相関関係が強いことも示された。