11일 전

컨볼루셔널 신경망의 인과적 설명

{Hichem Debbi}
초록

본 논문에서는 Halpern과 Pearl [12]의 인과성 이론을 기반으로 한 합성곱 신경망(Convolutional Neural Networks, CNN)에 대한 설명 기법을 제안한다. 인과적 설명 기법(CexCNN)은 CNN의 결정에 대한 필터의 중요도를 측정하는 데 기반하며, 이 중요도는 반사적 추론(counterfactual reasoning)을 통해 평가된다. 또한, 필터의 중요도를 가중치화하고 입력 이미지 상에서 그 기여도를 시각화하기 위해 책임(responsibility)과 비난(blame)의 확장된 인과성 정의를 활용한다. CNN은 계층적 구조를 가지며, 인과 모델 또한 계층적으로 추상화될 수 있으므로, 이러한 유사성을 활용하여 본 논문의 가장 중요한 기여 중 하나인, CNN의 결정에 가장 큰 영향을 미친 입력 이미지 내의 중요한 특징을 정확히 위치화하는 작업을 수행한다. 본 기법은 특징 위치화 외에도, 덜 중요한 필터를 제거함으로써 모델 압축(model compression)에 활용될 수 있음을 보여줄 것이다. CexCNN은 여러 가지 CNN 아키텍처와 데이터셋에 대해 검증되었으며, 관련 코드는 https://github.com/HichemDebbi/CexCNN 에서 공개되어 있다.