
초록
해석 가능한 그래프 학습은 그래프 구조 데이터로부터 통찰을 도출하기 위해 학습 모델에 의존하는 많은 과학적 응용 분야에서 필수적이다. 기존 연구들은 주로 사후(post-hoc) 접근 방식을 사용하여 사전 학습된 모델(특히 그래프 신경망)을 해석하는 데 집중해왔다. 이러한 연구들은 해석 가능성과 예측 정확도 사이의 트레이드오프를 이유로 본질적으로 해석 가능한 모델을 반대해왔다. 그러나 이러한 사후 해석 방법은 해석의 안정성이 떨어지며, 작업과 우연히 상관관계가 있는 특징을 추출할 수 있다는 한계가 있다. 본 연구에서는 정보 차단 원리(information bottleneck principle)로부터 유도된 그래프 스토케스틱 어텐션(GSAT)을 제안함으로써 이러한 문제를 해결한다. GSAT은 어텐션 가중치에 확률성을 도입하여 작업과 무관한 그래프 구성 요소로부터의 정보 흐름을 차단하고, 확률성 감소된 어텐션을 통해 작업과 관련된 부분 그래프를 선택하여 해석한다. 가정 조건 하에서 선택된 부분 그래프는 작업과 우연히 상관된 패턴을 포함하지 않음을 수학적으로 보장할 수 있다. 8개의 데이터셋에 대한 광범위한 실험 결과, GSAT은 해석 AUC에서 최신 기법 대비 최대 20%↑, 예측 정확도에서는 최대 5%↑로 우수한 성능을 보였다. 코드는 https://github.com/Graph-COM/GSAT 에서 공개되어 있다.