이질적 스노우플레이크 가설: 이질적 그래프를 위한 GNN의 훈련과 역량 강화

그래프 신경망(GNNs)은 다양한 그래프 기반 학습 과제에서 핵심적인 도구로 부상하고 있다. 특히 현재 대부분의 GNN 아키텍처는 명시적 또는 암묵적으로 동질성(homophily)을 전제로 작동한다. 이 전제는 흔히 채택되지만, 모든 상황에 적용 가능한 것은 아니며, 이로 인해 학습 효율성 측면에서 잠재적인 한계가 발생할 수 있다. 본 논문에서 우리는 \textbf{최초로} "한 노드당 하나의 수용 영역(One Node One Receptive Field)"이라는 주류 개념을 이질성 그래프(heterophilic graph)에 적용한다. 이를 위해 대리 레이블 예측기(proxy label predictor)를 구축함으로써 각 노드가 잠재적 예측 분포(latent prediction distribution)를 갖도록 하여, 연결된 노드들이 자신들의 이웃을 집계할지 여부를 결정하는 데 도움을 준다. 궁극적으로 각 노드는 고유한 집계 횟수와 패턴을 가질 수 있게 되며, 마치 모든 눈송이가 독특하고 고유한 특성을 지니는 것처럼 말이다. 이러한 관찰을 바탕으로 우리는 독창적으로 이질성 눈송이 가설(Heterophily Snowflake Hypothesis)을 제안하고, 이질성 그래프 및 그 이상의 연구를 안내하고 촉진하기 위한 효과적인 해결책을 제시한다. 실험은 다음과 같은 포괄적인 평가를 포함한다: (1) 10개의 그래프에서 이질성 비율이 다양한 상황에서 10개의 백본 모델에 대한 주요 성능 결과; (2) 다양한 깊은 GNN 백본(SGC, JKNet 등)과 다양한 층 수(2, 4, 6, 8, 16, 32층)에 대한 확장성 검증; (3) 기존의 눈송이 가설과의 비교; (4) 기존 그래프 프리닝 알고리즘과의 효율성 비교. 실험 결과는 제안하는 프레임워크가 다양한 작업에 유연하게 적용 가능한 융통성 있는 연산자 역할을 함을 보여준다. 이는 다양한 GNN 아키텍처에 통합될 수 있으며, 성능을 심층적으로 향상시키고 최적의 네트워크 깊이를 선택하는 설명 가능한 접근법을 제공한다. 소스 코드는 \url{https://github.com/bingreeky/HeteroSnoH}에서 공개되어 있다.