
그래프 신경망(Graph Neural Networks, GNN)은 그래프 구조에 기반한 추가적인 제약 조건을 적용함으로써 데이터에서 학습하는 데 유용한 도구로 부상하였다. 이러한 그래프는 일반적으로 엔티티 간의 내재적인 관계를 전제로 구성된다. 최근 몇 년간 아키텍처 설계 측면에서 큰 발전이 이루어져 다양한 예측 작업에서 성능이 크게 향상되었다. 일반적으로 이러한 신경망 아키텍처는 층의 깊이와 노드 특성 집합 단계를 결합한다. 이로 인해 다양한 허프(Hop) 단계에서 특성의 중요도를 분석하거나 신경망 층의 표현 능력을 평가하는 것이 어렵게 된다. 다양한 그래프 데이터셋은 특성 및 클래스 레이블 분포에서 동질성(homophily)과 이질성(heterophily)의 수준이 다르므로, 사전 정보 없이도 예측 작업에 중요한 특성이 무엇인지 이해하는 것이 필수적이다. 본 연구에서는 그래프 신경망의 노드 특성 집합 단계와 층 깊이를 분리하고, 그래프 신경망을 위한 몇 가지 핵심 설계 전략을 제안한다. 구체적으로, 이웃 노드로부터 얻은 특성들을 서로 다른 허프 거리에서 집합할 때 소프트맥스(softmax)를 정규화 기법으로 사용하고, ‘소프트 선택기(Soft-Selector)’를 도입하며, GNN 층 간에 ‘허프 정규화(Hop-Normalization)’를 적용한다. 이러한 기법들을 결합하여 간단하고 얕은 구조의 모델인 특성 선택 그래프 신경망(Feature Selection Graph Neural Network, FSGNN)을 제안하며, 실증적으로 제안된 모델이 기존 최고 성능의 GNN 모델들을 초월하고, 노드 분류 작업에서 최대 64%의 정확도 향상을 달성함을 보였다. 또한, 모델이 학습한 소프트 선택 파라미터를 분석함으로써 예측 작업에서 각 특성의 중요도를 간단히 탐색할 수 있는 방법을 제공한다. 마지막으로, 실험을 통해 본 모델이 수백만 개의 노드와 수십억 개의 엣지를 가진 대규모 그래프에 대해 확장 가능함을 입증하였다.