15일 전

특성 선택: 그래프 신경망을 활용한 노드 분류 성능 향상을 위한 핵심 요소

{Tsuyoshi Murata, Xin Liu, Sunil Kumar Maurya}
초록

그래프는 데이터 내 엔티티 간의 관계를 정의하는 데 도움을 준다. 이러한 관계는 간선으로 표현되며, 종종 데이터 내 패턴을 탐지하는 데 활용할 수 있는 추가적인 맥락 정보를 제공한다. 그래프 신경망(GNN)은 그래프 구조의 유도 편향(inductive bias)을 활용하여 다양한 작업에서 학습하고 예측한다. 그래프 신경망의 주요 연산은 그래프 구조에 기반하여 노드의 이웃에 대해 수행되는 특성 집계 단계이다. 각 노드는 자체 특성 외에도, 각 훑기(hop) 단계에서 이웃으로부터 추가적으로 결합된 특성을 얻는다. 이러한 집계된 특성은 노드 간의 레이블에 대한 유사성 또는 비유사성을 정의하는 데 도움이 되며, 노드 분류와 같은 작업에 유용하다. 그러나 현실 세계의 데이터에서는 서로 다른 훑기 단계에서의 이웃 특성들이 노드 특성과 상관관계를 가지지 않을 수 있다. 따라서 GNN이 특성을 무차별적으로 집계할 경우 노이즈가 포함된 특성들이 추가되어 모델 성능이 저하될 수 있다. 본 연구에서는 다양한 훑기 단계에서의 노드 특성을 선택적으로 집계하는 것이 기본적인 특성 집계 방식보다 노드 분류 작업에서 더 뛰어난 성능을 보임을 보여준다. 또한, 분류자 모델과 선택자 모델을 갖춘 이중 네트워크(Dual-Net) GNN 아키텍처를 제안한다. 분류자 모델은 입력 노드 특성의 부분집합을 기반으로 노드 레이블을 예측하도록 학습되며, 선택자 모델은 분류자에게 최적의 입력 부분집합을 제공할 수 있도록 학습한다. 두 모델은 공동으로 학습되어 노드 레이블 예측 정확도를 높이는 최적의 특성 부분집합을 학습한다. 광범위한 실험을 통해 제안하는 모델이 특성 선택 기법과 최신 GNN 모델 모두를 뛰어넘으며, 최대 27.8%의 뚜렷한 성능 향상을 달성함을 입증하였다.

특성 선택: 그래프 신경망을 활용한 노드 분류 성능 향상을 위한 핵심 요소 | 최신 연구 논문 | HyperAI초신경