15일 전
그래프 신경망을 위한 데이터 증강
Tong Zhao, Yozen Liu, Leonardo Neves, Oliver Woodford, Meng Jiang, Neil Shah

초록
데이터 증강은 기계 학습 모델의 일반화 성능을 향상시키는 데 널리 활용되어 왔다. 그러나 그래프에 대한 데이터 증강에 관한 연구는 비교적 적다. 이는 그래프가 복잡하고 유클리드가 아닌 구조를 지니고 있어 가능한 조작 연산의 수가 제한되기 때문이다. 비전 및 언어 분야에서 흔히 사용되는 증강 기법은 그래프에 직접적인 대응이 존재하지 않는다. 본 연구는 반감독 학습 기반의 노드 분류 성능 향상을 목표로 그래프 신경망(GNNs)을 위한 그래프 데이터 증강을 탐구한다. 그래프 데이터 증강에 대한 실용적이고 이론적인 동기, 고려사항 및 전략을 논의한다. 본 연구는 신경망 기반의 엣지 예측기가 주어진 그래프 구조 내에서 클래스 내 동질성(클래스 호모필리) 구조를 효과적으로 인코딩함으로써 동일 클래스 내 엣지를 강화하고, 서로 다른 클래스 간 엣지를 약화시킬 수 있음을 보여준다. 본 연구의 주요 기여는 이러한 통찰을 바탕으로, 엣지 예측을 통해 GNN 기반의 노드 분류 성능을 향상시키는 GAug라는 그래프 데이터 증강 프레임워크를 제안하는 것이다. 다양한 벤치마크에서 실시한 광범위한 실험 결과는 GAug를 통한 증강이 다양한 GNN 아키텍처와 데이터셋에서 성능 향상을 가져옴을 입증한다.