GALA: 그래프 확산 기반 정렬과 조각 퍼즐을 활용한 소스 없는 도메인 적응

소스 없는 도메인 적응은 실제 세계에서 특히 데이터 프라이버시 측면에서 많은 응용 분야를 가지고 있어 중요한 머신 러닝 주제입니다. 기존 접근 방식은 이미지와 비디오와 같은 유클리드 데이터에 주로 초점을 맞추고 있으며, 비유클리드 그래프 데이터에 대한 탐구는 아직 부족한 상태입니다. 최근의 그래프 신경망(GNN) 접근 방식은 소스 없는 적응 시나리오에서 도메인 이동과 라벨 부족으로 인해 성능이 크게 저하될 수 있습니다. 본 연구에서는 소스 없는 그래프 도메인 적응을 위해 특화된 새로운 방법인 '그래프 확산 기반 정렬과 자이그소브(Graph Diffusion-based Alignment with Jigsaw, GALA)'를 제안합니다. 도메인 정렬을 달성하기 위해 GALA는 대상 데이터로부터 소스 스타일의 그래프를 재구성하는 그래프 확산 모델을 사용합니다. 구체적으로, 소스 그래프를 사용하여 생성적인 소스 스타일을 학습하도록 점수 기반 그래프 확산 모델을 훈련시킵니다. 그런 다음, 사전 분포에서 샘플링하는 대신 확률 미분 방정식을 통해 대상 그래프에 섭동을 도입하고, 역 과정을 거쳐 소스 스타일의 그래프를 재구성합니다. 우리는 이러한 소스 스타일의 그래프를 사전 훈련된 GNN에 입력하고, 커리큘럼 학습을 활용하여 클래스별 임계값을 도입함으로써 대상 그래프에 대해 정확하고 편향되지 않은 가짜 라벨(pseudo-labels)을 생성할 수 있습니다. 또한, 일반화 능력과 강건성을 일관성 학습(consistency learning)을 통해 향상시키기 위해 자신감 있는 그래프와 그렇지 않은 그래프를 결합하는 간단하면서도 효과적인 전략인 '그래프 자이그소브(graph jigsaw)'를 개발하였습니다. 벤치마크 데이터셋에 대한 광범위한 실험 결과가 GALA의 효과성을 검증해주고 있습니다.