
초록
노드 분류기는 산업 현장에서 예측 오류, 학습 자원, 추론 지연을 종합적으로 최소화할 수 있어야 한다. 그러나 대부분의 그래프 신경망(GNN)은 이 세 가지 요소 중 하나 또는 두 가지에만 집중하고 있다. 결과적으로 이로 인해 성능이 저하되는 부분이 전체 시스템의 최소한의 제약 요소가 되어 산업 수준의 과제에 대한 실용적 적용을 저해하고 있다. 본 연구에서는 이러한 세 가지 문제를 동시에 해결할 수 있는 새로운 반감독 학습 방법인 그래프 엔트로피 최소화(Graph Entropy Minimization, GEM)를 제안한다. GEM은 수많은 분류되지 않은 노드로부터의 1호프(aggregation) 정보를 효과적으로 활용함으로써, 2단계 이상의 메시지 전달을 수행하는 GNN과 비견되는 예측 정확도를 달성한다. 또한, 독립적인 엣지 샘플의 미니배치를 기반으로 확률적 학습을 지원할 수 있도록 분해 가능하여 매우 빠른 샘플링과 자원 절약형 학습이 가능하다. 추론 시에는 깊은 GNN보다 빠른 1호프 집계 방식을 채택하고, 온라인 지식 증류(online knowledge distillation)를 통해 비호프(non-hop) 분류기로 변환함으로써 극도로 빠른 처리가 가능해진다. 따라서 GEM은 자원 제약 환경에서 동작하는 지연 시간에 민감한 고정밀도 서비스에 매우 적합한 솔루션이 될 수 있다. 코드는 https://github.com/cf020031308/GEM 에서 제공된다.