11일 전
TREE-G: 결정 트리가 그래프 신경망에 도전하다
Maya Bechler-Speicher, Amir Globerson, Ran Gilad-Bachrach

초록
표현형 데이터를 다룰 때, 결정 트리 기반 모델은 높은 정확도, 적용의 용이성, 해석 가능성 등의 장점으로 인해 널리 선호된다. 그러나 그래프 구조화된 데이터의 경우, 정점에 존재하는 표현형 데이터와 그래프의 위상적 정보를 효과적으로 통합하는 방식으로 이러한 모델을 적용하는 방법이 명확하지 않다. 이 도전 과제를 해결하기 위해 우리는 TREE-G를 제안한다. TREE-G는 표준 결정 트리를 개선한 모델로, 그래프 데이터에 특화된 새로운 분할 함수를 도입한다. 이 분할 함수는 노드 특성과 위상적 정보를 모두 반영할 뿐만 아니라, 이전 분할 과정에서 계산된 정보를 사용할 수 있도록 하는 혁신적인 포인터 메커니즘을 활용한다. 결과적으로 분할 함수는 예측 과제와 주어진 그래프에 자동으로 적응한다. 우리는 TREE-G의 이론적 성질을 분석하고, 다양한 그래프 및 정점 예측 벤치마크에서 그 실용적 이점을 실험적으로 입증한다. 실험 결과, TREE-G는 다른 결정 트리 기반 모델을 일관되게 상회하며, 때로는 그래프 신경망(GNNs)이나 그래프 커널과 같은 다른 그래프 학습 알고리즘보다도 크게 우수한 성능을 보였다. 또한 TREE-G 모델과 그 예측 결과는 해석 가능하고 시각화가 가능하다.