9일 전

伪装된 사기꾼에 대항하는 그래프 신경망 기반 사기 탐지기의 성능 향상

Yingtong Dou, Zhiwei Liu, Li Sun, Yutong Deng, Hao Peng, Philip S. Yu
伪装된 사기꾼에 대항하는 그래프 신경망 기반 사기 탐지기의 성능 향상
초록

최근 몇 년 동안 그래프 신경망(GNNs)은 사기 탐지 문제에 널리 적용되어, 다양한 관계를 통해 이웃 정보를 집계함으로써 노드의 이상 징후를 드러내는 데 성공하였다. 그러나 기존 연구들은 사기 행위자들이 보일 수 있는 은폐 행동(camouflage behavior)에 주목한 사례가 거의 없었으며, 이러한 은폐 행위는 GNN 기반 사기 탐지기의 집계 과정에서 성능 저하를 초래할 수 있다. 본 논문에서는 최근 실증 연구를 기반으로 두 가지 유형의 은폐 행동, 즉 특성 은폐(feature camouflage)와 관계 은폐(relation camouflage)를 제안한다. 기존의 GNN 모델들은 이러한 두 가지 은폐 행동을 고려하지 못해 사기 탐지 문제에서 낮은 성능을 보이고 있다. 이를 해결하기 위해 우리는 은폐 행동에 강건한 새로운 모델인 CAmouflage-REsistant GNN(CARE-GNN)을 제안한다. CARE-GNN은 은폐 행동에 대응하기 위한 세 가지 독특한 모듈을 통해 GNN의 집계 과정을 강화한다. 구체적으로, 먼저 정보가 풍부한 이웃 노드를 탐지하기 위해 레이블 인지(similarity measure) 기반의 유사도 측정 방법을 설계한다. 다음으로, 강화 학습(Reinforcement Learning, RL)을 활용하여 선택할 최적의 이웃 수를 탐색한다. 마지막으로, 다양한 관계에서 선택된 이웃 노드들을 통합하여 집계한다. 두 개의 실세계 사기 데이터셋을 대상으로 수행한 종합적인 실험을 통해 강화 학습 알고리즘의 효과를 입증하였다. 제안하는 CARE-GNN은 최신의 GNN 모델 및 GNN 기반 사기 탐지기보다 우수한 성능을 보였다. 또한, 모든 GNN 기반 사기 탐지 모델을 통합한 오픈소스 툴박스를 제공한다: https://github.com/safe-graph/DGFraud. CARE-GNN의 코드와 데이터셋은 다음과 같은 주소에서 공개되어 있다: https://github.com/YingtongDou/CARE-GNN.