カムフラージュされた不正利用者に対するグラフニューラルネットワークベースの不正検出器の強化

近年、グラフニューラルネットワーク(GNN)は不正検出問題に広く応用されており、異なる関係性を介して隣接ノード情報の集約を通じてノードの不審性を明らかにしてきた。しかし、これまでの多くの研究では、不正行為者が行う「隠蔽行動(camouflage)」に注目しておらず、この行動がGNNベースの検出器における情報集約プロセスにおいて性能を低下させる要因となっていることが指摘されていない。本論文では、最近の実証的研究に基づき、2種類の隠蔽行動——「特徴隠蔽(feature camouflage)」と「関係隠蔽(relation camouflage)」——を導入する。既存のGNNモデルはこれら2つの隠蔽行動に対処できていないため、不正検出の場面では性能が不十分である。これに対して、本研究では、隠蔽行動に強いGNNの集約プロセスを強化するため、3つの独自モジュールを備えた新しいモデル「CAmouflage-REsistant GNN(CARE-GNN)」を提案する。具体的には、まず、ラベルに依存した類似度測度を設計し、有益な隣接ノードを同定する。次に、強化学習(RL)を用いて、選択すべき最適な隣接ノード数を探索する。最後に、異なる関係性に跨る選択されたノードを統合して集約する。2つの実世界の不正データセットを用いた包括的な実験により、RLアルゴリズムの有効性が実証された。提案するCARE-GNNは、最先端のGNNおよびGNNベースの不正検出手法を上回る性能を示した。また、すべてのGNNベースの不正検出手法を統合したオープンソースツールキットを公開している:https://github.com/safe-graph/DGFraud。CARE-GNNのコードおよびデータセットは、https://github.com/YingtongDou/CARE-GNN にて公開されている。