Halbüberwachte Kreditkartenbetrugsdetektion durch attributgesteuerte Graphendarstellung

Kreditkartenbetrug verursacht erhebliche Kosten sowohl für Karteninhaber als auch für ausgebende Banken. Moderne Methoden verwenden maschinelles Lernen zur Klassifizierung, um betrügerisches Verhalten anhand gekennzeichneter Transaktionsdatensätze zu erkennen. Allerdings stellen gekennzeichnete Daten in der Regel nur einen kleinen Teil von Milliarden echter Transaktionen dar, aufgrund der hohen Kennzeichnungskosten. Dies bedeutet, dass sie viele natürliche Merkmale aus ungekennzeichneten Daten nicht optimal nutzen. Daher schlagen wir ein semisupervisiertes Graph-Neurales Netzwerk (Graph Neural Network) für die Betrugserkennung vor. Insbesondere nutzen wir Transaktionsdatensätze, um einen zeitlichen Transaktionsgraphen zu konstruieren, der aus zeitlichen Transaktionen (Knoten) und den Interaktionen (Kanten) zwischen ihnen besteht. Anschließend übertragen wir Nachrichten zwischen den Knoten durch ein Gated Temporal Attention Network (GTAN), um die Transaktionsrepräsentation zu lernen. Wir modellieren zudem die Betrugsstrategien durch Risikoverbreitung unter den Transaktionen. Ausführliche Experimente wurden an einem realweltlichen Transaktionsdatensatz sowie an zwei öffentlich zugänglichen Betrugserkennungsdatensätzen durchgeführt. Die Ergebnisse zeigen, dass unser vorgeschlagener Ansatz, das GTAN, in drei Betrugserkennungsdatensätzen anderen state-of-the-art-Verfahren überlegen ist. Semisupervisierte Experimente belegen die ausgezeichnete Betrugserkennungsleistung unseres Modells, selbst bei nur einem sehr geringen Anteil an gekennzeichneten Daten.