Zu tieferen, leichteren und interpretierbaren Kreuznetzwerken für die CTR-Vorhersage

Die Vorhersage der Klickrate (Click-Through Rate, CTR) spielt eine entscheidende Rolle in Empfehlungssystemen und Online-Werbung. Es ist von entscheidender Bedeutung, Merkmalsinteraktionen effektiv zu modellieren, um die Vorhersageleistung von CTR-Modellen zu verbessern. Bestehende Ansätze stoßen jedoch auf drei erhebliche Herausforderungen. Erstens können zwar die meisten Methoden hochordentliche Merkmalsinteraktionen automatisch erfassen, doch ihre Leistung neigt mit steigender Ordnung der Interaktionen ab. Zweitens fehlen den meisten Ansätzen die Fähigkeit, die Vorhersageergebnisse überzeugend zu interpretieren, insbesondere bei hochordentlichen Interaktionen, was die Vertrauenswürdigkeit der Vorhersagen einschränkt. Drittens leiden viele Methoden unter redundanten Parametern, insbesondere in der Embedding-Schicht. In dieser Arbeit stellen wir eine neue Methode namens Gated Deep Cross Network (GDCN) sowie einen Ansatz zur feldweisen Dimensionsoptimierung (Field-level Dimension Optimization, FDO) vor, um diese Herausforderungen zu bewältigen. Als zentrale Struktur von GDCN ermöglicht die Gated Cross Network (GCN) die explizite Erfassung hochordentlicher Merkmalsinteraktionen und filtert dynamisch wichtige Interaktionen mittels eines Informationsgates in jeder Ordnung. Zusätzlich nutzen wir den FDO-Ansatz, um kompakte Dimensionen für jedes Merkmalsfeld auf Basis ihrer Relevanz zu lernen. Umfassende Experimente an fünf Datensätzen belegen die Wirksamkeit, Überlegenheit und Interpretierbarkeit von GDCN. Zudem bestätigen wir die Effektivität von FDO bei der Lernung verschiedener Dimensionen und der Reduktion der Modellparameter. Der Quellcode ist unter \url{https://github.com/anonctr/GDCN} verfügbar.