TF4CTR: Twin Focus Framework zur CTR-Vorhersage durch adaptive Stichprobenunterscheidung

Die effektive Modellierung von Merkmalsinteraktionen ist entscheidend für die Verbesserung der Genauigkeit der Klick-Through-Rate (CTR)-Prognose in industriellen Empfehlungssystemen. Die meisten aktuellen tiefen CTR-Modelle setzen auf komplizierte Netzwerkarchitekturen, um komplexe Merkmalsinteraktionen oder Nutzerverhalten besser zu erfassen. Wir identifizieren jedoch zwei Einschränkungen dieser Ansätze: (1) Die dem Modell vorgegebenen Trainingsbeispiele sind ununterschieden, was dazu führen kann, dass das Modell ein größeres Maß an einfachen Beispielen einseitig lernt, während eine geringere Anzahl schwerer Beispiele vernachlässigt wird, was die Generalisierungsfähigkeit des Modells beeinträchtigt; (2) Unterschiedlich konzipierte Merkmalsinteraktions-Encoder sollen unterschiedliche Interaktionsinformationen erfassen, erhalten jedoch konsistente Überwachungssignale, was deren Effektivität einschränkt. Um diese Lücken zu schließen, führt dieser Artikel einen neuen CTR-Prognoserahmen ein, der die plug-and-play Twin Focus (TF) Loss, das Sample Selection Embedding Module (SSEM) und das Dynamic Fusion Module (DFM) integriert und als Twin Focus Framework for CTR (TF4CTR) bezeichnet wird. Konkret verwendet der Rahmen das SSEM am unteren Ende des Modells, um Unterschiede zwischen den Beispielen zu erkennen und jedem Beispiel einen geeigneteren Encoder zuzuweisen. Gleichzeitig liefert die TF Loss maßgeschneiderte Überwachungssignale sowohl für einfache als auch für komplexe Encoder. Darüber hinaus fusioniert das DFM dynamisch die von den Encodern erfassten Merkmalsinteraktionsinformationen, wodurch präzisere Vorhersagen ermöglicht werden. Experimente an fünf realen Datensätzen bestätigen die Wirksamkeit und Kompatibilität des Rahmens und zeigen, dass er verschiedene repräsentative Baseline-Modelle auf modellunabhängige Weise verbessern kann. Um reproduzierbare Forschung zu fördern, werden der Open-Source-Code und detaillierte Ausführungsprotokolle unter folgender URL bereitgestellt: https://github.com/salmon1802/TF4CTR.