SimpleX: Ein einfacher und starker Baseline für Collaborative Filtering

Kollaboratives Filtern (CF) ist ein weitgehend untersuchtes Forschungsthema in Empfehlungssystemen. Die Lernprozesse eines CF-Modells hängen im Allgemeinen von drei zentralen Komponenten ab: Interaktions-Encoder, Verlustfunktion und negatives Sampling. Während zahlreiche bestehende Studien sich auf die Entwicklung leistungsfähigerer Interaktions-Encoder konzentrieren, wurden die Auswirkungen von Verlustfunktionen und negativen Sampling-Ratios bisher noch nicht ausreichend erforscht. In dieser Arbeit zeigen wir, dass die Wahl der Verlustfunktion sowie der negative Sampling-Ratio gleichwertig wichtig ist. Genauer gesagt, schlagen wir die kosinusschließende Verlustfunktion (CCL) vor und integrieren sie in ein einfaches, einheitliches CF-Modell, das als SimpleX bezeichnet wird. Umfassende Experimente wurden auf 11 Benchmark-Datensätzen durchgeführt und mit insgesamt 29 bestehenden CF-Modellen verglichen. Überraschenderweise zeigt sich, dass SimpleX unter Verwendung unserer CCL-Verlustfunktion und einer hohen negativen Sampling-Ratio die meisten komplexen State-of-the-Art-Modelle deutlich übertrifft (z. B. bis zu 48,5 % Verbesserung im NDCG@20 gegenüber LightGCN). Wir sind überzeugt, dass SimpleX nicht nur als einfacher, starker Baseline-Modell zur Förderung zukünftiger Forschung im Bereich CF dienen kann, sondern auch neue Impulse für die Entwicklung von Verlustfunktionen und negativen Sampling-Strategien eröffnet. Der Quellcode wird unter https://reczoo.github.io/SimpleX verfügbar sein.