HyperAIHyperAI

Command Palette

Search for a command to run...

Ein Bild-Datensatz zum Benchmarking von Empfehlungssystemen mit rohen Pixeln

Yu Cheng Yunzhu Pan Jiaqi Zhang Yongxin Ni Aixin Sun Fajie Yuan

Zusammenfassung

Empfehlungssysteme (RS) haben durch die Nutzung expliziter Identifikationsmerkmale (ID) erheblichen Erfolg erzielt. Dennoch bleibt das volle Potenzial von Inhaltmerkmalen, insbesondere reiner Bildpixelmerkmale, bisher relativ unerschlossen. Die begrenzte Verfügbarkeit großer, vielfältiger und inhaltsorientierter Datensätze für Bildempfehlungen hat die Verwendung von Rohbildern als Item-Repräsentationen bisher erheblich eingeschränkt. In diesem Kontext präsentieren wir PixelRec, einen umfangreichen, bildzentrierten Empfehlungsdatensatz, der etwa 200 Millionen Benutzer-Bild-Interaktionen, 30 Millionen Nutzer und 400.000 hochwertige Cover-Bilder umfasst. Durch die direkte Bereitstellung von Rohbildpixeln ermöglicht PixelRec es Empfehlungsmodellen, Item-Repräsentationen direkt aus diesen Pixeln zu lernen. Um die Nutzbarkeit des Datensatzes zu demonstrieren, führen wir zunächst Ergebnisse mehrerer klassischer rein auf ID-basierter Baseline-Modelle, die wir IDNet nennen, vor, die auf PixelRec trainiert wurden. Anschließend zeigen wir die Wirksamkeit der Bildmerkmale des Datensatzes, indem wir die Item-ID-Embeddings (aus IDNet) durch einen leistungsstarken Vision-Encoder ersetzen, der Items mithilfe ihrer Rohbildpixel repräsentiert. Dieses neue Modell wird PixelNet genannt. Unsere Ergebnisse zeigen, dass PixelNet selbst in standardmäßigen, nicht-kalten-Start-Szenarien, in denen IDNet als äußerst effektiv gilt, bereits gleich gut oder sogar besser abschneidet als IDNet. Darüber hinaus weist PixelNet mehrere bemerkenswerte Vorteile gegenüber IDNet auf, etwa eine höhere Effektivität in Kaltstart- und Cross-Domain-Empfehlungsszenarien. Diese Ergebnisse unterstreichen die Bedeutung visueller Merkmale in PixelRec. Wir sind überzeugt, dass PixelRec eine entscheidende Ressource und Testumgebung für Forschung zu Empfehlungsmodellen darstellt, die auf Bildpixelinhalte setzen. Der Datensatz, der zugehörige Code und die Leaderboard werden unter https://github.com/westlake-repl/PixelRec verfügbar gemacht.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp