HyperAIHyperAI
vor 7 Tagen

Ein Bild-Datensatz zum Benchmarking von Empfehlungssystemen mit rohen Pixeln

Yu Cheng, Yunzhu Pan, Jiaqi Zhang, Yongxin Ni, Aixin Sun, Fajie Yuan
Ein Bild-Datensatz zum Benchmarking von Empfehlungssystemen mit rohen Pixeln
Abstract

Empfehlungssysteme (RS) haben durch die Nutzung expliziter Identifikationsmerkmale (ID) erheblichen Erfolg erzielt. Dennoch bleibt das volle Potenzial von Inhaltmerkmalen, insbesondere reiner Bildpixelmerkmale, bisher relativ unerschlossen. Die begrenzte Verfügbarkeit großer, vielfältiger und inhaltsorientierter Datensätze für Bildempfehlungen hat die Verwendung von Rohbildern als Item-Repräsentationen bisher erheblich eingeschränkt. In diesem Kontext präsentieren wir PixelRec, einen umfangreichen, bildzentrierten Empfehlungsdatensatz, der etwa 200 Millionen Benutzer-Bild-Interaktionen, 30 Millionen Nutzer und 400.000 hochwertige Cover-Bilder umfasst. Durch die direkte Bereitstellung von Rohbildpixeln ermöglicht PixelRec es Empfehlungsmodellen, Item-Repräsentationen direkt aus diesen Pixeln zu lernen. Um die Nutzbarkeit des Datensatzes zu demonstrieren, führen wir zunächst Ergebnisse mehrerer klassischer rein auf ID-basierter Baseline-Modelle, die wir IDNet nennen, vor, die auf PixelRec trainiert wurden. Anschließend zeigen wir die Wirksamkeit der Bildmerkmale des Datensatzes, indem wir die Item-ID-Embeddings (aus IDNet) durch einen leistungsstarken Vision-Encoder ersetzen, der Items mithilfe ihrer Rohbildpixel repräsentiert. Dieses neue Modell wird PixelNet genannt. Unsere Ergebnisse zeigen, dass PixelNet selbst in standardmäßigen, nicht-kalten-Start-Szenarien, in denen IDNet als äußerst effektiv gilt, bereits gleich gut oder sogar besser abschneidet als IDNet. Darüber hinaus weist PixelNet mehrere bemerkenswerte Vorteile gegenüber IDNet auf, etwa eine höhere Effektivität in Kaltstart- und Cross-Domain-Empfehlungsszenarien. Diese Ergebnisse unterstreichen die Bedeutung visueller Merkmale in PixelRec. Wir sind überzeugt, dass PixelRec eine entscheidende Ressource und Testumgebung für Forschung zu Empfehlungsmodellen darstellt, die auf Bildpixelinhalte setzen. Der Datensatz, der zugehörige Code und die Leaderboard werden unter https://github.com/westlake-repl/PixelRec verfügbar gemacht.

Ein Bild-Datensatz zum Benchmarking von Empfehlungssystemen mit rohen Pixeln | Neueste Forschungsarbeiten | HyperAI