Leichtgewichtige Repräsentationslernverfahren für effiziente und skalierbare Empfehlungen

In den vergangenen Jahrzehnten ist die Empfehlung zu einer zentralen Komponente vieler Online-Dienste geworden, wie beispielsweise Medien-Streaming-Plattformen und E-Commerce-Systeme. Fortschritte in Algorithmen, Evaluierungsmethoden und Datensätzen haben zu kontinuierlichen Verbesserungen des Standes der Technik geführt. Dennoch bleibt noch erheblicher Forschungsbedarf bestehen, um diese Methoden auf die Skalierung des Internets auszudehnen.Online-Werbung bietet ein einzigartiges Testfeld für Empfehlungssysteme in großem Maßstab. Jeden Tag interagieren Milliarden von Nutzern in Echtzeit mit Millionen von Produkten. Systeme, die diese Anforderungen erfüllen müssen, müssen zuverlässig in großem Umfang funktionieren. Wir stellen ein effizientes Modell (LED, für Lightweight Encoder-Decoder) vor, das eine neue Balance zwischen Komplexität, Skalierbarkeit und Leistung erreicht. Insbesondere zeigen wir, dass die Kombination von großflächiger Matrixfaktorisierung mit leichtgewichtiger Embedding-Feinabstimmung eine state-of-the-art-Leistung in großem Maßstab ermöglicht. Zudem geben wir eine detaillierte Beschreibung einer Systemarchitektur an und demonstrieren deren Betrieb über einen Zeitraum von zwei Monaten im Maßstab des Internets. Unser Entwurf ermöglicht es, Milliarden von Nutzern über Hunderte von Millionen von Produkten innerhalb weniger Millisekunden mit standardmäßiger Hardware zu bedienen.