9 天前

零样本推荐即语言建模

Damien Sileo, Wout Vossen, Robbe Raymaekers
零样本推荐即语言建模
摘要

推荐任务旨在根据个体用户的需求对项目(如电影或商品)进行排序。当前的推荐系统主要依赖于协同过滤和基于内容的技术,这两类方法均需依赖结构化训练数据。本文提出一种基于现成预训练语言模型(Language Model, LM)的推荐框架,该框架仅使用非结构化文本语料库作为训练数据。例如,若用户 $u$ 喜欢《黑客帝国》(Matrix)和《盗梦空间》(Inception),我们可构造一个文本提示,如“类似《黑客帝国》《盗梦空间》的电影:${<}m{>}$”,并利用语言模型对 $u$ 与项目 $m$ 之间的偏好相似度进行估计,方法是计算该提示下 $m$ 的语言模型似然值。我们通过语料库分析为该方法提供动机支持,评估了多种提示结构的性能,并将基于语言模型的推荐方法与在不同数据条件下训练的标准矩阵分解方法进行了对比。相关实验代码已公开发布(https://colab.research.google.com/drive/1f1mlZ-FGaLGdo5rPzxf3vemKllbh2esT?usp=sharing)。