摘要
在推荐系统领域,浅层自编码器近年来受到广泛关注。其中,EASE 是最受推崇的浅层自编码器之一,因其在推荐准确率方面表现优异,同时具备结构简洁的优点而备受青睐。然而,EASE 在时间复杂度和尤其是内存占用方面的可扩展性较差,严重限制了其在包含海量物品的生产环境中的应用。本文提出了一种高效因子分解技术,用于稀疏近似求解 EASE 所依赖的数据 Gram 矩阵的逆。由此构建的自编码器 SANSA 是一种端到端的稀疏化解决方案,其稀疏度可预先设定,且内存需求几乎可忽略不计——即使在训练阶段亦然。因此,SANSA 使得 EASE 的核心思想得以轻松扩展至数百万乃至更多物品的规模。