要約
推薦システム分野において、浅層オートエンコーダーは最近、注目を集めている。その中でも特に評価の高い浅層オートエンコーダーとして、EASEが挙げられる。EASEは、高い推薦精度を実現しつつも、構造が単純である点が特徴であり、広く好まれている。しかし、EASEは時間的および特にメモリ上のスケーラビリティに劣るという問題があり、アイテム数が膨大な生産環境での利用を著しく制限している。本論文では、EASEで用いられるデータ・グラム行列(data-Gram matrix)のスパース近似逆行列化に対する、極めて効率的な因子分解技術を提案する。この技術により得られるオートエンコーダーであるSANSAは、エンドツーエンドでスパースな解法であり、事前に指定可能な密度と、ほぼ任意に低コストのメモリ使用量を実現する——学習時にも同様に効果を発揮する。この特性により、SANSAはEASEの概念を数百万アイテム乃至それ以上の規模に容易にスケーリング可能にする。