7日前

無限推薦ネットワーク:データ中心型アプローチ

Noveen Sachdeva, Mehak Preet Dhaliwal, Carole-Jean Wu, Julian McAuley
無限推薦ネットワーク:データ中心型アプローチ
要約

我々は、無限に広いニューラルネットワークの学習と等価なニューラルタングェントカーネル(Neural Tangent Kernel, NTK)の性質を活用し、無限に広いボトルネック層を持つ自動符号化器(autoencoder)である $\infty$-AE を提案する。この手法により、単一のハイパーパラメータと閉形式解(closed-form solution)を持つ、表現力が高くかつ構造が単純な推薦モデルが実現される。$\infty$-AE のシンプルさを活かして、さらに極めて大規模かつスパースなユーザ-アイテム相互作用行列から最も重要な知識を効率的に抽出・凝縮する、小型かつ高忠実度のデータ要約を生成する手法「Distill-CF」も開発した。この要約は、モデル学習、推論、アーキテクチャ探索などの後続タスクにおいて、効率的かつ正確なデータ利用を可能にする。本研究は、学習アルゴリズムに依存せずに、ログされたユーザフィードバックデータの品質を向上させることを目指す「データ中心型」の推薦アプローチである。特に、データの不均一性、スパース性、準構造的特性を扱うために、微分可能なGumbelサンプリングの概念を活用し、数億単位のユーザ-アイテム相互作用を含む大規模データセットにもスケーラブルである。提案手法はそれぞれの最先端手法を大きく上回り、両者を組み合わせた場合、元のデータセットのわずか 0.1% のサイズで、フルデータセットにおける $\infty$-AE の性能の 96~105% を達成する。この結果から、次のような直感に反する問いが浮かび上がる:より多くのデータが必要なのだろうか?

無限推薦ネットワーク:データ中心型アプローチ | 最新論文 | HyperAI超神経