
要約
表現学習は、テキストやグラフなどの記号データから学習するための極めて重要な手法となっています。しかし、複雑な記号データセットにはしばしば潜在的な階層構造が見られますが、最先端の手法は通常、ユークリッドベクトル空間での埋め込みを学習し、この特性を考慮していません。そこで、本研究では記号データの階層表現を学習する新しいアプローチとして、これらのデータを双曲空間(より正確にはn次元ポアンカレ円板)に埋め込む方法を提案します。双曲幾何学に基づくこの手法により、階層と類似性を同時に捉える効率的な記号データの表現を学習することが可能となります。私たちはリーマン最適化に基づいた埋め込みを学習する効率的なアルゴリズムを導入し、実験的にポアンカレ埋め込みが潜在的な階層を持つデータにおいて、表現能力および汎化能力の両面でユークリッド埋め込みを大幅に上回ることを示しています。