Poincaré-Einbettungen für das Lernen hierarchischer Repräsentationen

Die Darstellungslernen (representation learning) sind zu einem unverzichtbaren Ansatz für das Lernen aus symbolischen Daten wie Text und Graphen geworden. Allerdings lernen die modernsten Methoden in der Regel Einbettungen (embeddings) in euklidischen Vektorräumen, die diese Eigenschaft nicht berücksichtigen, obwohl komplexe symbolische Datensätze oft eine latente hierarchische Struktur aufweisen. Zu diesem Zweck stellen wir einen neuen Ansatz vor, um hierarchische Darstellungen von symbolischen Daten durch ihre Einbettung in den hyperbolischen Raum – oder genauer gesagt in eine n-dimensionale Poincaré-Kugel – zu erlernen. Dank der zugrunde liegenden hyperbolischen Geometrie ermöglicht dies es uns, sparsame Darstellungen von symbolischen Daten zu erlernen, indem Hierarchie und Ähnlichkeit gleichzeitig erfasst werden. Wir führen einen effizienten Algorithmus zur Lernung der Einbettungen basierend auf riemannscher Optimierung ein und zeigen experimentell, dass Poincaré-Einbettungen bei Daten mit latenter Hierarchie sowohl hinsichtlich der Darstellungsfähigkeit als auch der Generalisierungsfähigkeit signifikant besser abschneiden als euklidische Einbettungen.