التمثيلات الهرمية لتعلم الانغماسات البوانكارية

لقد أصبحت تعلم التمثيلات (representation learning) طريقة لا غنى عنها في استخراج المعرفة من البيانات الرمزية مثل النصوص والرسوم البيانية. ومع ذلك، بينما غالباً ما تظهر البيانات الرمزية المعقدة بنية هرمية مخفية، فإن الطرق المتقدمة عادةً ما تتعلم التضمينات (embeddings) في فضاءات متجه أقليدية (Euclidean vector spaces)، والتي لا تأخذ هذه الخاصية بعين الاعتبار. لهذا الغرض، نقدم نهجًا جديدًا لتعلم التمثيلات الهرمية للبيانات الرمزية من خلال تضمينها في الفضاء الزائدي (hyperbolic space) - أو بشكل أكثر دقة داخل كرة بوينكاريه ذات الأبعاد الن (n-dimensional Poincaré ball). بفضل الهندسة الزائدية الكامنة، يتيح هذا لنا تعلم تمثيلات مقتضبة للبيانات الرمزية من خلال التقاط الهرمية والتشابه في آن واحد. نقدم خوارزمية فعالة لتعلم التضمينات تستند إلى الأمثلة الريمانية (Riemannian optimization)، ونثبت تجريبيًا أن التضمينات البوينكاريه (Poincaré embeddings) تتفوق بشكل كبير على التضمينات الأقليدية (Euclidean embeddings) في البيانات ذات البنيات الهرمية المخفية، سواء من حيث قدرة التمثيل أو من حيث قدرة التعميم.