HyperAIHyperAI
منذ 15 أيام

كليورا: نظام تضمين رسم بياني بسيط وقوي وقابل للتوسع

Barbara Rychalska, Piotr Bąbel, Konrad Gołuchowski, Andrzej Michałowski, Jacek Dąbrowski
كليورا: نظام تضمين رسم بياني بسيط وقوي وقابل للتوسع
الملخص

تُهيمن حاليًا طرق تمثيل الرسوم البيانية (graph embeddings) على نحوٍ كبير بأساليب التعلم التمييزي (contrastive learning)، التي تتطلب صياغة دالة هدف صريحة وعينة من الأمثلة الموجبة والسالبة. وهذا يُحدث عبئًا مفاهيميًا وحسابيًا. أما الأساليب البسيطة والكلاسيكية غير المراقبة مثل التوسيع متعدد الأبعاد (Multidimensional Scaling - MDS) أو خريطة القيم الذاتية لللافلاتشيان (Laplacian eigenmap)، فهي تتجاوز الحاجة إلى تحسين دالة الهدف المُرهقة، وتستغل مباشرةً البنية الهندسية للبيانات. لكن للأسف، تعتمد هذه الأساليب على عمليات مكلفة جدًا مثل تحليل القيم الذاتية للمصفوفات، ما يجعلها غير قادرة على التوسع لمعالجة الرسوم البيانية الكبيرة التي أصبحت شائعة في العالم الرقمي الحديث. في هذا البحث، نقدّم خوارزمية Cleora، التي تجمع بين أفضل ما في العالمين: فهي غير مراقبة وقابلة للتوسع بشكل كبير. نُظهر أن تمثيلات عالية الجودة يمكن إنتاجها دون الحاجة إلى الإطار التدريجي الشائع للتعلم مع أخذ العينات من الأمثلة. وتحقيقًا لهدف تعلّم مُفهوم وواضح، فإن الخوارزمية تُعدّ أن العقدة يجب أن تكون مشابهة لجيرانها، دون الحاجة صراحةً إلى دفع العقد غير المتصلة بعيدًا عن بعضها. يتم تحقيق هذا الهدف من خلال عملية تكرارية لحساب المتوسط المرجح لتمثيلات الجيران، تليها عملية تطبيع عبر الأبعاد. وبفضل عملية المتوسط، تتمكّن الخوارزمية من التقدم السريع عبر فضاء التمثيل، وغالبًا ما تصل إلى تمثيلات مثلى في عدد قليل جدًا من التكرارات. وتُعدّ Cleora أسرع من غيرها من الخوارزميات الرائدة على المعالج المركزي (CPU)، وتكسب تمثيلات ذات جودة تنافسية عند قياسها على المهام التطبيقية مثل التنبؤ بالروابط وتصنيف العقد. ونُظهر أن Cleora تتعلم تبسيطًا للبيانات يشبه ما تحققه الطرق التمييزية، لكن بتكلفة حسابية أقل بكثير. وقد أطلقنا Cleora مفتوحة المصدر تحت ترخيص MIT، مما يسمح باستخدامها تجاريًا عبر الرابط: https://github.com/Synerise/cleora.

كليورا: نظام تضمين رسم بياني بسيط وقوي وقابل للتوسع | أحدث الأوراق البحثية | HyperAI