HyperAIHyperAI

Command Palette

Search for a command to run...

DLME: تضمين متعدّد الأبعاد للمنطقة المحلية المسطحة

Zelin Zang Siyuan Li Di Wu Ge Wang Lei Shang Baigui Sun Hao Li Stan Z. Li

الملخص

تهدف التعلم المتعدد (ML) إلى استخلاص تمثيل ثنائي الأبعاد من البيانات عالية الأبعاد. وتشكل هذه المشكلة تحديًا كبيرًا عند تطبيقها على مجموعات بيانات واقعية، خاصةً في حالات البيانات غير الكافية (under-sampling)، حيث نلاحظ أن الطرق السابقة تؤدي أداءً ضعيفًا في هذه الحالة. بشكل عام، تقوم طرق ML أولاً بتحويل البيانات المدخلة إلى فضاء تمثيل ثنائي الأبعاد، بهدف الحفاظ على البنية الهندسية للبيانات، ثم تُنفَّذ المهام التالية (downstream tasks) داخل هذا الفضاء. لكن ضعف الاتصال المحلي للبيانات غير الكافية في الخطوة الأولى، وغياب التوافق في دوال التحسين في الخطوة الثانية، يؤديان إلى مشكلتين رئيسيتين: تشويه البنية (structural distortion) وتمثيل غير محدد كافيًا (underconstrained embedding). تقدم هذه الورقة إطارًا جديدًا لـ ML يُسمى التمثيل المتعدد العميق للمسطحة المحلية (Deep Local-flatness Manifold Embedding - DLME)، بهدف معالجة هذه المشكلات. يُنشئ DLME سطوحًا معنوية (semantic manifolds) من خلال تعزيز البيانات (data augmentation)، ويُعالِج مشكلة تشويه البنية باستخدام قيد نعومة (smoothness constraint) مبني على افتراض مسطحية محلية (local flatness assumption) للسطح. ولحل مشكلة التمثيل غير المحدد، تم تصميم دالة خسارة جديدة، وتم إثبات نظريًا أن هذه الدالة تؤدي إلى تمثيل أكثر ملاءمة استنادًا إلى مبدأ المسطحية المحلية. أظهرت التجارب على ثلاث أنواع من مجموعات البيانات (التجريبية، البيولوجية، والصور) وفي مهام تالية متنوعة (التصنيف، التجميع، والتصور) أن DLME المقترح يتفوق على أحدث الطرق في التعلم المتعدد والتعلم المقارن (contrastive learning).


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp