تضمينات UMAP ذاتية المعلمات للتمثيل والتعلم شبه المراقب

UMAP هو خوارزمية تقليل الأبعاد المستندة إلى الرسوم البيانية وغير المعلمية، تستخدم الهندسة الريمانية التطبيقية والطوبولوجيا الجبرية للعثور على تمثيلات منخفضة الأبعاد للبيانات ذات الهيكل. تتكون خوارزمية UMAP من خطوتين: (1) حساب تمثيل رسومي لمجموعة البيانات (معقد سيمبليسي فاز)، و(2) تحسين تمثيل منخفض الأبعاد للرسم البياني من خلال تناقص التدرج العشوائي. في هذا العمل، نوسع الخطوة الثانية من UMAP لتشمل تحسينًا معلميًا عبر أوزان الشبكة العصبية، مما يُمكّن من تعلُّم علاقة معلمية بين البيانات والتمثيل. نُظهر أولًا أن UMAP المعلميّة تُنافس نسختها غير المعلمية من حيث الأداء، مع الحفاظ على فائدة التمثيل المعلمي المُتعلم (مثل إمكانية إنشاء تمثيلات سريعة في الوقت الفعلي للبيانات الجديدة). ثم نستكشف استخدام UMAP كوسيلة للتنظيم، من خلال تقييد التوزيع الخفي للـ autoencoders، وتمكين التحكم المعلمي في الحفاظ على البنية العالمية، وتحسين دقة التصنيف في التعلم شبه المُشرَّف من خلال استخلاص البنية من البيانات غير المصنفة. نسخة توضيحية على Google Colab: https://colab.research.google.com/drive/1WkXVZ5pnMrm17m0YgmtoNjM_XHdnE5Vp?usp=sharing