HyperAIHyperAI
منذ شهر واحد

شبكة التجزئة الخفية: مبدأ موحد للنمذجة التوليدية وتعلم التمثيل والتصنيف

Zinan Lin, Enshu Liu, Xuefei Ning, Junyi Zhu, Wenyu Wang, Sergey Yekhanin
شبكة التجزئة الخفية: مبدأ موحد للنمذجة التوليدية وتعلم التمثيل والتصنيف
الملخص

النمذجة التوليدية وتعلُّم التمثيل والتصنيف هما ثلاث مشكلات أساسية في التعلم الآلي (ML)، ومع ذلك، تظل الحلول المتطورة حاليًا (SoTA) لهذه المشكلات منفصلة إلى حد كبير. في هذه الورقة، نطرح السؤال التالي: هل يمكن أن يُطبَّق مبدأ موحد لحل جميع هذه المشكلات الثلاثة؟ إن تحقيق هذا التوحيد قد يُبسط أنظمة التعلم الآلي ويعزز التآزر الأكبر بين المهام المختلفة. ولتحقيق هذا الهدف، نقدّم شبكة التجزئة الخفية (Latent Zoning Network - LZN) كخطوة أولى نحو هذا الهدف. في جوهرها، تقوم LZN بإنشاء فضاء خفي غاوسي مشترك يُشغّل معلومات متعددة عبر جميع المهام. ويُزوَّد كل نوع من البيانات (مثل الصور، النصوص، التصنيفات) بمحوّل (encoder) يُرَتِّب العينات في مناطق خفية منفصلة، وبمُنقِل (decoder) يحوّل القيم الخفية إلى بيانات أصلية. وتعبر المهام في التعلم الآلي عن طريق تركيبات من هذه المحولات والمنقِلات: على سبيل المثال، يتم استخدام محوّل التصنيف مع مُنقِل الصور في توليد صور شرطيّة بالتصنيف؛ بينما يُستخدم محوّل الصور في تمثيل الصور؛ ويُستخدم محوّل الصور مع مُنقِل التصنيفات في التصنيف. نُظهِر إمكانات LZN في ثلاث سيناريوهات متزايدة التعقيد: (1) يمكن لـ LZN تحسين النماذج الحالية (توليد الصور): عند دمجها مع نموذج SoTA المعروف بـ Rectified Flow، تُحسِّن LZN مؤشر FID على مجموعة بيانات CIFAR10 من 2.76 إلى 2.59، دون الحاجة إلى تعديل دالة التدريب. (2) يمكن لـ LZN حل المهام بشكل مستقل (تعلُّم التمثيل غير المراقب): تُحقِّق LZN تعلُّم التمثيل غير المراقب دون الحاجة إلى دوال مساعدة، وتتفوّق على النموذجين الرائدين MoCo وSimCLR بنسبة 9.3% و0.2% على التوالي في المهام التصنيفية الخطية اللاحقة على مجموعة ImageNet. (3) يمكن لـ LZN حل مهام متعددة في آنٍ واحد (توليد وتصنيف مشترك): وباستخدام محوّلات ومقنِلات للصور والتصنيفات، تُنفَّذ LZN كلا المهمتين معًا بشكل مصمم مسبقًا، مما يُحسِّن مؤشر FID ويُحقِّق أفضل أداء (SoTA) في التصنيف على CIFAR10. يمكن الاطلاع على الكود والنماذج المدربة عبر الرابط: https://github.com/microsoft/latent-zoning-networks. كما يُمكن زيارة الموقع الرسمي للمشروع عبر: https://zinanlin.me/blogs/latent_zoning_networks.html.