النمذجة التوليدية القائمة على الدرجات في الفضاء المخفي

أظهرت نماذج التوليد القائمة على التقييم (SGMs) مؤخرًا نتائج مبهرة من حيث جودة العينات وتغطية التوزيع. ومع ذلك، تُطبَّق عادةً مباشرة في فضاء البيانات، وغالبًا ما تتطلب آلاف التقييمات الشبكية لاستخلاص العينات. في هذا العمل، نقترح نموذج التوليد القائم على التقييم في الفضاء الخفي (LSGM)، وهي طريقة جديدة تدرب نماذج SGM في فضاء خفي، مستندة إلى إطار العمل الخاص بالمحول التلقائي التبايني (VAE). يُمكّن الانتقال من فضاء البيانات إلى فضاء الخفي من تدريب نماذج توليدية أكثر تعبيرًا، وتطبيق SGM على البيانات غير المستمرة، وتعلم نماذج SGM أكثر سلاسة في فضاء أصغر، مما يؤدي إلى تقليل عدد تقييمات الشبكة وتسريع عملية الاستخلاص. ولتمكين تدريب LSGM بشكل متكامل وقابل للتوسع وباستقرار، نُقدّم ما يلي: (أ) مُعرّف تقييم جديد مناسب لبيئة LSGM، (ب) مُعامِلة جديدة لدالة التقييم تسمح لنموذج SGM بالتركيز على الفجوة بين التوزيع المستهدف وتوزيع طبيعي بسيط، (ج) اشتقاق تحليلي لعدة تقنيات لتقليل التباين في دالة التدريب. حقق LSGM أفضل نتيجة ممكنة من حيث مؤشر FID بقيمة 2.10 على مجموعة CIFAR-10، متفوّقًا على جميع النتائج السابقة في هذا المعيار. وعلى مجموعة CelebA-HQ-256، يتساوى LSGM مع النماذج السابقة من حيث جودة العينات، لكنه يتفوّق عليها في وقت الاستخلاص بمقدار مرّتين من الدرجة التامة. وفي نمذجة الصور الثنائية، حقق LSGM أفضل أداء ممكن من حيث الاحتمالية على مجموعة OMNIGLOT الثنائية. يمكن الاطلاع على صفحة المشروع والكود عبر الرابط: https://nvlabs.github.io/LSGM.