MaGNET: عينة موحدة من متعدّدات الشبكة التوليدية العميقة دون إعادة التدريب

تُستخدم الشبكات التوليدية العميقة (DGNs) على نطاق واسع في الشبكات التوليدية التنافسية (GANs) والآلات التوليدية التباينية (VAEs) ومتغيراتها لتقريب السطح البيانات والتوزيع. ومع ذلك، فإن عينات التدريب غالبًا ما تكون موزعة بشكل غير منتظم على هذا السطح نتيجة لتكاليف أو سهولة جمعها. على سبيل المثال، يحتوي مجموعة بيانات CelebA على نسبة كبيرة من الصور التي تُظهر ابتسامات. ستُعاد هذه التناقضات عند أخذ العينات من الشبكة التوليدية العميقة المدربة، وهو ما قد لا يكون مرغوبًا دائمًا، مثلًا في سياقات العدالة أو تكبير البيانات. وللرد على هذا التحدي، نُقدّم MaGNET، وهو عامل عينات جديد ومُستمد من أسس نظرية للمساحة المُخفية، يناسب أي شبكة توليدية عميقة مُدرّبة مسبقًا، ويُنتج عينات موزعة بشكل موحد على السطح المُتعلم. أجرينا سلسلة من التجارب على مجموعة متنوعة من المجموعات والشبكات التوليدية، مثل النموذج المتطور StyleGAN2 المدرب على مجموعة بيانات FFHQ، حيث أدى أخذ العينات المُتجانسة عبر MaGNET إلى زيادة دقة التوزيع والذكرى بنسبة 4.1% و3.0% على التوالي، وتقليل التحيز الجنسي بنسبة 41.2%، دون الحاجة إلى تسميات أو إعادة تدريب. وبما أن التوزيع المتجانس لا يعني بالضرورة توزيعًا متماثلًا من حيث المعنى، فقد قمنا أيضًا بدراسة منفصلة لفهم كيف تتغير الخصائص المعجمية للعينات المولّدة عند استخدام عينة MaGNET.