Shangyuan Tong Nanye Ma Saining Xie Tommi Jaakkola

الملخص
تحقيق النماذج التدفقية الحديثة أعلى جودة، لكنها تتطلب عينة تكرارية بطيئة. ولتسريع هذه العملية، يمكن استخلاص خريطة التدفق من نماذج معلمة مسبقًا (المعلّمين)، وهي عملية كانت تقليديًا تعتمد على أخذ عينات من مجموعة بيانات خارجية. نحن نرى أن هذا الاعتماد على البيانات يُشكل خطرًا جوهريًا يُعرف بـ "عدم التوافق بين المعلم والبيانات"، إذ قد تقدم مجموعة بيانات ثابتة تمثيلًا غير كامل أو حتى غير متوافق مع القدرات الإنشائية الكاملة للمعلم. هذا يدفعنا إلى التساؤل عما إذا كان هذا الاعتماد على البيانات ضروريًا حقًا لتحقيق نجاح استخلاص خريطة التدفق. في هذا العمل، نستكشف بديلًا خالياً من البيانات، حيث يتم أخذ العينات فقط من التوزيع الأولي، وهو توزيع يُضمن أن يتبعه المعلم بناءً على تصميمه، وبالتالي نتجنب تمامًا خطر عدم التوافق. ولإثبات الجدوى العملية لهذا المفهوم، نقدم إطارًا منهجيًا يتعلم توقع مسار العينة الخاص بالمعلم، مع تصحيح نشط للأخطاء المتراكمة الخاصة به، لضمان دقة عالية. يتفوق نهجنا على جميع النماذج المعتمدة على البيانات، ويحقق حالة جديدة من التميز بفارق كبير. بشكل خاص، عند استخلاص خريطة التدفق من نموذج SiT-XL/2+REPA، يصل أداء طريقة لدينا إلى مؤشر FID مذهل قدره 1.45 على ImageNet بحجم 256×256، و1.49 على ImageNet بحجم 512×512، وكل ذلك باستخدام خطوة عينة واحدة فقط. نأمل أن يُسهم عملنا في إرساء منهج أكثر متانة لتسريع النماذج الإنشائية، ويشجع على الاعتماد الأوسع على تقنية استخلاص خريطة التدفق دون الحاجة إلى بيانات.
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.