Command Palette
Search for a command to run...
مزيج من الخبراء العالميين والمحليين مع محول التفتيت لإنشاء وجوه قابلة للتحكم
Xuechao Zou Shun Zhang Xing Fu Yue Li Kai Li Yushe Cao Congyan Lang Pin Tao Junliang Xing

الملخص
تُشكّل إنشاء الوجه القابل للتحكم تحديات جوهرية في النمذجة التوليدية نظرًا للاتزان المعقد المطلوب بين التحكم في المعاني (السمantics) والواقعية الضوئية (photorealism). في حين يعاني النهج الحالية من صعوبة فصل التحكم في المعاني عن مسارات الإنشاء، نعيد النظر في الإمكانات المعمارية لمحولات التبديد (Diffusion Transformers - DiTs) من منظور التخصص المهني. يقدّم هذا البحث إطار عمل جديد يُسمّى Face-MoGLE، يتميز بـ: (1) نمذجة مساحات مُفصَّلة معنويًا من خلال تحليل مساحي مُشَرَّط بوضعية قناع (mask-conditioned space factorization)، ما يتيح التلاعب الدقيق بالسمات؛ (2) مزيج من خبراء عالميين ومحليين، يُمكّن من التقاط البنية الشاملة والمعاني على مستوى المناطق، مما يعزز التحكم الدقيق؛ (3) شبكة توجيه ديناميكية تُنتج معاملات تعتمد على الزمن وتتطور حسب خطوات التبديد والمواقع المكانية. يقدّم Face-MoGLE حلًا قويًا ومرنًا لإنشاء وجوه عالية الجودة قابلة للتحكم، ولديه إمكانات كبيرة في مجالات النمذجة التوليدية والتطبيقات الأمنية. أظهرت التجارب الواسعة فعالية النموذج في بيئات إنشاء الوجه متعددة النماذج (multimodal) وحيدة النموذج (monomodal)، كما أثبت قدرته القوية على التعميم الصفر (zero-shot). يمكن الاطلاع على صفحة المشروع من خلال الرابط التالي: https://github.com/XavierJiezou/Face-MoGLE.
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.